Spoken document retrieval based on approximated sequence alignment
Visualitza/Obre
Estadístiques de LA Referencia / Recolecta
Inclou dades d'ús des de 2022
Cita com:
hdl:2117/17223
Tipus de documentText en actes de congrés
Data publicació2008
Condicions d'accésAccés obert
Tots els drets reservats. Aquesta obra està protegida pels drets de propietat intel·lectual i
industrial corresponents. Sense perjudici de les exempcions legals existents, queda prohibida la seva
reproducció, distribució, comunicació pública o transformació sense l'autorització del titular dels drets
Abstract
This paper presents a new approach to spoken document information retrieval for spontaneous speech corpora. The classical approach to this problem is the use of an automatic speech recognizer (ASR) combined with standard information retrieval techniques. However, ASRs tend to produce transcripts of spontaneous speech with significant word error rate, which is a drawback for standard retrieval techniques. To overcome such a limitation, our method is based on an approximated sequence alignment algorithm to search “sounds like” sequences. Our approach does not depend on extra information from the ASR and outperforms up to 7 points the precision of state-of-the-art techniques in our experiments.
CitacióComas, P.R.; Turmo, J. Spoken document retrieval based on approximated sequence alignment. A: International Conference on Text, Speech and Dialogue. "Proceedings of the 11th International Conference on Texts, Speech and Dialogue". Brno: 2008, p. 1-8.
Versió de l'editorhttp://cataleg.upc.edu/record=b1274888~S1*cat
Fitxers | Descripció | Mida | Format | Visualitza |
---|---|---|---|---|
comas08a.pdf | 79,07Kb | Visualitza/Obre |