Téléchargement | - Voir le manuscrit accepté : Semantic Similarity for Detecting Recognition Errors in Automatic Speech Transcripts (PDF, 299 Kio)
|
---|
Auteur | Rechercher : Inkpen, D.; Rechercher : Désilets, Alain |
---|
Format | Texte, Article |
---|
Conférence | Conference on Empirical Methods in Natural Language Processing (EMNLP 2005), October 6-8, 2005, Vancouver, British Columbia, Canada |
---|
Résumé | L'exploration d'importants volumes de texte parlé peut constituer pour l'utilisateur un véritable défi. On peut simplifier ce problème en permettant à l'utilisateur de se faire une idée d'un document audio parlé en en survolant une transcription générée grâce à la reconnaissance automatique de la parole. Malheureusement, ces transcriptions comportent en général de nombreuses erreurs de reconnaissance, qui constituent des sources de distraction et qui rendent plus difficile de réaliser une synthèse de l'essentiel du document. Dans cet article, nous présentons une méthode qui détecte les erreurs de reconnaissance en repérant les mots qui constituent des aberrations sémantiques par rapport aux autres mots qui figurent dans la transcription. Nous décrivons plusieurs variantes de cette méthode. Nous examinons tout un ensemble de mesures d'évaluation et démontrons qu'il est possible de réduire de façon significative le nombre d'erreurs dans les mots du contenu, avec cependant l'inconvénient de perdre un certain nombre de mots ayant un contenu intéressant. |
---|
Date de publication | 2005 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 48278 |
---|
Numéro NPARC | 5765538 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | 9a85aa3d-1412-49f9-a03e-af0ea3c260f9 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2020-10-09 |
---|