Téléchargement | - Voir le manuscrit accepté : Statistical phrase-based post-editing (PDF, 271 Kio)
|
---|
Auteur | Rechercher : Simard, Michel1; Rechercher : Goutte, Cyril1; Rechercher : Isabelle, Pierre1 |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
|
---|
Format | Texte, Article |
---|
Conférence | Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2007), April 22-27, 2007, Rochester, New York, USA |
---|
Résumé | Nous proposons l'utilisation d'un système de traduction automatique statistique par segments pour une tâche de postédition : le système reçoit comme entrée une sortie de traduction automatique brute (provenant d'un système commercial de TA à base de règles) et produit un texte postédité dans la langue cible. Nous décrivons des expériences effectuées sur des données recueillies précisément dans un tel contexte : des couples de sorties de TA brutes et leurs versions postéditées manuellement. Dans notre évaluation, la sortie de notre système de postédition automatique est non seulement de meilleure qualité que la sortie de la TA à base de règles (en termes de scores BLEU et TER), mais également meilleure que la sortie d'un système de pointe de traduction automatique par segments, employé en mode traduction seule. Ces résultats indiquent que la postédition automatique constitue un moyen simple et efficace de combiner les technologies de TA à base de règles et de TA statistique. |
---|
Date de publication | 2007 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 49288 |
---|
Numéro NPARC | 5764892 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | aaa8c0b3-9d7a-4db3-9b1d-c3deab67d09f |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2020-08-12 |
---|