Téléchargement | - Voir le manuscrit accepté : Segment Choice Models: Feature-Rich Models for Global Distortion in Statistical Machine Translation (PDF, 261 Kio)
|
---|
Auteur | Rechercher : Kuhn, Roland; Rechercher : Yuen, D.; Rechercher : Simard, Michel; Rechercher : Paul, P.; Rechercher : Foster, George; Rechercher : Joanis, Eric; Rechercher : Johnson, John Howard |
---|
Format | Texte, Article |
---|
Conférence | Human Language Technology Conference: North American Chapter of the Association for Computational Linguistics Annual Meeting (HLT/NAACL 2006), June 5, 2006, New York City, New York, USA |
---|
Résumé | Le présent document présente une nouvelle approche à la distorsion (réagencement syntagmatique) en traduction automatique (TA) syntagmatique. La distorsion est modélisée comme une séquence établie à partir de choix durant la traduction. L'approche donne des modèles globaux de distorsion probabiliste orientable : ils donnent une probabilité à chaque réagencement syntagmatique possible. Ces modèles de « choix de segments » peuvent être orientés sur des paires de phrases « centrées par segments »; ils peuvent être appliqués au décodage ou à une nouvelle notation. L'approche donne une mesure appelée « perplexité de la distorsion » en vue d'une comparaison des modèles de choix de segments en différé aux données d'essai, ce qui ressemble à la perplexité dans le cas des modèles linguistiques. Un modèle de choix de segments fondé sur un schéma de décision est mis à l'essai dans la traduction du chinois à l'anglais et donne un meilleur résultat qu'une approche fondée sur une pénalité pour distorsion de référence au niveau de confiance (99 %). |
---|
Date de publication | 2006 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 48752 |
---|
Numéro NPARC | 5763206 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | d91d8d1e-2ad7-4710-9e57-1b902811e2a1 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2020-10-09 |
---|