Résumé | La reconnaissance des analogies, celle des synonymes, celle des antonymes et celle des associations semblent constituer quatre tâches distinctes nécessitant chacune un algorithme de traitement des langues naturelles. On a déjà traité indépendamment ces quatre tâches à l'aide d'une grande variété d'algorithmes. Or, ces quatre classes sémantiques ne forment qu'un minuscule échantillon de l'ensemble de tous les phénomènes sémantiques pour lesquels il serait trop onéreux de créer pour chacun un algorithme ad hoc. Une approche unifiée est ainsi nécessaire. C'est pourquoi nous proposons de subsumer une vaste gamme de phénomènes sous la classe des analogies. Pour restreindre la portée de cet article, nous nous limiterons à la seule subsomption des synonymes, antonymes et associations. Nous présentons un algorithme d'apprentissage automatique dirigé, basé sur un corpus de paires de mots analogues classifiées et nous montrons qu'il peut résoudre des questions à choix multiples sur les analogies des tests américains sur le raisonnement SAT, des questions sur les synonymes des examens TOEFL d'anglais langue étrangère, des questions sur les synonymes et les antonymes tirées des examens d'anglais langue seconde et des questions sur les analogies et les similitudes des tests de psychologie cognitive. |
---|