Résumé | Cet article présente l'analyse relationnelle latente (LRA), méthode de mesure de la similarité sémantique. Ce type d'analyse permet de mesurer la similarité de relations sémantiques entre deux paires de mots. Lorsque deux paires présentent un haut degré de similarité relationnelle, on dit qu'elles sont analogues. Par exemple, la paire chat:miauler est analogue à la paire chien:japper. La science cognitive révèle que la similarité relationnelle est fondamentale pour un grand nombre de tâches cognitives et linguistiques (p. ex. de raisonnement analogique). Lorsqu'on applique le modèle de l'espace vectoriel (VSM) pour mesurer la similarité relationnelle, la similarité des deux paires est calculée par le cosinus de l'angle entre les vecteurs qui représentent les deux paires. Les éléments des vecteurs se fondent sur les fréquences de profils constitués manuellement à l'intérieur d'un vaste corpus. La méthode LRA complète le modèle VSM de trois façons : (1) des profils sont tirés automatiquement du corpus, (2) les données de fréquence sont filtrées par décomposition en valeurs singulières, et (3) des synonymes sont utilisés pour reformuler les paires de mots. Cet article décrit l'algorithme LRA et compare, sur le plan expérimental, l'application de la méthode LRA et du modèle VSM à deux tâches, soit la réponse à des questions à choix multiples de niveau universitaire portant sur les analogies entres des mots et la classification des relations sémantiques dans les expressions de type nom-déterminant. L'analyse relationnelle latente donne des résultats à la pointe du progrès, atteignant le rendement de l'humain pour les questions d'analogie et dépassant largement le rendement du modèle de l'espace vectoriel pour les deux tâches. |
---|