Résumé | Le caractère évaluatif d'un mot est appelé orientation sémantique. Une orientation sémantique positive indique une éloge (p. ex. « honnête » ou « intrépide ») et une orientation sémantique négative indique une critique (p. ex. « dérangeant » ou « superflu »). L'orientation sémantique varie dans les deux sens (positif ou négatif) ainsi qu'en intensité (faible à forte). Un système automatisé de mesure de l'orientation sémantique pourrait servir à la classification des textes, au filtrage des textes, au suivi des opinions exprimées dans des discussions en ligne, à l'analyse des réponses exprimées lors de sondages et aux discussions avec des systèmes automatisés (robots de discussion). Ce document présente une méthode d'inférence de l'orientation sémantique d'un mot à partir de son association statistique avec un ensemble de termes positifs et négatifs d'un paradigme. Deux instances de cette technique sont évaluées, selon deux mesures statistiques différentes d'association de mots : information mutuelle contextuelle (PMI) et analyse sémantique latente (LSA). La méthode est vérifiée de façon expérimentale à partir de 3 596 mots (adjectifs, adverbes, noms et verbes) auxquels une orientation positive (1 614 mots) ou négative (1 982 mots) a été attribuée manuellement. La méthode atteint une précision de 82,8 % aux essais complets, mais la précision dépasse 95 % lorsque l'algorithme peut s'abstenir de classer les mots à faible orientation. |
---|