Résumé | Cet article présente un algorithme d'apprentissage non dirigée pouvant servir à classifier les comptes rendus et critiques en deux catégories : à conseiller ou à déconseiller. Dans un compte rendu ou une critique, c'est l'orientation sémantique moyenne des syntagmes renfermant des adjectifs et des adverbes qui permet de les classifier. On juge qu'un syntagme possède une orientation sémantique positive lorsqu'il comprend des associations positives (p. ex., "subtiles nuances" et une orientation sémantique négative quand les associations sont négatives (p. ex., "très cavalier"). Pour évaluer l'orientation sémantique d'un syntagme, on mesure la transinformation entre un syntagme donnée et le mot "excellent", dont on soustrait la transinformation entre ce syntagme et le mot "médiocre". Un compte rendu est classifié dans la catégorie à conseiller si l'orientation sémantique moyenne des syntagmes qui le composent est positive. Le taux d'exactitude moyen de l'algorithme se situe à 74 % pour un échantillon de 410 comptes rendus ou critiques tirés de Epinions et portant sur quatre domaines (les automobiles, les banques, les films et les destinations touristiques). Le taux d'exactitude oscille entre 84 % pour les comptes rendus sur les automobiles et 66 % pour les critiques de film. |
---|