Résumé | Nous présentons ici un algorithme de similarité à arbre pondéré amélioré sémantiquement en vue de l'appariement des acheteurs et des vendeurs. Tout d'abord, nous enrichissons notre mesure antérieure globale (structurale) de la similarité sur des arbres de partonomie (produits) grâce à la sémantique taxonomique : les nœuds internes peuvent être étiquetés au moyen de classes dont l'ordre de subsomption partiel est représenté sous la forme d'un arbre de taxonomie de référence qui est utilisé pour le calcul de la similarité entre les classes. En particulier, on peut définir la similarité entre deux classes quelconques au moyen de la longueur pondérée du chemin le plus court qui les relie dans cette taxonomie. Afin de permettre d'établir des comparaisons de similarité entre des versions spécialisées de la taxonomie de référence, nous codons les arbres de sous taxonomie en arbres de partonomie de façon à permettre la réutilisation directe de notre algorithme de similarité partonomique et à autoriser une subsomption taxonomique pondérée (ou « floue »), sans travail additionnel. En second lieu, les nœuds feuilles peuvent être typés, et chaque type peut être associé à une mesure locale spécialisée de la similarité qui implémente la sémantique qui doit être appelée lors du calcul de la similarité de deux de ses instances quelconques. Nous illustrons la mesure de la similarité locale avec des types tirés du commerce électronique comme « Monnaie », « Adresse », « Date » et « Prix ». Ainsi, la mesure de la similarité des étiquettes des nœuds feuilles du type « Date » se traduit en diverses notations pour l'instance de la date dans une forme normale à partir de laquelle deux instances quelconques sont affectées linéairement à leur valeur de similarité. Enfin, les fonctions d'ajustement antérieures, qui empêchent la dégradation de la similarité dans un arbre d'une largeur et d'une profondeur arbitraires, sont améliorées par des fonctions plus régulières qui compensent de façon uniforme les valeurs de similarité intermédiaires. |
---|