Télécharger | - Voir le manuscrit accepté : Keyphrase Extraction: Enhancing Lists (PDF, 231 Ko)
|
---|
Auteur | Rechercher : Barrière, Caroline; Rechercher : Jarmasz, Mario |
---|
Format | Texte, Article |
---|
Conférence | Computational Linguistic in the North-East (CLINE'2004), August 30, 2004, Montréal, Québec, Canada |
---|
Sujet | extraction des points essentiels; regroupement; similitude sur le plan sémantique; linguistique du corpus; évaluation des points essentiels |
---|
Résumé | Le présent document propose quelques améliorations modestes à Extractor, un système de pointe permettant d'extraire des points essentiels, et ce à l'aide d'un corpus dimensionné en téra-octets qui évalue le caractère informatif des points essentiels et leur similitude sur le plan sémantique. Nous présentons deux techniques d'amélioration de l'organisation et d'élimination des valeurs aberrantes dans les listes de points essentiels. La première constitue un simple ordonnancement selon le nombre d'occurrences des points dans le corpus. La deuxième permet de regrouper les points selon leur similitude sur le plan sémantique. Nous discutons des questions que soulève l'évaluation. Nous présentons une technique novatrice de comparaison des points essentiels extraits avec un exemple idéal dépendant de la similitude sur le plan sémantique plutôt que sur la mise en concordance de chaînes ou encore sur une évaluation à laquelle participe le jugement de l'être humain. |
---|
Date de publication | 2004 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 48079 |
---|
Numéro NPARC | 5765134 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | bbdcb1d3-d36b-4f4f-9f56-2a613f0f4310 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2021-01-05 |
---|