Téléchargement | - Voir le manuscrit accepté : A probabilistic model for fast and confident categorisation of textual documents (PDF, 325 Kio)
|
---|
Auteur | Rechercher : Goutte, Cyril1 |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
|
---|
Format | Texte, Chapitre de livre |
---|
Résumé | We describe the National Research Council's (NRC) entry in the Anomaly Detection/Text Mining competition organized at the Text Mining Workshop 2007. This entry relies on a straightforward implementation of a probabilistic categorizer described earlier [GGPC02]. This categorizer is adapted to handle multiple labeling and a piecewise-linear confidence estimation layer is added to provide an estimate of the labeling confidence. This technique achieves a score of 1.689 on the test data. This model has potentially useful features and extensions such as the use of a category-specific decision layer or the extraction of descriptive category keywords from the probabilistic profile. |
---|
Date de publication | 2008 |
---|
Maison d’édition | Springer |
---|
Emplacement | Oxford |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 49829 |
---|
Numéro NPARC | 5764844 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | 05e3038a-f734-4b14-bcc4-d90f41df31e8 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2024-02-05 |
---|