Téléchargement | - Voir le manuscrit accepté : Adapting LDA Model to Discover Author-Topic Relations for Email Analysis (PDF, 358 Kio)
|
---|
DOI | Trouver le DOI : https://doi.org/10.1007/978-3-540-85836-2_32 |
---|
Auteur | Rechercher : Geng, Liqiang1; Rechercher : Wang, Hao2; Rechercher : Wang, Xin; Rechercher : Korba, Larry1 |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
- Conseil national de recherches du Canada. Institut des matériaux industriels du CNRC
|
---|
Format | Texte, Article |
---|
Conférence | 10th International Conference on Data Warehousing and Knowledge Discovery (DaWaK 2008), September 1-5, 2008, Turin, Italy |
---|
Résumé | L'analyse des relations entre l'auteur et le sujet dans un corpus de courriels constitue un sujet important pour l'analyse sociale des réseaux et l'exploration de texte. Le modèle auteur-sujet est une méthode statistique qui identifie les relations auteur-sujet. Toutefois, son processus d'inférence ne tient pas compte de l'information au niveau du document, c'est-à-dire que les cooccurrences des mots au sein d'un document ne sont pas prises en compte pour la dérivation des sujets. Ceci peut ne pas être approprié pour l'analyse des courriels. Nous nous proposons d'adapter le modèle d'allocation de Dirichlet latente (LDA) afin d'analyser un corpus de courriels. Cette méthode prend en compte les relations auteur-document et document-sujet. Nous utilisons la méthode auteur-sujet comme méthode de référence et nous proposons des mesures afin de comparer notre méthode avec cette méthode de référence. Nous avons effectué une analyse empirique basée sur les résultats d'expériences effectuées avec des jeux de données simulées et un jeu de données réelles de courriels d'Enron afin de démontrer que notre méthode offre un meilleur rendement que le modèle auteur-sujet. |
---|
Date de publication | 2008 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 50384 |
---|
Numéro NPARC | 5765577 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | 9a8cac81-1dcf-4a5a-b905-7b002bb891e8 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2020-08-12 |
---|