Autre titre | Relevant attribute discovery in high dimensional data based on rough sets applications to Leukemia gene expressions |
---|
Téléchargement | - Voir le manuscrit accepté : Relevant attribute discovery in high dimensional data based on rough sets and unsupervised classification: application to Leukemia gene expressions (PDF, 305 Kio)
|
---|
DOI | Trouver le DOI : https://doi.org/10.1007/11548706_38 |
---|
Auteur | Rechercher : Valdés, Julio J.1; Rechercher : Barton, Alan J.1 |
---|
Affiliation | - Conseil national de recherches du Canada. Institut de technologie de l'information du CNRC
|
---|
Format | Texte, Chapitre de livre |
---|
Conférence | The Tenth International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing (RSFDGrC 2005), August 31 - September 3, 2005, Regina, Saskatchewan, Canada |
---|
Sujet | acute myeloid leukemia; acute lymphoblastic leukemia; high dimensional data; decision attribute; remote host |
---|
Résumé | Nous examinons une approche pipeline faisant appel à deux algorithmes de grappage en association avec des ensembles d'approximation afin de découvrir des combinaisons importantes d'attributs dans des données à un grand nombre de dimensions. Dans de nombreux domaines, les objets de données sont décrits en termes d'un grand nombre de caractéristiques, comme par exemple dans les expériences sur l'expression des gènes, ou dans les échantillons caractérisés par des informations spectrales. Un algorithme d'élection d'un chef et plusieurs algorithmes fondés sur la moyenne k sont utilisés pour accélérer la réduction de l'ensemble des attributs des systèmes d'information présentés aux algorithmes basés sur des ensembles d'approximation. Les sous matrices de données décrites en termes de ces caractéristiques sont ensuite discrétisées par rapport à l'attribut décisionnel, selon différentes méthodes basées sur les ensembles d'approximation. À partir de là, on extrait les ensembles réduits et leurs règles dérivées, qui sont appliquées pour tester les données afin d'évaluer l'exactitude de la classification résultante. Nous avons exploré cette méthode (en utilisant les données d'expression du gène de la leucémie) dans une série d'expériences, dans un environnement de traitement distribué à haut débit. Nous avons ainsi sélectionné des sous ensembles de gènes possédant un pouvoir de discrimination élevé. Nous avons obtenu de bons résultats, sans prétraitement des données. |
---|
Date de publication | 2005-09 |
---|
Maison d’édition | Springer |
---|
Dans | |
---|
Série | |
---|
Langue | anglais |
---|
Publications évaluées par des pairs | Oui |
---|
Numéro du CNRC | NRCC 48122 |
---|
Numéro NPARC | 8913287 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | ed378d76-e02c-49d9-9c9a-4b18c393e1d6 |
---|
Enregistrement créé | 2009-04-22 |
---|
Enregistrement modifié | 2024-02-06 |
---|