Téléchargement | - Voir le manuscrit accepté : Multi-objective Evolutionary Optimization for Visual Data Mining with Virtual Reality Spaces: Application to Alzheimer Gene Expressions (PDF, 423 Kio)
|
---|
Auteur | Rechercher : Valdés, Julio; Rechercher : Barton, Alan |
---|
Format | Texte, Article |
---|
Conférence | Genetic and Evolutionary Computation Conference (GECCO) (a recombination of the 15th International Conference on Genetic Algorithms (ICGA) and the 11th Genetic Programming Conference (GP)), July 8-12, 2006, Seattle, Washington, USA |
---|
Sujet | fouille visuelle de données; espaces de réalité virtuelle; optimisation multi objectif; algorithmes génétiques; algorithme NSGA II; classification k nn; erreur de validation croisée; préservation de la structure de similarité; fonction non linéai; Erreur Sammon; maladie d'Alzheimer; fonction non linéai |
---|
Résumé | Cet article présente une approche d'optimisation multi objectif pour résoudre le problème du calcul des espaces de réalité virtuelle pour la représentation visuelle des structures relationnelles (par exemple des bases de données), des connaissances symboliques et d'autres entités, dans le contexte de la fouille visuelle des données et de la découverte des connaissances. Des procédures basées sur le calcul évolutif sont examinées. En particulier, l'algorithme NSGA II est utilisé comme cadre d'un cas d'application de cette méthode; de même pour minimiser l'erreur de Sammon pour la mesure des dissimilarités, et l'erreur de validation croisée moyenne pour un classificateur de motifs k nn. L'approche proposée est illustrée grâce à un exemple tiré de la génomique (en particulier de l'étude de la maladie d'Alzheimer) en construisant des espaces de réalité virtuelle résultant de l'optimisation multi objectif. Des solutions sélectionnées le long de l'approximation du front de Pareto sont utilisées comme des caractéristiques des nouveaux espaces, transformées non linéairement, qui permettent d'établir un compromis entre la préservation de la structure de similarité (du point de vue non supervisé) d'une part et la séparabilité des classes (du point de vue de la reconnaissance supervisée des formes ou des motifs), d'autre part. La possibilité d'engendrer un ensemble de solutions permettant de réaliser ces deux objectifs importants constitue un avantage pour la découverte des connaissances et le processus de compréhension des données. La qualité de l'ensemble des solutions découvertes est supérieure à celle des solutions obtenues séparément, du point de vue de la fouille visuelle des données. |
---|
Date de publication | 2006 |
---|
Dans | |
---|
Langue | anglais |
---|
Numéro du CNRC | NRCC 48506 |
---|
Numéro NPARC | 5765562 |
---|
Exporter la notice | Exporter en format RIS |
---|
Signaler une correction | Signaler une correction (s'ouvre dans un nouvel onglet) |
---|
Identificateur de l’enregistrement | b2353854-74ac-4e95-86cd-8daffbab4b91 |
---|
Enregistrement créé | 2009-03-29 |
---|
Enregistrement modifié | 2020-10-09 |
---|