Résumé | Cet article présente une approche d'optimisation multiobjectif pour résoudre le problème du calcul des espaces de réalité virtuelle pour la représentation visuelle de structures relationnelles (par exemple, des bases de données), de connaissances symboliques et d'autres entités, dans le contexte de l'exploration visuelle des données et de la découverte des connaissances. Des procédures basées sur le calcul évolutif sont examinées. En particulier, l'algorithme NSGA II est utilisé comme cadre d'un cas d'application de cette méthodologie, réduisant en même temps au minimum l'erreur de Sammon pour la mesure des dissimilarités et l'erreur de validation croisée moyenne pour un classificateur de motifs k nn. L'article illustre l'approche proposée par un exemple tiré des données génomiques sur le cancer (p. ex., le cancer du poumon) en construisant des espaces de réalité virtuelle résultant d'une optimisation multiobjectif. Des solutions sélectionnées le long de l'approximation du front de Pareto, sont utilisées comme des fonctions transformées non linéairement pour les nouveaux espaces, qui concilient simultanément la préservation de la structure de similarité (du point de vue de la reconnaissance non supervisée), d'une part et la séparabilité des classes (du point de vue de la reconnaissance supervisée des motifs), d'autre part. La possibilité d'engendrer un éventail de solutions entre ces deux objectifs importants constitue un avantage pour le processus de découverte des connaissances et de compréhension des données. La qualité de l'ensemble de solutions découvertes est supérieure à celle des solutions obtenues séparément, du point de vue de l'exploration visuelle des données. |
---|