Résumé | à l'intérieur du paradigme de la fouille visuelle des données, nous examinons deux ensembles de données médicales (cancer du sein et cancer du clon) en faisant appel à la construction non supervisée d'espaces de réalité virtuelle au moyen de la programmation génétique et de l'optimisation classique (à des fins de comparaison). Les espaces visuels souhaités sont tels qu'une approche de programmation génétique modifiée a été proposée afin d'obtenir des programmes représentant les fonctions vectorielles. Cette expansion donne des populations qui sont composées de forêts, au lieu de simples arbres d'expression. Aucun type particulier d'algorithme de programmation génétique n'est requis à cause du caractère générique de la stratégie adoptée dans la présente étude. Les résultats (espaces visuels) montrent que les relations entre les objets de données et leurs classes peuvent être évaluées dans tous les espaces obtenus, peu importe l'erreur de cartographie. En outre, les espaces obtenus au moyen de la programmation génétique ont entranné moins d'erreurs de cartographie qu'un optimiseur classique et ont produit des équations relativement simples. De plus, l'ensemble d'équations obtenues peut être analysé statistiquement du point de vue des attributs originaux afin de mieux comprendre la dérivation des nouvelles caractéristiques non linéaires qui sont construites. Ainsi, des cartographies explicites fournies par la programmation génétique peuvent être utilisées pour sélectionner et générer des caractéristiques dans la fouille des données lorsqu'il est question des fonctions scalaires ou vectorielles. |
---|