Résumé | Dans de nombreux domaines, les objets de données sont décrits d'après un grand nombre d'attributs. La démarche relative à l'exploration de données en pipeline et introduite en [12] à l'aide de deux algorithmes de groupement, de pair avec des ensembles bruts et étendus par programmation génétique, fait l'objet d'une étude dans le but d'y découvrir d'importants sous-ensembles d'attributs dans les données hautement dimensionnelles. La possibilité que ces attributs soient classés est décrite tant sur le plan de la collecte de règles que de fonctions analytiques tirées de la programmation génétique (programmation des expressions génétiques). Les algorithmes de tête et de moyenne K servent de procédures visant à simplifier les ensembles d'attributs des systèmes d'information présentés plus tard en algorithmes d'ensembles bruts. Des techniques d'exploration visuelle des données, y compris la réalité virtuelle, ont été utilisées pour l'inspection des résultats. Le processus d'exploration de données est défini selon des techniques grande capacité de l'informatique répartie. Cette démarche a été appliquée aux données relatives aux expressions génétiques du cancer du sein, ce qui a conduit à des sous-ensembles de gènes comportant un taux de discrimination élevé concernant les classes décisionnelles. |
---|