Résumé | Cet article présente une réalisation parallèle d'une technique hybride d'exploration des données pour des processus hétérogènes multidimensionnels variant dans le temps, fondée sur une combinaison de techniques neuro-floues et d'algorithmes génétiques. Le but visé consiste à découvrir des motifs de dépendance dans les systèmes multidimensionnels généraux variant dans le temps, et à construire une représentation pertinente de la fonction qui exprime ces dépendances. Les motifs de dépendance sont représentés au moyen de modèles multidimensionnels non linéaires autorégressifs. Étant donné un ensemble de séries chronologiques, ces modèles établissent un lien entre les valeurs futures d'une série cible et les valeurs passées de toutes les séries de l'ensemble, y compris elle-même. L'espace des modèles est exploré au moyen d'un algorithme génétique, alors que l'approximation fonctionnelle est construite au moyen d'un réseau neuro-flou hétérogène basé sur les similarités. Cette approche permet le prototypage rapide d'interdépendances intéressantes, tout particulièrement dans le cas de processus multidimensionnels complexes mal connus. Cette méthode intègre un degré élevé de parallélisme à différents niveaux de granularité, qui peut être exploité dans la conception de réalisations distribuées, par exemple le calcul des équipes de travail dans un modèle maître-esclave. Dans cet article, une première réalisation au niveau de granularité le plus élevé est présentée. Les performances et la portabilité de cette réalisation ont été testées dans différents groupes de Beowulf, homogènes et hétérogènes, avec des résultats satisfaisants. Un exemple d'application à un problème connu de série chronologique est présenté. |
---|