Résumé | Les techniques élaborées pour la reconnaissance d'objets dans des photographies sont souvent vouées à l'échec lorsqu'elles sont appliquées à la reconnaissance des mêmes objets dans un vidéo. Un exemple probant d'une telle situation se retrouve dans la reconnaissance faciale, où de nombreuses technologies sont déjà utilisées intensivement pour la vérification des passeports et où il n'y a pas de technologie capable d'identifier une personne sans équivoque à partir d'un vidéo de surveillance. Il en est ainsi parce que le vidéo fournit des images de qualité et de résolution beaucoup moindres que celles des photographies. En outre, les objets dans un vidéo sont normalement captés dans des environnements non contraints, souvent sous un mauvais éclairage, en mouvement et à une certaine distance. Cela rend la mémorisation d'un objet à partir d'une seule image vidéo peu fiable, et la reconnaissance basée sur une seule image vidéo, très difficile, voire impossible. Le présent rapport décrit une approche neuro-associative de la reconnaissance, qui peut à la fois apprendre à connaître et identifier un objet à partir de séquences vidéo à faible résolution et de mauvaise qualité. Cette approche est dérivée d'un modèle mathématique de la mémoire visuelle biologique, dans lequel l'apprentissage par projection axée sur la mise en corrélation est utilisé pour mémoriser un visage à partir d'une séquence vidéo, et une association basée sur un attracteur est effectuée pour reconnaître un visage sur plusieurs images vidéo. L'approche est démontrée au moyen d'une base de données faciales axée sur séquence vidéo et de l'annotation vidéo en temps réel de programmes de télévision. |
---|