Google a créé une base de données composées de vidéos YouTube pour entraîner une intelligence artificielle à identifier 80 gestes humains : se serrer la main, parler, courir, marcher... Pour rendre ses services plus efficaces, affirme l'entreprise.

au sommaire


    Grâce à ses services en ligne, Google dispose d'une massemasse de données enrichies gracieusement par ses utilisateurs dont l'entreprise se sert pour faire avancer ses travaux en intelligence artificielle (IA). Le géant californien vient d'annoncer la création d'une base de données constituée à partir de vidéos YouTube qui servira à entraîner des algorithmes à reconnaître les actions humaines.

    Nommée AVA, pour atomic visual actions, elle contient 57.600 séquences vidéo de trois secondes montrant une ou plusieurs personnes accomplir des gestes précis. Elles sont accompagnées d'un fichier contenant une description de ces gestes. L'image en tête de cet article montre des instantanés extraits de ces vidéos. C'est ainsi qu'un algorithme pourra apprendre à reconnaître une poignée de mains ou un baiser.

    Google veut perfectionner ses méthodes d’analyse prédictive

    AVA détaille 80 actions humaines parmi les plus courantes : être assis ou debout, courir, téléphoner, s'étreindre, trinquer, se brosser les dents, écrire, danser, fumer, etc. GoogleGoogle n'a pas puisé dans des vidéos d'amateurs, mais dans des films et des séries avec des acteurs professionnels. Dans l'article scientifique (arXiv) qui accompagne cette annonce, les experts de Google reconnaissent que ce type de contenu est un peu biaisé du fait de la mise en scène et de la dramatisation de certaines actions, mais ils assurent que cet outil est plus complet que ce qui existe dans ce domaine.

    Grâce à cette base de données, Google va pouvoir perfectionner ses méthodes d'analyse prédictive, que ce soit pour mieux cibler ses publicités ou repérer des contenus à modérer sur YouTubeYouTube. Mais l'article trace une perspective plus vaste qui est d'enseigner aux machines à « comprendre ce que les humains font, ce qu'ils pourraient faire et ce qu'ils cherchent à accomplir ».