au sommaire
La basilique Saint-Pierre de Rome, synthétisée en 3D. Crédit Université de Washington
Le site web Flickr de diffusiondiffusion et de partage de photographiesphotographies compte aujourd'hui plusieurs millions d'utilisateurs réguliers qui y ont déposé en deux ans plus d'un milliard de photos. Une recherche sur la clé "Notre Dame de Paris" renvoie plus de 80.000 fichiers, et les auteurs de cette étude estiment qu'il s'agit là de la plus importante et plus variée banque d'images au monde. Et il n'est pas le seul puisque d'autres acteurs, comme GoogleGoogle, proposent des services comparables.
Notre-Dame de Paris, synthétisée en 3D. Crédit Université de Washington
A l'International Conference on Computer Vision (ICCV 2007) qui s'est tenue du 14 au 20 octobre dernier à Rio de Janeiro (Brésil), Steve Seitz et son équipe de l'université de Washington, ont présenté une méthode permettant de modéliser en trois dimensions n'importe quel monument et même n'importe quelle structure de la Terre sur la base des photos librement disponibles sur ces sites.
"En gros, le principe de base est identique au fonctionnement de nos propres yeuxyeux, indique Michael Goesele, professeur au Technische Universität de Darmstadt (Allemagne), qui a participé à l'étude. Vous obtenez des vues multiples d'une scène depuis différents points, puis vous superposez ces images autour d'un point commun de façon à recréer l'objet en trois dimensions."
Un tri considérable à effectuer
Mais en pratique, d'autres difficultés surgissent. Ainsi, les documents collectés sur Internet ne sont que des instantanés de vacances et des images personnelles, dont la qualité s'éloigne sensiblement des photos de laboratoire. Mais cette lacune est compensée par le grand nombre de documents disponibles. Ainsi le groupe de mots "Statue of Liberty" introduit dans le moteur de recherche fournit environ 60.000 images parmi lesquelles l'ordinateur peut sélectionner celles qui conviendront le mieux à la reconstruction d'une représentation en 3D.
La Statue de la Liberté, synthétisée en 3D. Crédit Université de Washington
Les vues trop sombres, manquant de netteté ou partiellement occultées par un personnage sont d'abord éliminées. Photo Tourism, un outil spécialement développé à l'université de Washington, calcule alors pour chaque image l'endroit précis d'où elle a été prise et dresse une carte en relief de la scène.
En pratique, l'ordinateur a mis moins de deux heures pour récréer une reconstruction de la basilique Saint Pierre à Rome, sur la base de 151 photos prises par 50 personnes. L'élaboration en trois dimensions de la cathédrale Notre-Dame à Paris a exigé 206 images obtenues par 92 photographes. L'ensemble des opérations, depuis le tri des documents de départ à l'obtention du résultat final a été effectué automatiquement par le logiciel.
Image mosaïque brute à la base d'une synthèse de représentation en 3D.
Aurez-vous reconnu Notre-Dame de Paris ? Crédit Université de Washington
Bien que le résultat obtenu soit tout à fait correct, cette reconstruction à trois dimensions ne constitue qu'une première étape dans un projet de plus longue haleine, qui devrait aboutir à recréer l'aspect d'une ville entière au départ des photographies en ligne. Les applicationsapplications sont nombreuses, et on pense déjà à la représentation d'un lieu en images virtuelles sur les écrans de nos GPS comme cela commence à apparaître, cela en automatisant le procédé, donc en réduisant considérablement son coût.