twitter facebook

Polynesia

La trilogie de Jean-Pierre Bonnefoy

Interprétation d’images

Retour à la page Autour de Polynesia

Patricia, la gagnante du jeu Polynesia 2011, qui est venue à Tahiti en mars 2012, et qui avait lu la 4ième couverture de mes livres, m’a demandé lors de son séjour : « Qu’est-ce que l’interprétation d’images ? ». Cette question m’a fait plaisir, car elle montrait la curiosité naturelle de Patricia, laquelle avait justement perçu qu’il devait y avoir là matière à réflexion.

Dans ce domaine non stabilisé car encore fortement immergé dans la recherche et qui de plus véhicule une dénomination pouvant peut-être apparaître mystérieuse, voire ambiguë en faisant penser à « l’interprétation des images de rêves » tant ma trilogie Polynesia est liée aux aspects oniriques, il m’apparaît comme nécessaire de préciser de quoi il est question.

Qu’est-ce que « l’image » dans l’interprétation d’images ? C’est toujours une image d’une scène réelle obtenue à l’aide d’une caméra, d’un appareil photo, …, une image qui se retrouve sous la forme numérique d’un fichier image dans la mémoire d’un ordinateur.

Qu’est-ce que « l’interprétation » dans l’interprétation d’images ? C’est toujours une analyse, une vérification, une identification, un contrôle, un tri,…, souvent développé dans un contexte industriel, enfin quelque chose conduisant à un choix, une décision, le tout effectué par un ou plusieurs algorithmes (les recettes) traitant ce fichier image et conduisant par exemple pour la scène réelle observée à :

  •  analyser les objets présents,
  •  vérifier la présence d’une forme particulière,
  •  identifier une situation donnée,
  •  trouver les bonnes informations,
  •  effectuer un tri parmi des objets,
  •  etc.

Bien entendu, cette interprétation d’images, et donc l’algorithme (généralement plus d’un) à mettre dans l’ordinateur est d’autant plus complexe que la scène réelle est elle-même complexe, en mouvement, changeante, perturbée, etc. Et le problème devient extrêmement ardu s’il faut effectuer une interprétation d’images en temps réel.

On comprend que la robotique, dans le contexte d’un robot autonome évoluant dans un univers réel comme le nôtre, a besoin d’une interprétation d’images puissante lui permettant de prendre les bonnes décisions pour se déplacer et agir sur son environnement. On comprend également, que le robot universel, capable d’évoluer dans n’importe laquelle des scènes possibles de notre monde et de se comporter sensiblement comme l’être humain n’est pas pour demain. Ce que les scientifiques savent faire en revanche – et c’est exactement ce que font les chercheurs informaticiens en interprétation d’images – c’est inventer de nouveaux processus qu’ils développent à l’aide d’algorithmes implantés dans des ordinateurs et qui permettent, pour un domaine restreint, d’interpréter une scène réelle afin de prendre une décision analogue à celle que prendrait un humain.

Si la robotique ne peut réellement pas se concevoir sans interprétation d’images, l’interprétation d’images peut exister sans robotique ! Dans le cadre de la dernière thèse (Pierre Loonis) que j’ai dirigée à la fin des années 1990, l’application pratique des travaux théoriques complexes effectués dans ce travail consistait à reconnaître et trier, en temps réel et de manière totalement automatique, des poissons issus d’un bateau de pêche et destinés à la vente, après le passage en criée. Les contraintes son claires : objets naturels complexes, environnement réel perturbé, interprétation rapide en temps réel. Les poissons passent très rapidement sous l’objectif d’une caméra reliée à un ordinateur programmé avec les algorithmes créés par le chercheur doctorant. Les poissons arrivent plus ou moins correctement disposés. Pour une même espèce de poissons, il n’existe pas deux individus identiques. Ils sont parfois mélangés avec des objets quelconques qui ne sont pas des poissons (algues, débris divers, …) et qui n’ont pas été éliminés par un tri mécanique grossier. Sans aucune intervention humaine les poissons doivent être identifiés, reconnus et triés par espèce (merlan, maquereau, lieu jaune, lieu noir, etc.) et cela aussi bien, sinon plus vite, que le ferait le pêcheur lui-même. Dans ce contexte industriel, il s’agit bien d’interpréter des images de scènes réelles pour prendre rapidement une décision : trouver l’espèce, la classe à laquelle le poisson appartient.

Dans d’autres domaines, on s’intéresse aux différents secteurs de la scène, par exemple pour pouvoir guider un mobile quelconque. Parfois on cherche à vérifier l’identité d’un individu, à trouver des objets particuliers, ou encore à déterminer la forme 3D de structures complexes en partie cachées, … L’interprétation d’images est présente dans de multiples domaines : médical, industriel, spatial, militaire, etc.. Elle appartient à de vastes secteurs scientifiques, largement ouverts, relevant aussi bien de la recherche théorique que de la recherche appliquée. Souvent liée à un autre domaine de l’informatique : l’intelligence artificielle. C’est ainsi qu’elle s’inspire parfois de notre propre comportement en s’intéressant à des techniques d’apprentissage sophistiquées développées sur ordinateurs. De ce fait, elle posera encore pendant longtemps des questions qui ne sont pas étrangères à celles concernant le fonctionnement de notre cerveau…

Mais l’ultime question demeure :
L’organe de la connaissance est-il connaissable ?