Réseaux de neurones convolutifs

Réseaux de neurones convolutifs

Les réseaux convolutifs sont une forme particulière de réseau neuronal multicouches dont l’architecture des connexions est inspirée de celle du cortex visuel des mammifères.

Leur conception suit la découverte de mécanismes visuels dans les organismes vivants. Ces réseaux de neurones artificiels (aussi baptisés réseau de neurones à convolution, ou CNN) sont capables de catégoriser les informations des plus simples aux plus complexes. Ils consistent en un empilage multicouche de neurones, des fonctions mathématiques à plusieurs paramètres ajustables, qui pré-traitent de petites quantités d’informations. Les réseaux convolutifs sont caractérisé par leurs premières couches convolutionelles (généralement une à trois). Une couche convolutive, est basée comme son nom l’indique sur le principe mathématique de convolution, et cherche à repérer la présence d’un motif (dans un signal ou dans une image par exemple).

Pour une image, la première couche convolutionelle peut détecter les contours des objets (par exemple un cercle), la seconde couche convolutionelle peut combiner les contours en objets (par exemple une roue), et les couches suivantes (non nécessairement convolutionelles) peuvent utiliser ces informations pour distinguer une voiture d’une moto. Une phase d’apprentissage sur des objets connus permet de trouver les meilleurs paramètres en montrant par exemple à la machine des milliers d’images d’un chien, d’une voiture ou d’un sport… L’un des enjeux est de trouver des méthodes pour ajuster ces paramètres le plus rapidement et le plus efficacement possible. Les réseaux neuronaux convolutifs ont de nombreuses applications dans la reconnaissance d’images, de vidéos ou le traitement du langage naturel.