Apprentissage supervisé

Ce cadre de machine learning part du fait que les données historiques (ou exemples) sont annotées.

Prenons le cas de la reconnaissance d’objets : un problème supervisé correspond au cas où le label « voiture » est bien associé, en base, à des photos de voitures, le label « chat » à des photos de chat, etc. L’algorithme apprend ainsi à partir de milliers ou de millions d’exemples étiquetés : il cherche la relation qui permet de relier les images aux labels. Après avoir classifié correctement les exemples, il peut ensuite généraliser ce classement à de nouvelles données : classifier correctement des images de voiture ou de chat qu’il n’a jamais vues durant la phase d’apprentissage. C’est ce qu’on appelle la capacité de généralisation. Dans un cadre business, on parle souvent d’analyse prédictive. Parmi les exemples d’applications, citons la classification d’email en spam ou non selon le contenu du message, son expéditeur, son sujet, le diagnostic médical selon les symptômes, etc.