Donnée

C’est la matière première de tout algorithme. Les données peuvent être de diverses natures (signaux, vidéos, séquences…) et plus ou moins structurées.

Tout élément numérisé et stocké sur un serveur peut être appréhendé comme une donnée : les mesures physiques (acoustiques, issues de capteurs comme des accéléromètres, etc.), le texte, les séquences d’ADN, les images, la vidéo, etc. Certaines données sont binaires comme les images, les sons ou les vidéos, numérisés grâce à des approximations (en découpant les images en pixels monochromes, chaque couleur étant une suite de 24 bits), les sons en une suite de nombres… Les données structurées proviennent de bases de données relationnelles ; les données semi-structurées comportent les CSV (données de tableaux structurées pour de l’analyse quantitative), les logs (traces laissées sur les serveurs), les XML et les JSON (deux formats de stockage de données hétérogènes très utiles dans les applications). Quant aux données non structurées, on y trouve les emails, les documents et les PDF.