Modèle (IA)


Un modèle d’IA est un algorithme, dont le fonctionnement est déterminé par un ensemble d’attributs, et qui est conçu pour opérer, selon les cas, différentes tâches, telles que la prédiction, la classification, l’inférence ou la génération. Par exemple, les modèles de réseaux de neurones profonds (deep neural networks) sont constitués de nœuds (les neurones), répartis selon des couches, et reliés entre eux par des connections qui ont des poids, qui sont ajustés durant la phase d’entraînement pour apprendre la distribution statistique des données d’entraînement. Concrètement, dans le cas d’un réseau de neurone simple, les attributs du modèle pourraient être : (i) le type et la taille de chaque couche (linéaire, convolutionnel, attention, etc) (ii) les poids attribués à chaque arrêtes (parfois aussi appelés « paramètres »), (iii) les fonctions d’activations présentes entre chaque couches, et possiblement (iv) d’autres opérations qui peuvent être situées au sein ou entre les couches.

Par exemple, quand on entraîne un réseau de neurone pour reconnaître des images, on lui fournit des exemples où les pixels de l’image sont associés à une annotation (ou « étiquette »). Le modèle ajuste alors ses paramètres, appelés « poids », pour apprendre à attribuer le bon label le plus souvent possible.