Qu'est ce que le Machine Learning ?

Comprendre les enjeux et sa définition simplement

Définition du Machine Learning :

Le machine learning est un sous-domaine de l’intelligence artificielle (IA) basé sur l’utilisation de données et d’algorithmes afin d’imiter la façon dont les humains apprennent, ce qui leur permet de s’auto-améliorer sans avoir été préalablement programmés par un informaticien.

Le Machine Learning ou apprentissage automatique désigne donc comme son nom l’indique : un ordinateur qui apprend à partir des données et s’améliore avec l’expérience ! Jusqu’à son invention, toutes les machines étaient à l’origine programmés pour une tâche précise et ne pouvaient s’en écarter : par exemple : faire des multiplications etc…


Si vous voulez approfondir la notion de machine Learning nous vous renvoyons vers la définition d’IBM un maitre en la matière !

Introduction au Machine Learning

Si l’on voulait apprendre à un ordinateur à reconnaître des images de chat grâce à une méthode de programmation traditionnelle, ce serait impossible en raison du nombre de variables nécessaires. C’est là qu’est apparu l’apprentissage automatique ou machine learning.

Le machine Learning vous l’avez compris se sert d’algorithmes pour déceler, à l’intérieur des données qu’elle traite, des modèles de données lui permettant de réaliser des prédictions futures.

 

Ces corrélations qu’elle identifie dans de grandes bases de données sont de plus en plus précises au fur et à mesure qu’elle traite et accumule des données, la rendant ainsi plus performante (c’est-à-dire plus efficace à prévoir), d’où l’analogie avec l’apprentissage humain qui s’améliore en répétant une expérience.

 

Pour identifier ces modèles prédictifs, les algorithmes utilisent des méthodes statistiques issus des mathématiques pour classifier et regrouper les données en modèles.

Un des points importants est que pour favoriser cette apprentissage, elles ont besoin d’une quantité folle de données : c’est ce qu’on appelle le Big Data !

 

Et quand on parle de quantité de données, ce sont des millions voire des milliards de données que des outils plus simples ne pourraient pas traiter. Aujourd’hui la quantité de données est telle, qu’il est impossible pour un humain ou de simples ordinateurs de pouvoir les traiter, d’où l’utilisation du machine learning ayant pour but de réaliser des scénarios prédictifs afin d’aider l’Homme à la prise de décision.

Différence entre la définition du Machine learning et Deep Learning

Vous trouverez beaucoup de ressources sur internet qui confondent et mélangent les différentes notions. Nous allons vous aider à y voir plus clair !

La  première chose à savoir est que la plupart des Intelligences Artificielles que vous utilisez utilisent le Machine Learning. On peut citer comme exemple les recommandations d’achat sur Amazon, sur Youtube, Netflix, la reconnaissance d’image sur les moteurs de recherche etc…

Pour comprendre la différence entre ces deux domaines il faut savoir que l’apprentissage automatique n’est qu’un sous-ensemble de l’Intelligence artificielle.

On retrouve donc l’IA avec comme sous-ensemble le Machine Learning, le Deep-Learning et enfin les réseaux de neurones.

On a recours le plus souvent au machine learning pour classer des objets, détecter des modèles ayant des similitudes dans les données et éventuellement trouver des modèles de prédiction pour prendre des décisions.

Sous couches de l'intelligence artificielle

Différence fondamentale :

Le machine learning utilise une fonction du type f(x) = ax + b pour déterminer un modèle de prédiction alors que le deep learning utilise un réseau de neurones.

Fonctionnement de l’apprentissage automatique

Le but est de programmer une machine à trouver un modèle lui permettant de réaliser les futures tâches. C’est à dire programmer un modèle qui s’ajuste le mieux aux variables.

Pour trouver ce modèle, on va programmer un algorithme d’optimisation qui va déterminer une fonction f(x) qui minimisera la distance entre le modèle et les points (variables)

Le machine learning pour fonctionner fait appel à différents modèles, et chaque modèle est associé à une ou plusieurs algorithmes.

 

On retrouve comme modèle :

On retrouve comme algorithme d’optimisation :

Apprentissage supervisé:

Pour faire simple dans l’apprentissage supervisé, on aide la machine en lui indiquant la bonne réponse, et celle ci à force de répéter va pouvoir détecter les bonnes réponses parmi toutes les données qu’on lui a transmises.

On peut voir la machine comme une boite avec plein de boutons qui sont en réalité des curseurs, on lui présente une première image en lui indiquant la réponse ( Ex: un avion) puis on lui présente d’autres nouvelles images et on attend la réponse de la machine, si elle est correcte tant mieux si la réponse est incorrecte, un algorithme va ajuster les boutons pour obtenir la réponse désirée.

 

Après présentations de milliers ou de millions d’images, la machine a ajusté tous les curseurs pour pouvoir systématiquement indiquer la bonne réponse lorsqu’on lui présentera une image similaire.

 

Si l’on prend comme exemple les jeux d’échecs, on va lui apprendre les règles via une programmation informatique : Déplacement d’un pion, d’un cavalier etc…

Ensuite on va transmettre dans sa base de données un grand nombres de parties humaines qui ont été réellement jouées (des milliers de parties), on va définir une notation pour chaque coup avec une échelle comme 10 étant un bon coup et 1 un mauvais coup. A chaque coup l’IA choisira le plus pertinent.

 

Un autre exemple pourrait être celles d’images de cellules cancéreuses en lui précisant lesquelles révèlent un cancer. Au début elle ne saura pas différencier un grain de beauté d’une tache maligne puis au fur et à mesure, l’algorithme va s’auto-ajuster pour détecter la bonne réponse.

 

C’est donc grâce à des procédés issus des statistiques et des probabilités, que la machine est capable de faire un diagnostic avec un taux d’erreur de plus en plus faible.

Le Machine Learning nécessite un développement de départ très complexe ainsi que plusieurs ajustements humains avant d’être opérationnel.

Grâce à un algorithme, l’ordinateur va faire des erreurs puis recommencer et ainsi de suite jusque être capable de déterminer les similitudes entre les données vraies et les fausses et pouvoir les différencier, a force de répétition il sera à même de pouvoir prédire les bonnes réponse avec degré de précision de plus en plus élevé.

Si vous utilisez Netflix, son moteur de recommandation est basé sur ce modèle.

 

Plus vous lui indiquez quels sont les bons films et plus il sera à même de vous dévoiler les films ayant le plus de ressemblances. Vous l’avez compris il faudra du temps et beaucoup de données à ce système d’intelligence artificielle. C’est la même chose pour vos achats sur Amazon ou les grands sites e-commerce.

Shéma explicatif du machine learning

Pour entrer un peu dans les détails, le modèle qui va être réalisé par le Machine Learning a pour origine une programmation de certains paramètres intégrés à l’algorithme qui va permettre à l’IA de former à son tour des modèles pour son processus de prise de décision.

 

Ce dernier va ensuite ajuster automatiquement les paramètres du code source lorsqu’elles recevra de nouvelles valeurs. Ainsi si vous regardez que des vidéos humoristiques sur Youtube, l’algorithme de recommandation naturellement vous suggérera des vidéos humoristiques car le paramètre est basé sur les vidéos que vous regardez.

 

Mais si vous vous mettez à regarder de plus en plus de films d’horreur, il s’adaptera et changera les paramètres pour vous proposer des films d’horreur.

L'apprentissage non supervisé

Concernant le modèle d’apprentissage non supervisé on n’indique pas à la machine de bonnes ou de mauvaises données.

 

La machine se sert de données non étiquetées et non structurées et s’efforce d’identifier des modèles similaires à partir de données brutes. La machine va s’efforcer de catégoriser des ensembles de données jusqu’à pouvoir en extraire une tendance toute seule. Elle a donc besoin de beaucoup plus de données que l’apprentissage supervisé pour être efficace.

 

Elle est très utilisée dans la reconnaissance faciale ou d’image, on va lui montrer des millions d’images de lions, dans lesquels elle va cartographier des caractéristiques, puis quand vous allez lui présenter une image de lion au milieu de chats elle sera capable de l’identifier et le reconnaître. Pour ceux d’entre vous qui utilisent Google Analytics 4, le Machine Learning est basé sur un apprentissage non supervisé pour déceler des insights.

L'apprentissage semi supervisé

Dans ce modèle d’apprentissage on fournit à l’algorithme quelques données étiquetées dans un amas de données non étiquetées. On fait on aide la machine à détecter les bonnes réponses en lui donnant quelques exemples, ce qui a l’avantage de raccourcir sa durée d’apprentissage.

L'apprentissage par renforcement

Concernant le modèle d’apprentissage supervisé, on indique pas directement la bonne réponse comme c’est le cas pour l’apprentissage supervisé mais on la guide à l’aide d’un système de récompense.

Voilà j’éspère que cette definition du machine learning a pu vous aider à mieux comprendre son fonctionnement, je vous invite à vous rendre sur la page du deep learning

Découvrez d’autres articles similaires