Un des aspects qui freinent le développement du machine learning, est que le traitement des données non-structurés est encore très peu exploré. On collecte chaque jour des milliers de données…
Le dilemme Exploration-Exploitation pour l’apprentissage par renforcement
Dans notre société, il nous est souvent reproché de ne pas oser sortir des sentiers battus. Allant parfois jusqu’à parler de moutons de Panurge, il est mal vu de suivre…
Random Forest
La prédiction d’événements futurs a toujours passionné les hommes. Aujourd’hui je vous explique l’algorithme de prédiction par excellence : random forest. De nombreuses méthodes de prédictions ont vu le jour…
Tutoriel Kaggle : Machine Learning from disaster
Kaggle est une plateforme sur internet regroupant un certain nombre de compétitions dans le domaine de la data science. Les entreprises publient des données et un défi en lien avec…
Le filtrage collaboratif pour satisfaire vos clients
Dans le précédent article, nous avons parlé des systèmes de recommandations clients, notamment avec l’algorithme k-NN. Les données disponibles sur un client sont souvent difficiles à traiter. Dans le cas…
Algorithmes du plus proche voisin
On pourrait penser que les meilleurs algorithmes d’intelligence artificielle sont ceux qui peuvent traiter la plus grande quantité de données en très peu de temps. C’est un vrai…mais pas que….
Biais de sur-interprétation : qu’est-ce que l’overfitting ?
Une étude statistique faite de manière hâtive peut conduire à des conclusions douteuses. Les biais en IA sont un problème bien réel. L’overfitting est le plus courant. Sur le site…
Panorama de l’apprentissage supervisé
Le machine learning se divise principalement en deux catégories : l’apprentissage supervisé et l’apprentissage non supervisé. En apprentissage supervisé (supervised learning) un algorithme apprend à partir de données labellisées. Dans le…