Algorithmes

4 méthodes pour gérer les données manquantes en machine learning avec Pandas

Les données manquantes sont un des nombreux problèmes que vous êtes amenés à gérer lorsque vous travaillez sur des...

Avr 22 · 4 min lecture >

Comment gérer le déséquilibre des classes (imbalanced dataset) en machine learning ?

En machine learning il est très fréquent d’avoir à construire un modèle sur des données présentant un déséquilibre des...

Mar 8 · 5 min lecture >

Machine learning pour la classification automatique de musiques avec Python

Ilyes TALBI | Samir JEETO | Valentin DORE Mon attrait pour le machine learning vient du fait qu’il n’a...

Jan 9 · 22 min lecture >

Mes dernières lectures en data science

Les éditions Eyrolles m’ont gentiment envoyés plusieurs livres. J’ai profité du confinement et du fait que j’ai un peu...

Nov 8 · 1 min lecture >

Apprentissage par renforcement

Dans de précédents articles, nous avons parlé des méthodes d’apprentissages  supervisé et non supervisé. Aujourd’hui je vous présente une autre méthode...

Oct 3 · 5 min lecture >

Régression linéaire : fonctionnement et exemple avec Python

Le problème le plus simple et le plus ancien en machine learning est la régression linéaire. Après avoir expliquer...

Sep 21 · 3 min lecture >

NLP avec Python : analyse de sentiments sur Twitter

Dans le précédent tutoriel NLP nous avons introduit la notion d’encodage de texte, expliqué ce qu’était un pipeline NLP...

Sep 14 · 11 min lecture >

7 méthodes pour éviter l’overfitting

L’overfitting est un problème qui est souvent rencontrés en machine learning. Il survient lorsque notre modèle essaye de trop...

Sep 11 · 3 min lecture >

XGBoost vs Random Forest : prédire la gravité d’un accident de la route

Dans cet article on compare les algorithmes Random Forest et XGBoost, en travaillant sur un projet de prédictions. L’objectif...

Sep 6 · 11 min lecture >