3 livres de Machine Learning pour un confinement réussi

Mes lectures de l’été

Les éditions ENI m’ont gentiment envoyé 3 ouvrages pour apprendre la data science et le machine learning, je vous en parle dans cet article.

Mes lectures de l'été

On n’a pas encore de référence absolue en français pour l’apprentissage du machine learning/deep learning mais ces 3 livres sont assez intéressants et peuvent constituer d’excellentes portes d’entrées dans le monde de la data science.

Data scientist et langage R

J’ai plutôt pour habitude d’utiliser Python pour mes projets de data science. C’est le langage que je connais le mieux, on a un grand nombre de packages aussi robustes les uns que les autres et des tutoriels et des cours très complets et bien écrits. Malgré ça je reste convaincu que la connaissance du langage R doit rester une de vos priorités.

D’abord, R est un langage conçu spécialement pour les statistiques et sera donc toujours plus intéressant que n’importe quelle autre langage lorsque vous devez faire des stats. Pour les mêmes raisons c’est un langage qui va vous permettre de manipuler des datasets plus facilement.

R est aussi un langage très demandé par les recruteurs dans les grandes entreprises et bénéficie, tout comme Python, d’une large communauté qui oeuvre pour améliorer les outils et les packages disponibles. Dans tous les cas, apprendre R vous permettra d’ajouter un outil à votre boîte à outils.

J’espère vous avoir convaincu d’apprendre R!

Si c’est le cas, le livre Data Scientist et langage R, écrit par Henri et Eva Laude pourrait vous être d’une grande aide. Dans ce livre les auteurs ont voulu proposer un supportde formation complet et détaillé aux data science avec le langage R. Le livre couvre à la fois toutes les méthodes de bases de data science et les bases du langage R, il vous montre ensuite comment appliquer R pour exploiter ces méthodes.

Le livre est assez gros et je vous conseille donc de prendre la version numérique qui sera beaucoup plus simple à consulter. Vous pouvez vous le procurer directement sur le site de l’éditeur.

Mes lectures de l'été

Intelligence artificielle vulgarisée

Le second livre, écrit par Aurélien Vannieuwenhuyze, vous aidera à comprendre les concepts fondamentaux en machine learning et deep learning de façon plus pratique et en s’attardant un peu moins sur la théorie et les concepts mathématiques sous-jacents. Ce livre peut être un excellent moyen de se plonger au coeur du monde de la data science.

Ce livre convient très bien aux débutants ou à ceux qui veulent revoir leurs classiques.

Mes lectures de l'été

Python pour la data science

Le dernier livre, écrit par Amandine Velt, va vous permettre de progresser en data science avec Python, à travers des quiz, des exemples de projets concrets et en jouant avec des datasets variés.

Il ne sera pas question de machine learning ou d’entraînements de modèles dans cet ouvrage, par contre vous pourrez parcourir toutes les compétences nécessaires pour faire du preprocessing de data : slicing de matrices avec NumPy, manipulation de tableaux de données avec Pandas et visualisation avec Matplotlib et Seaborn.

On a souvent tendance à croire que le machine learning se limite à l’entraînement de modèles, sauf que ce travail ne représente qu’environ 10% du travail d’un data scientist. Une grande partie du travail repose sur du nettoyage de données, un peu de statistiques et de la visualisation. Ce livre vous aidera à developper les techniques essentielles de manipulation de datasets.

Mes lectures de l'été