Qu’est-ce que le RLHF (RL from Human Feedback) ?

Le RLHF (Reinforcement Learning from human feedback) est une approche d’apprentissage par renforcement qui utilise les commentaires et les évaluations des humains pour guider l’apprentissage d’un modèle d’intelligence artificielle. Contrairement…

GPT-4

Tout ce qu’il faut savoir sur GPT-4

En mars 2023, lors d’une présentation live devenue culte menée par Greg Brockman, OpenAI dévoilait GPT-4. À l’époque, cette annonce avait mis en émoi la communauté tech, promettant des applications…

gradient boosting, xgboost

Introduction au gradient boosting

Le Gradient Boosting est aujourd’hui l’une des techniques les plus performantes pour traiter des données structurées, popularisée par des librairies comme XGBoost. Pourtant, beaucoup l’utilisent encore comme une « boîte noire »,…