Débutant
8 min14 vues

Les Fondations du Machine Learning

Découvrez les fondamentaux du Machine Learning : régression linéaire, classification KNN, clustering K-Means et les bonnes pratiques pour évaluer vos modèles.

1 / 3

Introduction et Régression : Prédire des Valeurs

Le Machine Learning (ML) n'est pas de la magie, c'est des mathématiques appliquées. Dans cette section, nous allons comprendre comment une machine "apprend" à prédire un chiffre (par exemple le prix d'un appartement).

Le Concept de l'Apprentissage Supervisé

Imaginez que vous apprenez à un enfant à reconnaître des fruits. Vous lui montrez une pomme et dites "Pomme". Vous lui montrez une banane et dites "Banane".

  • Données (X) : L'image du fruit.
  • Étiquette (y) : Le nom du fruit.
  • But : Quand l'enfant voit un nouveau fruit sans étiquette, il devine le nom.

C'est l'essence de l'apprentissage supervisé : apprendre une fonction qui mappe X vers y.

La Régression Linéaire

C'est l'algorithme le plus simple pour prédire une valeur continue. Il cherche à tracer la "meilleure droite" qui passe à travers vos données.

Intuition : Si un appartement de 20m² coûte 100k€ et un de 40m² coûte 200k€, la régression linéaire devinera qu'un 30m² coûte 150k€.

Voici comment le processus fonctionne :

Micro-Exercice : Votre Première Prédiction

Nous allons utiliser scikit-learn, la bibliothèque standard en Python.

Objectif : Prédire le salaire en fonction des années d'expérience.

import numpy as np
from sklearn.linear_model import LinearRegression

# 1. Données (X=Années, y=Salaire)
X = np.array([[1], [2], [3], [4]])
y = np.array([25000, 35000, 45000, 55000])

# 2. Création et entraînement du modèle
model = LinearRegression()
model.fit(X, y)

# 3. Prédiction pour 5 ans d'expérience
prediction = model.predict([[5]])

print(f"Salaire prédit pour 5 ans : {prediction[0]:.0f}€")

Si le code affiche environ 65000€, bravo ! Votre modèle a compris la relation linéaire entre années d'expérience et salaire.

Continuer à apprendre