← Retour au cours
▶ Aperçu gratuit · Leçon offerte

Chapitre 1 — Setup et bases Python 🐍

⏱ 40 min · 🎬 Video · 🏆 20 XP
🎬
Vidéo en production
Notre équipe pédagogique tourne actuellement cette leçon avec un·e formateur·rice expert·e. Le contenu textuel ci-dessous est complet et utilisable dès maintenant.

🐍 Bienvenue dans Python pour la Data

Python est devenu le langage n°1 de la data science grâce à son écosystème (pandas, numpy, scikit-learn, PyTorch). Dans ce chapitre, vous installez votre environnement et révisez les bases du langage.

📥 Installation Python 3.12

Téléchargez la dernière version sur python.org/downloads. Sur Windows, cochez « Add Python to PATH » lors de l'installation. Sur Mac/Linux, utilisez Homebrew (brew install python@3.12) ou apt (sudo apt install python3.12).

💡 Astuce : Vérifiez l'installation avec python --version et pip --version. Si plusieurs versions cohabitent, utilisez python3.12.

🧪 Environnements virtuels : conda vs venv vs uv

  • venv (natif Python) : python -m venv .venv && source .venv/bin/activate
  • conda (Anaconda/Miniconda) : idéal pour la data science, gère aussi les libs C/Fortran
  • uv (nouveau, ultra-rapide) : uv venv && uv pip install pandas — 10x plus vite que pip

💻 IDE recommandés

  • VS Code + extensions Python, Pylance, Jupyter — gratuit, polyvalent
  • Cursor — fork VS Code avec IA intégrée, parfait pour la data exploratoire
  • JupyterLab — interface notebook locale, idéale pour EDA
  • Google Colab — notebooks gratuits dans le cloud avec GPU 🚀

📦 Installer les libs data essentielles

pip install pandas numpy matplotlib seaborn scikit-learn jupyter
# ou avec uv (recommandé en 2026)
uv pip install pandas numpy matplotlib seaborn scikit-learn jupyter

📓 Notebook .ipynb vs script .py

  • .ipynb : cellules exécutables, sortie inline (graphiques, tableaux), parfait pour explorer
  • .py : production, scripts ETL, API, modules réutilisables

🔤 Types primitifs Python

# Types de base
age = 25                    # int
prix = 19.99                # float
nom = 'Awa'                # str
actif = True                # bool

# Collections
liste = [1, 2, 3]           # list (mutable, ordonnée)
tup = (1, 2, 3)             # tuple (immutable)
ens = {1, 2, 3}             # set (unique, non ordonné)
dico = {'nom': 'Awa', 'age': 25}  # dict (clé/valeur)

🔁 Boucles, conditions, fonctions

# Conditions
note = 15
if note >= 16:
    print('Très bien')
elif note >= 10:
    print('Passable')
else:
    print('Échec')

# Boucles
for i in range(5):
    print(i)

# Fonctions
def moyenne(notes):
    return sum(notes) / len(notes)

print(moyenne([12, 14, 16]))  # 14.0

📥 Imports et modules

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

# Premier exemple : lire un CSV
df = pd.read_csv('ventes_cameroun.csv')
print(df.head())
📊 À retenir : Maîtriser Python prend 2 semaines, maîtriser pandas + scikit-learn prend 2 mois. Investissement rentable garanti dans le marché data.

Continuez le parcours 🚀

Inscrivez-vous pour accéder aux 4 autres leçons + le quiz final.

Créer mon compte