Chapitre 1 — Setup et bases Python 🐍 — Python pour la Data Science

🐍 Bienvenue dans Python pour la Data

Python est devenu le langage n°1 de la data science grâce à son écosystème (pandas, numpy, scikit-learn, PyTorch). Dans ce chapitre, vous installez votre environnement et révisez les bases du langage.

📥 Installation Python 3.12

Téléchargez la dernière version sur python.org/downloads. Sur Windows, cochez « Add Python to PATH » lors de l'installation. Sur Mac/Linux, utilisez Homebrew (brew install python@3.12) ou apt (sudo apt install python3.12).

💡 Astuce : Vérifiez l'installation avec python --version et pip --version. Si plusieurs versions cohabitent, utilisez python3.12.

🧪 Environnements virtuels : conda vs venv vs uv

venv (natif Python) : python -m venv .venv && source .venv/bin/activate
conda (Anaconda/Miniconda) : idéal pour la data science, gère aussi les libs C/Fortran
uv (nouveau, ultra-rapide) : uv venv && uv pip install pandas — 10x plus vite que pip

💻 IDE recommandés

VS Code + extensions Python, Pylance, Jupyter — gratuit, polyvalent
Cursor — fork VS Code avec IA intégrée, parfait pour la data exploratoire
JupyterLab — interface notebook locale, idéale pour EDA
Google Colab — notebooks gratuits dans le cloud avec GPU 🚀

📦 Installer les libs data essentielles

pip install pandas numpy matplotlib seaborn scikit-learn jupyter
# ou avec uv (recommandé en 2026)
uv pip install pandas numpy matplotlib seaborn scikit-learn jupyter

📓 Notebook .ipynb vs script .py

.ipynb : cellules exécutables, sortie inline (graphiques, tableaux), parfait pour explorer
.py : production, scripts ETL, API, modules réutilisables

🔤 Types primitifs Python

# Types de base
age = 25                    # int
prix = 19.99                # float
nom = 'Awa'                # str
actif = True                # bool

# Collections
liste = [1, 2, 3]           # list (mutable, ordonnée)
tup = (1, 2, 3)             # tuple (immutable)
ens = {1, 2, 3}             # set (unique, non ordonné)
dico = {'nom': 'Awa', 'age': 25}  # dict (clé/valeur)

🔁 Boucles, conditions, fonctions

# Conditions
note = 15
if note >= 16:
    print('Très bien')
elif note >= 10:
    print('Passable')
else:
    print('Échec')

# Boucles
for i in range(5):
    print(i)

# Fonctions
def moyenne(notes):
    return sum(notes) / len(notes)

print(moyenne([12, 14, 16]))  # 14.0

📥 Imports et modules

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split

# Premier exemple : lire un CSV
df = pd.read_csv('ventes_cameroun.csv')
print(df.head())

📊 À retenir : Maîtriser Python prend 2 semaines, maîtriser pandas + scikit-learn prend 2 mois. Investissement rentable garanti dans le marché data.

Continuez le parcours 🚀

La leçon suivante est également gratuite. Découvrez-la sans inscription.

Leçon 2 — Continuer →

📚 Programme du cours

1

Chapitre 1 — Setup et bases Python 🐍
2

Chapitre 2 — Pandas pour la data 📊
🔒

Chapitre 3 — Visualisation et exploration 🔬
🔒

Chapitre 4 — Machine Learning avec scikit-learn 🤖
🔒

Chapitre 5 — Projet réel : prédiction loyers Yaoundé 🏙️
🔒

Chapitre 6 — NumPy et Pandas — fondamentaux
🔒

Chapitre 7 — Matplotlib et visualisation
🔒

Chapitre 8 — Machine Learning avec scikit-learn
🔒

Python pour la Data Science - Examen Final (Niveau Intermédiaire) - Référentiel ITAG

🎯 Simulation Examen

🌍 AWS Solutions Architect Associate (SAA-C03) — Examen blanc officiel

Amazon Web Services (Pearson VUE)

📝 300 Q · ⏱ 130 min ·🔒 Premium

▶ Démarrer l'examen blanc 📋 Voir tout le catalogue →

Chapitre 1 — Setup et bases Python 🐍