← Retour au cours
▶ Aperçu gratuit · Leçon offerte

Chap 1 — Comprendre les LLMs (Large Language Models)

⏱ 40 min · 🎬 Video · 🏆 20 XP
🎬
Vidéo en production
Notre équipe pédagogique tourne actuellement cette leçon avec un·e formateur·rice expert·e. Le contenu textuel ci-dessous est complet et utilisable dès maintenant.

🤖 Qu'est-ce qu'un LLM ?

Un Large Language Model (LLM) est un modèle d'IA entraîné sur des milliards de textes pour prédire le mot suivant. Trois concepts clés :

  • Transformers : architecture de neurones (Google, 2017) qui traite des séquences en parallèle.
  • Attention : mécanisme qui pondère l'importance de chaque mot dans le contexte.
  • Embeddings : représentation vectorielle des mots et concepts dans un espace à plusieurs centaines de dimensions.

✨ Tokens et fenêtre de contexte

Un token est une unité de texte (souvent ~4 caractères ou 0.75 mot en anglais, un peu plus long en français). La fenêtre de contexte détermine combien de tokens le modèle peut traiter en une fois :

  • GPT-3.5 : 4K à 16K tokens
  • GPT-4 / Claude 3 : 8K à 128K tokens
  • Claude 4 / Gemini 3 (2026) : jusqu'à 200K voire 1M tokens (un livre entier)
💡 Astuce : 1 token ≈ 0.75 mot anglais, 0.5 mot français. Un prompt de 1000 mots FR ≈ 2000 tokens.

🤖 Modèles fondation vs fine-tunés

  • Fondation (GPT-5, Claude 4, Gemini 3) : généralistes, entraînés à grande échelle.
  • Fine-tunés : spécialisés sur un domaine (médical, juridique, code, support client) à partir d'un modèle fondation.

✨ Top modèles en 2026

  • OpenAI GPT-5 — leader sur raisonnement multimodal
  • Anthropic Claude 4.x — excellent pour rédaction longue et code
  • Google Gemini 3 — intégré à Workspace, fort en multimodal
  • Meta Llama 4 — open source, déployable on-premise
  • Mistral Large 2 — champion européen, fort en français

🤖 Modes d'utilisation

  • Chat web : ChatGPT, Claude.ai, Gemini.google.com
  • API : intégration dans tes applis (Python, Node, etc.)
  • Intégrations : Slack, Notion, Google Workspace, Microsoft 365

💡 Coûts approximatifs (2026, à vérifier)

  • Gratuit : usage limité (ChatGPT Free, Claude Free, Gemini Free)
  • Pro : ~20 USD/mois (ChatGPT Plus, Claude Pro, Gemini Advanced)
  • API : pay-per-token (ex : Claude 4 Sonnet ~3 USD / 1M tokens entrée)
Limitations à connaître :
  • Hallucinations : le modèle peut inventer des faits avec assurance
  • Biais : reflète les biais des données d'entraînement
  • Knowledge cutoff : ne connaît rien après sa date de coupure
🔒 Bonne pratique critique : ne jamais soumettre de données confidentielles (santé, finances, mots de passe, données clients) à un LLM public sans vérifier la politique de confidentialité et idéalement utiliser une version Enterprise avec engagement de non-entraînement.

Continuez le parcours 🚀

Inscrivez-vous pour accéder aux 4 autres leçons + le quiz final.

Créer mon compte