🤖 Qu'est-ce qu'un LLM ?
Un Large Language Model (LLM) est un modèle d'IA entraîné sur des milliards de textes pour prédire le mot suivant. Trois concepts clés :
- Transformers : architecture de neurones (Google, 2017) qui traite des séquences en parallèle.
- Attention : mécanisme qui pondère l'importance de chaque mot dans le contexte.
- Embeddings : représentation vectorielle des mots et concepts dans un espace à plusieurs centaines de dimensions.
✨ Tokens et fenêtre de contexte
Un token est une unité de texte (souvent ~4 caractères ou 0.75 mot en anglais, un peu plus long en français). La fenêtre de contexte détermine combien de tokens le modèle peut traiter en une fois :
- GPT-3.5 : 4K à 16K tokens
- GPT-4 / Claude 3 : 8K à 128K tokens
- Claude 4 / Gemini 3 (2026) : jusqu'à 200K voire 1M tokens (un livre entier)
💡 Astuce : 1 token ≈ 0.75 mot anglais, 0.5 mot français. Un prompt de 1000 mots FR ≈ 2000 tokens.
🤖 Modèles fondation vs fine-tunés
- Fondation (GPT-5, Claude 4, Gemini 3) : généralistes, entraînés à grande échelle.
- Fine-tunés : spécialisés sur un domaine (médical, juridique, code, support client) à partir d'un modèle fondation.
✨ Top modèles en 2026
- OpenAI GPT-5 — leader sur raisonnement multimodal
- Anthropic Claude 4.x — excellent pour rédaction longue et code
- Google Gemini 3 — intégré à Workspace, fort en multimodal
- Meta Llama 4 — open source, déployable on-premise
- Mistral Large 2 — champion européen, fort en français
🤖 Modes d'utilisation
- Chat web : ChatGPT, Claude.ai, Gemini.google.com
- API : intégration dans tes applis (Python, Node, etc.)
- Intégrations : Slack, Notion, Google Workspace, Microsoft 365
💡 Coûts approximatifs (2026, à vérifier)
- Gratuit : usage limité (ChatGPT Free, Claude Free, Gemini Free)
- Pro : ~20 USD/mois (ChatGPT Plus, Claude Pro, Gemini Advanced)
- API : pay-per-token (ex : Claude 4 Sonnet ~3 USD / 1M tokens entrée)
⚠
Limitations à connaître :
- Hallucinations : le modèle peut inventer des faits avec assurance
- Biais : reflète les biais des données d'entraînement
- Knowledge cutoff : ne connaît rien après sa date de coupure
🔒 Bonne pratique critique : ne jamais soumettre de données confidentielles (santé, finances, mots de passe, données clients) à un LLM public sans vérifier la politique de confidentialité et idéalement utiliser une version Enterprise avec engagement de non-entraînement.