← Retour au cours

Chap 3 — Génération d'images, vidéos et audio

⏱ 45 min · 🎬 Video · 🏆 25 XP
🎬
Vidéo en production
Notre équipe pédagogique tourne actuellement cette leçon avec un·e formateur·rice expert·e. Le contenu textuel ci-dessous est complet et utilisable dès maintenant.

🤖 Midjourney v7 (image)

Le leader créatif. S'utilise via Discord ou l'app web officielle.

/imagine prompt: a coffee shop in Douala at sunset,
warm lighting, cinematic, photorealistic --ar 16:9 --s 250 --v 7
  • --ar : aspect ratio (16:9, 1:1, 9:16)
  • --s : stylize (0-1000, plus haut = plus artistique)
  • --v : version du modèle

✨ DALL-E 3 (image, intégré ChatGPT)

Accessible directement dans ChatGPT Plus. Excellent pour respecter des instructions textuelles précises (texte dans l'image, composition exacte). Idéal pour briefs marketing.

🤖 Stable Diffusion (open source, local)

Gratuit, exécutable sur ton GPU. Outils : Automatic1111, ComfyUI, Forge. Permet fine-tuning (LoRA, Dreambooth) pour créer ton propre style.

✨ Flux (Black Forest Labs, 2024)

Modèle qui rivalise avec Midjourney en open source. Excellent rendu de mains, texte et anatomie.

🤖 Vidéo : Sora et Runway

  • Sora (OpenAI) : génère jusqu'à 60s de vidéo HD à partir d'un prompt texte.
  • Runway Gen-3 : pro du montage IA, image-to-video, motion brush.
  • Pika Labs : alternative grand public.

✨ Audio : voix et musique

  • ElevenLabs : voix synthétiques ultra-réalistes, 30+ langues, clonage vocal.
  • Suno et Udio : musique générative complète (paroles + instruments + voix) en 60s.
  • OpenAI Whisper : transcription audio → texte (gratuit, local possible).
💡 Recette d'un prompt visuel efficace :
Sujet + Style + Composition + Éclairage + Médium
Ex : "Femme entrepreneure africaine [sujet], style éditorial Vogue [style], plan rapproché [composition], lumière naturelle dorée [éclairage], photographie 50mm [médium]".

🤖 Workflow pro recommandé

  1. Brainstorm visuel avec Midjourney
  2. Itérations précises avec DALL-E 3 ou Flux
  3. Retouche avec Photoshop Generative Fill
  4. Animation avec Runway si vidéo
  5. Voix-off avec ElevenLabs
  6. Musique avec Suno
  7. Montage final dans CapCut ou DaVinci Resolve
Éthique et droit :
  • Droits d'auteur : zone grise, jurisprudence en construction (US Copyright Office refuse les œuvres 100% IA)
  • Deepfakes : interdits dans plusieurs pays, sanctions pénales
  • Signalement IA : recommandé éthiquement, parfois obligatoire (UE AI Act 2026)
  • Ne jamais recréer le visage d'une personne réelle sans consentement