Apprendre à prompt avec WAN 2.2
De l'intention à l'image en mouvement
Introduction
WAN 2.2 est un moteur de génération vidéo qui répond remarquablement
bien aux intentions claires. Un bon prompt n est pas un inventaire
d adjectifs, mais une consigne filmique : on y décrit un plan, une
lumière, une caméra, un décor, un mouvement, et une ambiance.
L objectif de cet article est de te donner une méthode simple pour
écrire des prompts lisibles, reproductibles et prêts à publier, sans
jargon inutile, avec des réglages fiables pour commencer du bon pied.
Comment WAN 2.2 comprend tes consignes
Le modèle suit mieux des phrases brèves, concrètes et non
contradictoires. Il adore les noms précis (ruelle humide, armure
métallique brossée, néon magenta), les verbes d action (tourne la tête,
avance, attrape), et les contraintes de caméra modestes (plan fixe,
micro tremblements, pas de zoom). Évite les demandes incompatibles
comme « caméra fixe » et « pan rapide » dans la même phrase, et
proscris les accumulations d adjectifs vagues.
La grammaire d un bon prompt
Pense ton prompt comme une mini fiche de tournage. Six axes structurent
presque tous les plans : le plan lui même (type et cadrage), la
lumière, la caméra, le décor, le mouvement du sujet et l ambiance
générale. Tu peux écrire ces informations en une ou deux phrases
chacune, mais l essentiel est de rester cohérent et d indiquer la
direction de l action. Par exemple : « marche vers l avant » ou «
tourne la tête vers la droite » ; ces repères évitent les inversions
étranges.
Paramètres WAN sans mystère
Commence en format vertical neuf seizièmes, 720×1280 pixels, à seize
images par seconde. Garde vingt images par étape (steps 20) et un
TeaCache autour de vingt pour cent pour accélérer sans trop dégrader.
Place le facteur CFG entre 3,5 et 5 : monte si l image dérive, baisse
si le rendu paraît forcé. Fixe une graine (seed) pour conserver
physionomie, costume et lumière d un plan à l autre. Teste tes idées en
séquences d une seconde, seize images, puis passe à 96 ou 160 images
pour la version finale.
Écrire un premier prompt, pas à pas
Partons d un plan simple. Tu veux un portrait vertical, sujet face
caméra, ambiance cyberpunk réaliste sous la pluie. D abord, verrouille
le plan et la stabilité : « plan poitrine, 9:16, sujet centré, cadrage
stable ». Ensuite, définis la lumière : « néon magenta et azur, pluie
fine, reflets réalistes sur la peau ». La caméra doit être modeste : «
micro tremblements, léger head tilt, aucun zoom ». Le décor pose le
contexte : « ruelle humide, panneaux lumineux, vapeur au sol ». Enfin,
demande une action courte : « respiration lente, haussement d épaule
subtil ». Termine par l intention esthétique : « réalisme ciné, bokeh
doux, étalonnage sobre ». Tu obtiens une scène lisible, que WAN 2.2
peut respecter sans heurter la cohérence.
PLAN vertical 9:16, plan poitrine, sujet face caméra, centrage stable
LUMIÈRE néon magenta/azur, pluie fine, reflets réalistes sur la peau
CAMÉRA micro tremblements, léger head tilt, aucun zoom
DÉCOR ruelle cyberpunk humide, panneaux lumineux, vapeur au sol
MOUVEMENT respiration lente, haussement d épaule subtil
AMBIANCE réalisme ciné, bokeh doux, color grading propre
PARAMÈTRES 720×1280, 160 frames, 16 fps, steps 20, TeaCache 20 %, CFG
4.0, seed fixe
NÉGATIF bad hands, extra fingers, fused fingers, missing fingers, bad
anatomy, jitter, wobble, watermark, logo, text
Variante à partir d une image (I2V)
Quand tu pars d une image, conserve l éclairage, le costume et le
décor. Demande une micro action unique et réaliste, par exemple «
tourne légèrement la tête vers la droite, cligne des yeux ». La caméra
reste quasi fixe, avec une respiration naturelle. Réduis un peu le CFG
si le modèle surtend l action. La cohérence dépend ici surtout de ta
graine et de la fidélité au matériel de départ.
SOURCE même cadrage que l image, visage prioritaire, lumière conservée
ACTION tête tourne légèrement vers la droite, clignement des yeux
CAMÉRA fixe avec micro respiration, aucun zoom
DÉCOR identique à la source, n ajouter aucun élément
AMBIANCE réaliste, aucune exagération
PARAMÈTRES 720×1280, 96 128 frames, 16 fps, steps 20, TeaCache 20 %,
CFG 3.5, seed fixe
NÉGATIF bad hands, extra fingers, missing fingers, bad anatomy,
jitter, wobble, watermark, logo, text
Cohérence multi scènes
Pour une série ou un court métrage, garde la même graine par
personnage. Ne change pas la lumière ni le costume sans raison
Pour une série ou un court métrage, garde la même graine par
personnage. Ne change pas la lumière ni le costume sans raison
narrative. Si tu dois passer d un plan à un autre, justifie la
transition par un mouvement naturel (léger pan ou recentrage) plutôt
que par un effet gratuit. Note chaque prompt, ses paramètres et sa
graine dans un journal ; ce « carnet de tournage » évite
d involontaires écarts de style.
Diagnostic visuel : comment corriger vite
Si les mains sont étranges, renforce le négatif sur la main et les
doigts, et simplifie le geste. Si la caméra flotte, supprime les zooms
et garde seulement une oscillation très légère. Si l image paraît
filtrée, abaisse le CFG et redonne de la texture par la description de
matériaux et d éclairage plutôt que par des adjectifs vagues. En cas
d « OOM », diminue le nombre d images, reste à seize images par seconde
et ferme les applications lourdes.
Conclusion
WAN 2.2 récompense la clarté. Donne lui un plan précis, une lumière
définie, une caméra modeste, un décor cohérent, une action unique et
une intention lisible. Commence court, verrouille mains, visage et
stabilité, puis allonge à cent soixante images. En respectant cette
grammaire simple et quelques réglages sûrs, tu obtiens des séquences
propres, cohérentes et prêtes à publier.