Apprendre à prompt avec WAN 2.2

De l'intention à l'image en mouvement

Introduction

WAN 2.2 est un moteur de génération vidéo qui répond remarquablement

bien aux intentions claires. Un bon prompt n est pas un inventaire

d adjectifs, mais une consigne filmique : on y décrit un plan, une

lumière, une caméra, un décor, un mouvement, et une ambiance.

L objectif de cet article est de te donner une méthode simple pour

écrire des prompts lisibles, reproductibles et prêts à publier, sans

jargon inutile, avec des réglages fiables pour commencer du bon pied.


Comment WAN 2.2 comprend tes consignes

Le modèle suit mieux des phrases brèves, concrètes et non

contradictoires. Il adore les noms précis (ruelle humide, armure

métallique brossée, néon magenta), les verbes d action (tourne la tête,

avance, attrape), et les contraintes de caméra modestes (plan fixe,

micro tremblements, pas de zoom). Évite les demandes incompatibles

comme « caméra fixe » et « pan rapide » dans la même phrase, et

proscris les accumulations d adjectifs vagues.


La grammaire d un bon prompt

Pense ton prompt comme une mini fiche de tournage. Six axes structurent

presque tous les plans : le plan lui même (type et cadrage), la

lumière, la caméra, le décor, le mouvement du sujet et l ambiance

générale. Tu peux écrire ces informations en une ou deux phrases

chacune, mais l essentiel est de rester cohérent et d indiquer la

direction de l action. Par exemple : « marche vers l avant » ou «

tourne la tête vers la droite » ; ces repères évitent les inversions

étranges.


Paramètres WAN sans mystère

Commence en format vertical neuf seizièmes, 720×1280 pixels, à seize

images par seconde. Garde vingt images par étape (steps 20) et un

TeaCache autour de vingt pour cent pour accélérer sans trop dégrader.

Place le facteur CFG entre 3,5 et 5 : monte si l image dérive, baisse

si le rendu paraît forcé. Fixe une graine (seed) pour conserver

physionomie, costume et lumière d un plan à l autre. Teste tes idées en

séquences d une seconde, seize images, puis passe à 96 ou 160 images

pour la version finale.


Écrire un premier prompt, pas à pas

Partons d un plan simple. Tu veux un portrait vertical, sujet face

caméra, ambiance cyberpunk réaliste sous la pluie. D abord, verrouille

le plan et la stabilité : « plan poitrine, 9:16, sujet centré, cadrage

stable ». Ensuite, définis la lumière : « néon magenta et azur, pluie

fine, reflets réalistes sur la peau ». La caméra doit être modeste : «

micro tremblements, léger head tilt, aucun zoom ». Le décor pose le

contexte : « ruelle humide, panneaux lumineux, vapeur au sol ». Enfin,

demande une action courte : « respiration lente, haussement d épaule

subtil ». Termine par l intention esthétique : « réalisme ciné, bokeh

doux, étalonnage sobre ». Tu obtiens une scène lisible, que WAN 2.2

peut respecter sans heurter la cohérence.

PLAN vertical 9:16, plan poitrine, sujet face caméra, centrage stable

LUMIÈRE néon magenta/azur, pluie fine, reflets réalistes sur la peau

CAMÉRA micro tremblements, léger head tilt, aucun zoom

DÉCOR ruelle cyberpunk humide, panneaux lumineux, vapeur au sol

MOUVEMENT respiration lente, haussement d épaule subtil

AMBIANCE réalisme ciné, bokeh doux, color grading propre

PARAMÈTRES 720×1280, 160 frames, 16 fps, steps 20, TeaCache 20 %, CFG

4.0, seed fixe

NÉGATIF bad hands, extra fingers, fused fingers, missing fingers, bad

anatomy, jitter, wobble, watermark, logo, text

Variante à partir d une image (I2V)


Quand tu pars d une image, conserve l éclairage, le costume et le

décor. Demande une micro action unique et réaliste, par exemple «

tourne légèrement la tête vers la droite, cligne des yeux ». La caméra

reste quasi fixe, avec une respiration naturelle. Réduis un peu le CFG

si le modèle surtend l action. La cohérence dépend ici surtout de ta

graine et de la fidélité au matériel de départ.

SOURCE même cadrage que l image, visage prioritaire, lumière conservée

ACTION tête tourne légèrement vers la droite, clignement des yeux

CAMÉRA fixe avec micro respiration, aucun zoom

DÉCOR identique à la source, n ajouter aucun élément

AMBIANCE réaliste, aucune exagération

PARAMÈTRES 720×1280, 96 128 frames, 16 fps, steps 20, TeaCache 20 %,

CFG 3.5, seed fixe

NÉGATIF bad hands, extra fingers, missing fingers, bad anatomy,

jitter, wobble, watermark, logo, text


Cohérence multi scènes

Pour une série ou un court métrage, garde la même graine par

personnage. Ne change pas la lumière ni le costume sans raison

Pour une série ou un court métrage, garde la même graine par

personnage. Ne change pas la lumière ni le costume sans raison

narrative. Si tu dois passer d un plan à un autre, justifie la

transition par un mouvement naturel (léger pan ou recentrage) plutôt

que par un effet gratuit. Note chaque prompt, ses paramètres et sa

graine dans un journal ; ce « carnet de tournage » évite

d involontaires écarts de style.


Diagnostic visuel : comment corriger vite

Si les mains sont étranges, renforce le négatif sur la main et les

doigts, et simplifie le geste. Si la caméra flotte, supprime les zooms

et garde seulement une oscillation très légère. Si l image paraît

filtrée, abaisse le CFG et redonne de la texture par la description de

matériaux et d éclairage plutôt que par des adjectifs vagues. En cas

d « OOM », diminue le nombre d images, reste à seize images par seconde

et ferme les applications lourdes.


Conclusion

WAN 2.2 récompense la clarté. Donne lui un plan précis, une lumière

définie, une caméra modeste, un décor cohérent, une action unique et

une intention lisible. Commence court, verrouille mains, visage et

stabilité, puis allonge à cent soixante images. En respectant cette

grammaire simple et quelques réglages sûrs, tu obtiens des séquences

propres, cohérentes et prêtes à publier.