Comment écrire de meilleurs prompts pour la génération vidéo IA avec Reference Images

Apprenez à écrire de meilleurs prompts pour la génération vidéo IA de DojoClip avec reference images, y compris comment choisir vos images, éviter les contradictions et guider plus clairement le sujet, le style et le mouvement.

Pansa Legrandhow to use

Si le mode Start + End Frames sert à diriger une transition, le mode Reference Images sert à diriger la cohérence.

Vous utilisez des reference images lorsque vous voulez que le modèle reste fidèle à :

  • une personne
  • un personnage
  • un produit
  • un style visuel
  • une logique de composition

Dans DojoClip AI Video Generation, le mode Reference Images vous permet de charger de 1 à 3 images de référence. L'objectif n'est pas de noyer le modèle sous une inspiration aléatoire. L'objectif est de lui fournir un ancrage visuel stable, puis d'utiliser le prompt pour décrire ce qui doit se passer dans la vidéo.

Cette dernière partie est essentielle.

La règle la plus facile à retenir est la suivante :

Les reference images définissent ce que c'est. Le prompt définit ce que cela fait.

Si vous gardez cette idée en tête, vos prompts deviennent immédiatement meilleurs.


À quoi servent vraiment les reference images

Les reference images sont particulièrement utiles lorsque vous voulez :

  • que la même personne reste reconnaissable
  • qu'un produit conserve exactement sa forme et son design
  • qu'un personnage garde une apparence cohérente
  • qu'un style de campagne soit conservé
  • qu'une vidéo reste ancrée dans un univers visuel précis

Ce mode est souvent plus fort qu'un simple prompt texte lorsque la cohérence compte.

Par exemple :

  • une publicité beauté avec un flacon précis
  • un clip mode avec un look bien défini
  • une mascotte ou un jouet qui doit rester reconnaissable
  • une scène lifestyle de marque avec une identité visuelle stable

Si l'identité compte, les images de référence sont très utiles.


L'erreur la plus fréquente chez les débutants

Beaucoup de débutants chargent des reference images, puis écrivent un prompt comme celui-ci :

Une femme aux longs cheveux bruns portant un trench crème et des boucles d'oreilles dorées dans un couloir d'hôtel de luxe aux murs beiges avec une lumière chaude et cinématographique.

Ce prompt est faible pour la même raison que beaucoup d'autres prompts faibles :

  • il répète surtout ce que les images montrent déjà
  • il n'explique pas clairement le mouvement
  • il ne dirige pas la caméra

Prompt meilleur :

Elegant slow tracking shot as the subject walks forward with calm confidence and briefly looks toward camera. Soft fabric movement, warm hallway reflections, and subtle depth-of-field create a premium fashion-film mood.

Les images disent déjà au modèle qui est le sujet et à quoi il ressemble. Votre prompt doit surtout décrire :

  • l'action
  • le mouvement de caméra
  • l'énergie de la scène
  • le ton

C'est là que se trouve le vrai contrôle utile.


Comment mieux choisir vos reference images

La qualité du set de référence compte autant que le texte du prompt.

De bonnes reference images sont généralement :

  • nettes et de bonne qualité
  • visuellement cohérentes entre elles
  • centrées sur le même sujet ou produit
  • utiles depuis des angles ou cadrages légèrement différents
  • alignées dans leur logique de lumière, de tenue ou de style

Les mauvais sets sont souvent :

  • de faible qualité
  • contradictoires
  • composés de personnes ou de produits différents
  • très éloignés en âge, vêtements, couleurs ou style artistique
  • trop chargés en idées différentes

Si les trois images se contredisent, votre prompt devra lutter contre une confusion inutile.


À quoi ressemble un bon set de 1 à 3 images

En pratique, un bon set suit souvent l'un de ces schémas :

Schéma 1 : un sujet, un look, trois angles utiles

Utilisez-le quand l'identité est la priorité.

Exemple :

  • image 1 : portrait frontal propre
  • image 2 : angle trois-quarts
  • image 3 : plan moyen ou plein pied montrant la silhouette

Cela fonctionne bien pour :

  • la mode
  • les personnages
  • les influenceurs
  • les portraits

Schéma 2 : un produit, trois vues de clarté

Utilisez-le quand le design du produit est prioritaire.

Exemple :

  • image 1 : angle hero de face
  • image 2 : angle latéral pour montrer la forme
  • image 3 : gros plan sur une texture, une matière ou une étiquette

Cela fonctionne bien pour :

  • les parfums
  • le skincare
  • les sneakers
  • le packaging

Schéma 3 : un sujet plus une direction de style

À utiliser avec prudence.

Si votre sujet est déjà bien défini, l'image supplémentaire doit renforcer l'univers visuel, pas le contredire. Si l'image de style est trop différente, le résultat peut dériver.


Une formule simple pour écrire de meilleurs prompts avec reference images

Utilisez cette formule :

[type de plan / mouvement de caméra] + [action du sujet ou du produit] + [mouvement de l'environnement] + [ton / style] + [accent sur la fin du plan]

Template réutilisable :

Smooth [camera move] as the subject [action]. [Environment motion] adds life to the scene. The overall feeling is [tone words], with a clean, cinematic finish.

Puisque les images portent déjà l'apparence, il n'est souvent pas nécessaire de réécrire :

  • la couleur exacte des cheveux
  • tous les détails de la tenue
  • le design précis du produit
  • chaque objet d'arrière-plan

Concentrez-vous plutôt sur ce que la vidéo doit faire.


Quand l'image montre déjà le sujet, restez général dans le texte

C'est un petit réflexe très utile.

Quand vous avez déjà chargé des reference images, il est souvent plus efficace de parler du sujet avec des termes larges comme :

  • the subject
  • the woman
  • the man
  • the model
  • the bottle
  • the product

Cela garde le prompt propre et évite de surdéfinir des détails déjà présents dans les images.

Au lieu de cela :

La femme brune avec trench crème et boucles d'oreilles dorées tourne lentement pendant que ses cheveux bougent.

Essayez plutôt :

The subject turns slowly as the fabric and hair move gently in the air.

Les prompts les plus propres sont souvent les plus solides.


Reference Images n'est pas un moodboard aléatoire

Il faut le dire clairement.

N'utilisez pas les 1 à 3 emplacements comme un tableau Pinterest.

Si une image est :

  • une voiture de sport rouge

et la suivante :

  • un portrait anime à l'aquarelle

et la troisième :

  • un flacon de parfum de luxe

vous n'aidez pas le modèle. Vous créez un conflit.

Les reference images doivent toutes pointer dans la même direction.

Posez-vous ces questions :

  • Ces images décrivent-elles le même sujet ou le même univers visuel ?
  • Un directeur artistique humain les considérerait-il comme un set cohérent ?
  • Chaque image apporte-t-elle de la clarté plutôt que de la confusion ?

Si la réponse est non, changez d'abord les images, pas le prompt.


Exemples de prompts à tester

Voici des exemples conçus pour être rendus plus tard et utilisés comme démos.

Exemple 1 : Portrait mode

Idée de set de référence : trois images du même modèle avec la même tenue, sous des angles différents

Prompt:

Smooth tracking shot as the subject walks toward camera with restrained confidence, then briefly turns her gaze to the side. Soft air movement lifts the hair and coat slightly, while reflected city lights shimmer in the background. The mood feels premium, editorial, and cinematic.

Pourquoi cela fonctionne :

  • les images gèrent l'identité et la tenue
  • le prompt gère le mouvement et l'ambiance
  • la direction de caméra est simple et utile

Exemple 2 : Publicité produit

Idée de set de référence : trois images du même flacon de skincare, dont un gros plan sur la texture et l'étiquette

Prompt:

Elegant slow push-in on the product as condensation gathers on the surface and soft light glides across the bottle. Water droplets roll gently, background highlights shimmer, and the shot feels clean, modern, and luxurious with a polished commercial finish.

Pourquoi cela fonctionne :

  • le produit reste au centre
  • le mouvement est minimal mais visuellement riche
  • le prompt n'essaie pas de redécrire le design ligne par ligne

Exemple 3 : Personnage stylisé

Idée de set de référence : deux ou trois images du même personnage illustré avec vêtements, visage et palette cohérents

Prompt:

Slow cinematic push forward as the subject stands still for a beat, then raises their chin and lets a faint smile appear. Wind moves through the hair and clothing, glowing particles drift through the frame, and the atmosphere feels heroic, calm, and slightly magical.

Pourquoi cela fonctionne :

  • les références maintiennent l'identité du personnage
  • le prompt crée la performance
  • la scène reste concentrée sur un seul beat émotionnel

Un mauvais prompt contre un meilleur prompt

Faible :

Make a really beautiful luxury fashion video with a stylish woman and amazing cinematic lighting and expensive vibes.

Pourquoi c'est faible :

  • c'est vague
  • presque aucune direction de mouvement
  • aucune idée claire de caméra
  • pas de comportement de scène

Meilleur :

Slow side-tracking shot as the subject walks through the hallway and lightly brushes one hand against the wall. The fabric moves softly, warm reflections pulse across the floor, and the mood feels elegant, quiet, and high-end.

Pourquoi c'est meilleur :

  • idée de caméra claire
  • action claire
  • mouvement d'environnement clair
  • ton clair

Combien d'images de référence faut-il utiliser ?

Utilisez le plus petit nombre possible dès lors qu'il enseigne clairement ce qui compte.

Utilisez 1 image quand :

  • le sujet est simple
  • le style est déjà évident
  • vous avez seulement besoin d'un ancrage fort

Utilisez 2 images quand :

  • vous avez besoin d'un second angle
  • vous voulez combiner identité et clarté de pose

Utilisez 3 images quand :

  • le sujet ou le produit a des détails importants vus sous plusieurs angles
  • chaque image apporte une vraie information utile

N'utilisez pas 3 images juste parce que 3 sont autorisées.

Plus n'est mieux que si chaque image aide réellement.


Checklist finale pour de meilleurs prompts avec Reference Images

Avant de générer, demandez-vous :

  • Mes images de référence décrivent-elles toutes le même sujet ou le même produit ?
  • Sont-elles de bonne qualité et visuellement cohérentes ?
  • Mon prompt parle-t-il surtout du mouvement, sans redécrire l'apparence ?
  • Ai-je clairement défini le mouvement de caméra ?
  • Est-ce que je demande une seule scène et un seul beat émotionnel ?

Cela suffit déjà pour améliorer nettement les résultats.

Les meilleurs prompts avec reference images ne sont généralement pas les plus longs. Ce sont ceux où les images portent l'identité, tandis que les mots dirigent clairement l'action.

Si vous voulez tester cela directement, essayez DojoClip AI Video Generator ici : Générez des vidéos avec DojoClip