Cómo escribir mejores prompts para generación de video con IA usando Start + End Frames
Aprende a escribir prompts más sólidos para la generación de video con IA de DojoClip cuando usas una imagen inicial y una imagen final, con fórmulas sencillas, ejemplos y prompts listos para probar.
Cuando un principiante prueba por primera vez la generación de video con IA usando una imagen inicial y una imagen final, suele escribir el prompt como si estuviera describiendo un tráiler completo.
Eso casi siempre da resultados flojos.
En DojoClip AI Video Generation, el modo Start + End Frames funciona mejor cuando piensas como un director que da una instrucción corta y clara:
- ¿Qué debe moverse?
- ¿Cómo debe moverse la cámara?
- ¿Qué debe cambiar entre la primera imagen y la última?
- ¿Qué sensación debe tener ese cambio?
Esa es la idea central de este artículo.
En DojoClip, la Start frame es obligatoria y la End frame es opcional. Si subes ambas, el modelo intenta crear el movimiento que conecta la imagen A con la imagen B. Si subes solo la imagen inicial, el modelo anima la escena a partir de esa única imagen.
Por eso tu prompt no está para repetir lo que las imágenes ya muestran. Tu prompt está para describir el movimiento entre ambas.
La forma más fácil de entender este modo
Piensa en las dos imágenes así:
- la toma de apertura
- la toma de llegada
Y piensa en el prompt como:
- el movimiento que ocurre en medio
Aquí es donde mucha gente se equivoca. Suben una imagen inicial y una imagen final, pero luego escriben un prompt que vuelve a describir al sujeto, el fondo, el vestuario, la iluminación y toda la historia.
Eso suele ser demasiado.
Un mejor prompt se centra en cinco cosas:
- Movimiento de cámara
- Movimiento del sujeto
- Movimiento del entorno
- Tono o sensación cinematográfica
- El tipo de transición que quieres entre la primera y la última imagen
Si cubres esos cinco puntos con claridad, el prompt ya mejora mucho.
Una regla importante: escribe el movimiento, no el inventario
Cuando usas imágenes como entrada, las imágenes ya le dicen mucho al modelo:
- quién o qué aparece en plano
- cómo es el lugar
- cuál es aproximadamente el estilo visual
Eso significa que tu prompt no debería gastar casi toda su energía en volver a enumerar objetos visibles.
Prompt débil:
Una mujer con el pelo largo negro y abrigo rojo está en una calle nocturna con lluvia y neones rosas y azules reflejados en el suelo. Cinemático, realista, bonito, muy detallado.
Por qué es débil:
- Casi todo es descripción estática.
- No explica qué debe pasar en el video.
- No da una ruta clara entre el inicio y el final.
Prompt mejor:
Lento acercamiento de cámara mientras la protagonista levanta la mirada y empieza a caminar hacia delante. La lluvia ondula sobre el pavimento, los coches en movimiento proyectan reflejos cambiantes y el brillo de neón se intensifica ligeramente mientras la toma avanza hacia un close-up más íntimo.
Por qué es mejor:
- Le dice a la cámara qué hacer.
- Le dice al sujeto qué hacer.
- Le dice al entorno qué hacer.
- Marca una dirección clara para la transición.
Eso es exactamente lo que debe hacer un prompt de Start + End Frames.
Una fórmula simple para principiantes
Si no sabes cómo empezar, usa esta fórmula:
[movimiento de cámara] + [acción del sujeto] + [movimiento del entorno] + [tono/estilo] + [cómo debe llegar la toma al frame final]
Versión fácil de reutilizar:
Lento [movimiento de cámara] mientras [acción del sujeto]. [Movimiento del entorno] añade vida a la escena. La atmósfera se siente [palabras de tono]. La toma se resuelve de forma natural en la imagen final.
Ejemplos de cada parte:
- Cámara: slow dolly in, gentle pan right, low-angle push forward, locked shot
- Acción: turns toward camera, steps forward, opens the letter, lifts the bottle
- Entorno: curtains move in the wind, dust floats in sunlight, water ripples, traffic lights flicker
- Tono: calm, tense, dreamy, premium, intimate, elegant, nostalgic
No necesitas incluirlo todo. Solo lo correcto.
Cómo elegir mejor la imagen inicial y la final
Ni siquiera un gran prompt puede salvar por completo imágenes malas.
Las buenas parejas de inicio y final suelen compartir:
- el mismo sujeto principal
- un estilo coherente
- una lógica de luz parecida
- un cambio creíble de pose, encuadre o energía
Buenos pares suelen verse así:
- plano abierto a close-up
- pose quieta a pose activa
- emoción neutra a emoción más marcada
- objeto en reposo a objeto en uso
Pares débiles suelen verse así:
- una persona en la primera imagen y otra distinta en la segunda
- una luz de día en una y una discoteca sin relación en la otra
- vestuario, edad o estilo artístico totalmente distintos
El modelo puede animar una transición, pero sigue necesitando un puente creíble.
Mantén el prompt dentro de una sola escena
Esto importa más de lo que parece.
Los videos cortos con IA suelen funcionar mejor cuando cada prompt cubre un solo momento.
Prompt débil:
Un detective encuentra una pista en una biblioteca, luego conduce por la ciudad y después se enfrenta a un sospechoso en un almacén mientras empieza a llover.
Por qué falla:
- Tiene varias escenas.
- Intenta cambiar de lugar y de acción demasiado rápido.
Prompt mejor:
Close-up de una mano con guante retirando el polvo de un libro antiguo mientras la cámara avanza lentamente. Un símbolo oculto aparece entre partículas suspendidas en un haz cálido de luz.
Eso es mucho más fácil de construir para el modelo.
Si quieres una secuencia completa, haz varios clips, no un prompt sobrecargado.
Qué conviene incluir en el prompt
Cuando escribas para Start + End Frames, intenta mencionar estos elementos en este orden:
1. Movimiento de cámara
Suele ser la mejora más útil.
Ejemplos:
- slow dolly in
- gentle handheld drift
- smooth pan left
- low-angle push forward
- locked cinematic frame
2. Acción del sujeto
¿Qué hace realmente la persona, el objeto o el personaje?
Ejemplos:
- turns slowly toward camera
- lifts the bottle into the light
- takes one step forward
- opens the letter with shaking hands
3. Movimiento del entorno
Da vida a la escena sin cambiar el sujeto principal.
Ejemplos:
- steam rises from the cup
- curtains move in the breeze
- reflections ripple across wet pavement
- petals drift past the lens
4. Tono
Le dice al modelo cómo debe sentirse el movimiento.
Ejemplos:
- tense and suspenseful
- elegant and premium
- quiet and intimate
- dreamy and nostalgic
5. La llegada
Si tienes una imagen final, sugiere cómo debe aterrizar la toma.
Ejemplos:
- ending in a close-up
- resolving into a centered hero shot
- finishing with the subject facing camera
- landing in a wider reveal
Qué conviene evitar
Evita estos errores comunes:
- describir el encuadre entero sin mencionar movimiento
- pedir tres escenas en un clip corto
- mezclar instrucciones de cámara que se contradicen
- usar imágenes inicial y final que no pertenecen al mismo mundo visual
- escribir cosas vagas como "hazlo épico" sin decir qué debe pasar
Débil:
Haz que se vea épico, cinematográfico, emocional y súper increíble.
Mejor:
Lento acercamiento mientras el sujeto levanta la mirada con emoción contenida. La habitación permanece quieta salvo por el polvo flotando en la luz de la ventana. La toma termina en un close-up silencioso e íntimo.
Ejemplos de prompts que puedes probar
Aquí tienes ejemplos prácticos que luego puedes renderizar y convertir en demos.
Ejemplo 1: Retrato en transición
Idea para la imagen inicial: una mujer joven quieta en un andén al atardecer
Idea para la imagen final: un encuadre más cercano donde ha girado ligeramente hacia cámara
Prompt:
Slow dolly in as the subject turns her head slightly toward camera and lifts her eyes. Her hair moves gently in the evening wind, distant train lights slide across the background, and the atmosphere feels reflective and cinematic. The shot resolves into a closer, more intimate portrait.
Por qué funciona:
- movimiento de cámara claro
- movimiento pequeño y creíble
- animación sutil del fondo
- dirección emocional concreta
Ejemplo 2: Producto premium
Idea para la imagen inicial: frasco de perfume sobre mármol
Idea para la imagen final: plano más cerrado con reflejos más elegantes sobre el vidrio
Prompt:
Elegant slow push-in on the perfume bottle as soft mist curls around the base and highlights glide across the glass. Tiny reflections shimmer on the marble surface, creating a premium editorial mood. The shot lands in a polished hero close-up with the bottle centered and luminous.
Por qué funciona:
- el producto sigue siendo el centro
- el movimiento es sutil y publicitario
- el entorno acompaña al objeto principal
Ejemplo 3: Interior atmosférico
Idea para la imagen inicial: sala vacía con luz suave de mañana
Idea para la imagen final: la misma sala con más luz sobre el suelo y cortinas moviéndose
Prompt:
Locked cinematic frame as morning light slowly stretches across the floor. The curtains move gently in the breeze, dust floats in the sunlight, and the room feels calm, minimal, and lived-in. The shot naturally settles into the brighter ending frame.
Por qué funciona:
- no intenta contar una historia entera
- el entorno lleva el movimiento
- el frame final se siente natural
Un ejercicio rápido de reescritura
Si tu prompt se siente flojo, revísalo con esta lista:
- ¿He descrito el movimiento de cámara?
- ¿He descrito el movimiento del sujeto?
- ¿He añadido un movimiento del entorno?
- ¿Lo he mantenido en una sola escena?
- ¿He indicado cómo debe llegar al final?
Versión débil:
Un video de moda urbano, cool y cinematográfico de noche.
Versión mejor:
Smooth handheld push forward as the subject walks through the neon-lit street and glances to the side. Reflections ripple across the wet pavement while headlights pass behind her. The mood feels glossy, stylish, and nocturnal, ending in a confident medium close-up.
Checklist final para mejorar prompts de Start + End Frames
Antes de generar, pregúntate:
- ¿La imagen inicial y la final claramente pertenecen a la misma escena?
- ¿Mi prompt se centra en movimiento y no solo en descripción estática?
- ¿Estoy pidiendo solo una escena?
- ¿El movimiento de cámara es fácil de imaginar?
- ¿El final está claro?
Con eso ya puedes mejorar rápido.
Los mejores prompts de Start + End Frames no intentan explicarlo todo. Hacen una cosa mejor: dirigir con claridad cómo debe moverse el video desde aquí hasta allá.
Si quieres probarlo directamente, usa DojoClip AI Video Generator aquí: Genera videos con DojoClip