Como escrever melhores prompts para geração de vídeo com IA usando Start + End Frames
Aprenda a escrever prompts mais fortes para a geração de vídeo com IA da DojoClip quando usa uma frame inicial e uma frame final, com fórmulas para iniciantes, exemplos e prompts prontos a testar.
Quando alguém experimenta pela primeira vez geração de vídeo com IA com uma frame inicial e uma frame final, é muito comum escrever o prompt como se estivesse a descrever um trailer inteiro.
Isso costuma produzir resultados fracos.
Na geração de vídeo com IA da DojoClip, o modo Start + End Frames funciona melhor quando pensa como um realizador a dar uma instrução curta e focada:
- O que deve mover-se?
- Como deve mover-se a câmara?
- O que deve mudar entre a primeira imagem e a última?
- Como deve sentir-se o ambiente durante essa mudança?
Esta é a ideia central deste artigo.
Na DojoClip, a start frame é obrigatória e a end frame é opcional. Se fornecer as duas, o modelo tenta criar o movimento que liga a imagem A à imagem B. Se fornecer apenas a start frame, o modelo anima a partir dessa imagem inicial.
Por isso, o prompt não serve para repetir o que as imagens já mostram. O prompt serve para descrever o movimento entre elas.
A forma mais simples de pensar neste modo
Pense nas duas imagens como:
- o plano de abertura
- o plano de chegada
E pense no prompt como:
- o movimento no meio
É aqui que muita gente falha. Carregam uma start frame e uma end frame, depois escrevem um prompt que volta a descrever o sujeito, o fundo, a roupa, a luz e a história inteira.
Normalmente é demais.
Um prompt melhor concentra-se em cinco pontos:
- Movimento de câmara
- Movimento do sujeito
- Movimento do ambiente
- Tom ou ambiente cinematográfico
- Tipo de transição que quer entre as duas imagens
Se cobrir estes cinco pontos com clareza, o prompt já fica muito mais forte.
Regra importante: escreva para o movimento, não para o inventário
Quando usa imagens como input, elas já dizem muita coisa ao modelo:
- quem ou o que está no plano
- como é o local
- quais são, em termos gerais, as cores e o estilo
Isso significa que o prompt não deve gastar a maior parte da energia a listar objetos visíveis outra vez.
Mau prompt:
Uma mulher com cabelo preto comprido e casaco vermelho está numa rua de néon à noite, com luzes azuis e cor-de-rosa refletidas no chão molhado. Cinemático, realista, detalhado, luz bonita.
Porque é fraco:
- re-descreve sobretudo a imagem
- não diz o que deve acontecer no vídeo
- não cria um caminho claro de movimento entre início e fim
Melhor:
Push-in lento enquanto o sujeito levanta o olhar e começa a caminhar em frente. A chuva faz ondulações no chão, os carros projetam reflexos em movimento e o brilho do néon intensifica-se ligeiramente até chegar a um close-up mais íntimo.
Porque é melhor:
- diz à câmara o que fazer
- diz ao sujeito o que fazer
- diz ao ambiente o que fazer
- dá direção à transição
É isto que um bom prompt para Start + End Frames deve fazer.
Fórmula simples para iniciantes
Se não sabe por onde começar, use esta fórmula:
[movimento de câmara] + [ação do sujeito] + [movimento do ambiente] + [humor/estilo] + [como o plano deve chegar à frame final]
Versão curta reutilizável:
[Movimento de câmara] lento enquanto [ação do sujeito]. [Movimento do ambiente] acrescenta vida à cena. O ambiente transmite [palavras de tom]. O plano resolve-se naturalmente na frame final.
Exemplos de cada parte:
- Movimento de câmara: dolly in lento, pan suave para a direita, push forward em contra-plongée, plano fixo, deriva aérea
- Ação do sujeito: vira-se para a câmara, alcança a pega, entra no enquadramento, baixa os olhos, levanta o produto
- Movimento do ambiente: cortinas a mexer com o vento, nevoeiro a deslizar pelo chão, pó no feixe de luz, ondulações na água, semáforos a piscar
- Humor: calmo, tenso, sonhador, glossy, íntimo, cinematográfico, elegante, documental
Não precisa de todos os detalhes possíveis. Precisa dos detalhes certos.
Como escolher boas start e end frames
Nem o melhor prompt salva inputs fracos. As frames importam.
Boas start e end frames costumam partilhar:
- o mesmo sujeito principal
- um estilo coerente
- lógica de iluminação semelhante
- uma mudança credível de pose, enquadramento ou energia
Bons pares costumam parecer-se com isto:
- plano aberto para close-up
- pose estática para pose ativa
- ambiente neutro para ambiente emocional
- objeto em repouso para objeto em uso
Pares fracos costumam parecer-se com isto:
- uma pessoa na imagem A e outra completamente diferente na imagem B
- luz diurna numa frame e uma discoteca sem relação na outra
- duas imagens com roupa, idade ou estilo artístico totalmente diferentes
O modelo consegue animar uma transição, mas precisa de uma ponte credível.
Mantenha um prompt focado numa única cena
Isto importa mais do que a maioria dos iniciantes imagina.
Vídeos curtos com IA funcionam melhor quando cada prompt fala de um único momento.
Prompt fraco:
Um detetive encontra uma pista numa biblioteca, conduz pela cidade e depois confronta um suspeito num armazém enquanto começa a chover lá fora.
Porque é fraco:
- inclui várias cenas
- pede ao modelo para saltar demasiado depressa entre locais e momentos narrativos
Melhor:
Close-up da mão enluvada de um detetive a limpar o pó de um livro antigo enquanto a câmara se aproxima lentamente. Um símbolo escondido aparece e partículas flutuam num feixe de luz quente.
Isto é muito mais fácil de encenar para o modelo.
Se quiser uma sequência, faça vários clipes, não um só prompt sobrecarregado.
O que incluir no prompt
Quando escreve para o modo Start + End Frames, tente mencionar estes elementos por esta ordem:
1. Movimento de câmara
É normalmente a adição mais útil.
Exemplos:
- dolly in lento
- deriva handheld suave
- pan suave para a esquerda
- push forward em contra-plongée
- plano cinematográfico fixo
2. Ação do sujeito
O que faz realmente a pessoa, o objeto ou a criatura?
Exemplos:
- vira-se lentamente para a câmara
- levanta o frasco em direção à luz
- dá um passo em frente
- abre a carta com as mãos a tremer
3. Movimento do ambiente
Isto dá vida sem mudar o sujeito.
Exemplos:
- vapor a subir da chávena
- cortinas a mover-se com a brisa
- reflexos do trânsito a ondular no chão molhado
- pétalas a passar em frente à lente
4. Tom
Diz ao modelo como o movimento se deve sentir.
Exemplos:
- tenso e suspenso
- elegante e premium
- calmo e íntimo
- sonhador e nostálgico
5. A chegada
Se tem uma end frame, dê uma pista sobre como o plano deve aterrar nela.
Exemplos:
- terminar num close-up
- resolver-se num hero shot centrado
- acabar com o sujeito virado para a câmara
- abrir para um reveal mais amplo
O que evitar
Evite estes erros comuns:
- descrever o plano inteiro de forma estática sem mencionar movimento
- pedir três cenas num clip curto
- combinar instruções de câmara contraditórias
- carregar start e end frames que não pertencem ao mesmo universo visual
- usar palavras vagas como “faz com que pareça cool” ou “vibe cinematográfica” sem dizer o que deve realmente acontecer
Mau:
Faz com que seja épico, cinematográfico, emocional, super detalhado e incrível.
Melhor:
Push-in lento enquanto o sujeito levanta o olhar com emoção contida. O quarto mantém-se quase imóvel, exceto pelo pó a flutuar na luz da janela. O plano termina num close-up íntimo e silencioso.
Exemplos de prompts que pode testar
Eis alguns prompts práticos que pode usar mais tarde em testes ou vídeos de demonstração.
Exemplo 1: transição de retrato
Ideia de start frame: uma mulher jovem parada numa plataforma de comboio ao anoitecer
Ideia de end frame: um enquadramento mais fechado, com ela ligeiramente virada para a câmara e o olhar levantado
Prompt:
Dolly in lento enquanto o sujeito roda ligeiramente a cabeça em direção à câmara e levanta o olhar. O cabelo move-se suavemente com o vento da tarde, luzes distantes de comboio deslizam no fundo e o ambiente parece reflexivo e cinematográfico. O plano resolve-se num retrato mais íntimo e próximo.
Porque funciona:
- movimento de câmara claro
- movimento pequeno e credível do sujeito
- animação subtil do fundo
- direção emocional clara
Exemplo 2: beauty shot de produto
Ideia de start frame: frasco de perfume sobre uma superfície de mármore
Ideia de end frame: hero shot mais apertado, com a luz a apanhar o vidro
Prompt:
Push-in lento e elegante sobre o frasco de perfume enquanto uma névoa suave sobe na base e os brilhos deslizam pelo vidro. Pequenos reflexos cintilam no mármore e criam um ambiente editorial premium. O plano aterra num hero close-up polido, com o frasco centrado e luminoso.
Porque funciona:
- o produto mantém-se central
- o movimento é subtil e pronto para comercial
- o ambiente reforça o objeto principal
Exemplo 3: revelação de ambiente interior
Ideia de start frame: sala vazia com luz da manhã
Ideia de end frame: a mesma sala com a luz mais espalhada no chão e as cortinas ligeiramente mexidas
Prompt:
Plano cinematográfico fixo enquanto a luz da manhã avança lentamente pelo chão. As cortinas movem-se com a brisa, partículas de pó flutuam ao sol e a sala transmite calma, minimalismo e presença humana. O plano assenta naturalmente na frame final mais iluminada.
Porque funciona:
- não há sobrecarga narrativa
- o ambiente carrega o movimento
- a frame final parece uma continuação natural
Exercício simples de reescrita
Se o seu prompt parecer fraco, reescreva-o com esta checklist:
- Descrevi o movimento de câmara?
- Descrevi o movimento do sujeito?
- Adicionei um movimento do ambiente?
- Mantive o prompt dentro de uma única cena?
- Dei uma pista sobre a forma de chegada?
Versão fraca:
Um vídeo de moda cool e cinematográfico numa cidade à noite.
Versão melhor:
Push handheld suave em frente enquanto o sujeito caminha pela rua iluminada por néon e olha de lado. Os reflexos ondulam no chão molhado enquanto os faróis passam atrás dela. O ambiente parece glossy, estilizado e noturno, terminando num medium close-up confiante.
Checklist final para melhores prompts com Start + End Frames
Antes de gerar, pergunte:
- As minhas start e end frames pertencem claramente ao mesmo conjunto?
- O prompt está focado em movimento e não em descrição estática?
- Estou a pedir apenas uma cena?
- O movimento de câmara é fácil de imaginar?
- O final está claro?
Isto já chega para melhorar rapidamente os resultados.
Os melhores prompts com Start + End Frames não tentam explicar tudo. Fazem uma coisa melhor do que os restantes: dirigem com clareza como o vídeo deve mover-se daqui para ali.
Se quiser testar estas ideias diretamente, experimente o gerador de vídeo com IA da DojoClip aqui: Gere vídeos com a DojoClip