Bessere Prompts für KI-Videogenerierung mit Start- und Endframes schreiben
So formulierst du klare Prompts für DojoClip AI Video Generation mit Startframe, optionalem Endframe und besserer Bewegungsführung.
Viele Einsteiger schreiben fuer Start- und Endframes so, als wuerden sie einen kompletten Trailer beschreiben. Genau das fuehrt oft zu schwachen Ergebnissen.
Im Modus mit Startframe und optionalem Endframe geht es nicht darum, alles im Bild noch einmal auszuerzaehlen. Es geht darum, die Bewegung zwischen den Bildern klar zu beschreiben.
Die einfachste Denkweise ist:
- Der Startframe ist der Anfang
- Der Endframe ist das Ziel
- Der Prompt ist die Bewegung dazwischen
Warum dieser Modus anders funktioniert
Wenn du beide Frames vorgibst, hat das Modell bereits viel visuelle Information:
- Motiv
- Komposition
- Licht
- grobe Richtung der Szene
Der Prompt sollte deshalb vor allem erklaeren:
- was sich bewegt
- wie sich die Kamera bewegt
- wie schnell oder ruhig der Shot wirkt
- welches Gefuehl die Bewegung haben soll
Die fünf wichtigsten Elemente fuer einen guten Prompt
1. Kamerabewegung
Beispiele:
- slow push in
- gentle pan left
- handheld drift
- low angle dolly forward
2. Bewegung des Motivs
Was passiert mit Person, Objekt oder Szene?
- dreht sich ein Produkt?
- schaut eine Person auf?
- bewegt sich Stoff oder Haar?
- beginnt Rauch zu treiben?
3. Veraenderung in der Umgebung
Oft wirkt ein Shot besser, wenn auch die Umgebung lebt:
- Licht flackert
- Nebel zieht
- Staub bewegt sich
- Wasser reflektiert
4. Stimmung und Stil
Hier reicht oft ein kurzer Zusatz:
- cinematic
- dreamy
- premium commercial
- tense
- intimate
5. Zurueckhaltung
Je kuerzer und fokussierter die Aufgabe, desto besser. Zu viele konkurrierende Ziele schwächen die Bewegung.
Eine einfache Prompt-Formel
Du kannst mit diesem Muster starten:
Motiv + Bewegungsaktion + Kamerabewegung + Umgebungsreaktion + Mood
Zum Beispiel:
- "The model slowly turns toward camera while the camera pushes in, soft curtain movement, intimate cinematic mood."
- "The perfume bottle rotates slightly as the camera arcs right, reflective highlights shift across the glass, premium ad look."
- "The city street comes alive with drifting rain and light reflections while the camera glides forward, moody night atmosphere."
Was du vermeiden solltest
Fehler 1: Den ganzen Frame neu beschreiben
Wenn Start- und Endbild das Subjekt bereits klar zeigen, bringt es wenig, jedes Detail noch einmal aufzuzählen. Das kostet eher Fokus.
Fehler 2: Zu viele Aktionen verlangen
"She turns, walks, smiles, grabs the door, camera cranes up, fireworks explode, sky changes color."
Das ist fuer einen kurzen Shot meist zu viel.
Fehler 3: Keine klare Bewegungsrichtung
Wenn nicht klar ist, was sich wie veraendern soll, bleibt das Ergebnis oft diffus oder statisch.
Was, wenn du nur einen Startframe nutzt?
Auch dann hilft dieselbe Logik. Nur liegt das Zielbild dann nicht explizit vor.
Der Prompt muss also etwas mehr Orientierung liefern:
- wohin die Bewegung geht
- wie sich Subjekt und Kamera verhalten
- wie Licht oder Raum reagieren
Der Fokus bleibt aber derselbe: Bewegung, nicht Wiederholung des sichtbaren Bildes.
Eine kurze Checkliste vor dem Rendern
- Beschreibt der Prompt die Bewegung zwischen den Frames?
- Ist die Kamera klar geführt?
- Gibt es nur eine Hauptaktion statt vieler Nebenaktionen?
- Passt die Stimmung zum Motiv?
- Ist der Shot kurz genug gedacht?
Fazit
Bei Start- und Endframes ist der beste Prompt selten der laengste. Der beste Prompt beschreibt praezise, wie sich die Szene von A nach B bewegt.
Wenn du diesen Modus wie eine kleine Regieanweisung behandelst, werden die Resultate deutlich kontrollierter.