Bessere Prompts für KI-Videogenerierung mit Start- und Endframes schreiben

So formulierst du klare Prompts für DojoClip AI Video Generation mit Startframe, optionalem Endframe und besserer Bewegungsführung.

Pansa Legrand12. März 2026how to use

Viele Einsteiger schreiben fuer Start- und Endframes so, als wuerden sie einen kompletten Trailer beschreiben. Genau das fuehrt oft zu schwachen Ergebnissen.

Im Modus mit Startframe und optionalem Endframe geht es nicht darum, alles im Bild noch einmal auszuerzaehlen. Es geht darum, die Bewegung zwischen den Bildern klar zu beschreiben.

Die einfachste Denkweise ist:

Der Startframe ist der Anfang
Der Endframe ist das Ziel
Der Prompt ist die Bewegung dazwischen

Warum dieser Modus anders funktioniert

Wenn du beide Frames vorgibst, hat das Modell bereits viel visuelle Information:

Motiv
Komposition
Licht
grobe Richtung der Szene

Der Prompt sollte deshalb vor allem erklaeren:

was sich bewegt
wie sich die Kamera bewegt
wie schnell oder ruhig der Shot wirkt
welches Gefuehl die Bewegung haben soll

Die fünf wichtigsten Elemente fuer einen guten Prompt

1. Kamerabewegung

Beispiele:

slow push in
gentle pan left
handheld drift
low angle dolly forward

2. Bewegung des Motivs

Was passiert mit Person, Objekt oder Szene?

dreht sich ein Produkt?
schaut eine Person auf?
bewegt sich Stoff oder Haar?
beginnt Rauch zu treiben?

3. Veraenderung in der Umgebung

Oft wirkt ein Shot besser, wenn auch die Umgebung lebt:

Licht flackert
Nebel zieht
Staub bewegt sich
Wasser reflektiert

4. Stimmung und Stil

Hier reicht oft ein kurzer Zusatz:

cinematic
dreamy
premium commercial
tense
intimate

5. Zurueckhaltung

Je kuerzer und fokussierter die Aufgabe, desto besser. Zu viele konkurrierende Ziele schwächen die Bewegung.

Eine einfache Prompt-Formel

Du kannst mit diesem Muster starten:

Motiv + Bewegungsaktion + Kamerabewegung + Umgebungsreaktion + Mood

Zum Beispiel:

"The model slowly turns toward camera while the camera pushes in, soft curtain movement, intimate cinematic mood."
"The perfume bottle rotates slightly as the camera arcs right, reflective highlights shift across the glass, premium ad look."
"The city street comes alive with drifting rain and light reflections while the camera glides forward, moody night atmosphere."

Was du vermeiden solltest

Fehler 1: Den ganzen Frame neu beschreiben

Wenn Start- und Endbild das Subjekt bereits klar zeigen, bringt es wenig, jedes Detail noch einmal aufzuzählen. Das kostet eher Fokus.

Fehler 2: Zu viele Aktionen verlangen

"She turns, walks, smiles, grabs the door, camera cranes up, fireworks explode, sky changes color."

Das ist fuer einen kurzen Shot meist zu viel.

Fehler 3: Keine klare Bewegungsrichtung

Wenn nicht klar ist, was sich wie veraendern soll, bleibt das Ergebnis oft diffus oder statisch.

Was, wenn du nur einen Startframe nutzt?

Auch dann hilft dieselbe Logik. Nur liegt das Zielbild dann nicht explizit vor.

Der Prompt muss also etwas mehr Orientierung liefern:

wohin die Bewegung geht
wie sich Subjekt und Kamera verhalten
wie Licht oder Raum reagieren

Der Fokus bleibt aber derselbe: Bewegung, nicht Wiederholung des sichtbaren Bildes.

Eine kurze Checkliste vor dem Rendern

Beschreibt der Prompt die Bewegung zwischen den Frames?
Ist die Kamera klar geführt?
Gibt es nur eine Hauptaktion statt vieler Nebenaktionen?
Passt die Stimmung zum Motiv?
Ist der Shot kurz genug gedacht?

Fazit

Bei Start- und Endframes ist der beste Prompt selten der laengste. Der beste Prompt beschreibt praezise, wie sich die Szene von A nach B bewegt.

Wenn du diesen Modus wie eine kleine Regieanweisung behandelst, werden die Resultate deutlich kontrollierter.

KI-Video mit Start- und Endframes in DojoClip ausprobieren