Stell dir vor, du eröffnest einen Bauernhof für Dinosaurier. Oder du wirst zur megacoolen Mars-Influencerin. Was vor Kurzem noch nach einem sechsstelligen Marketingbudget, einem riesigen Filmteam und wochenlanger Postproduktion klang, ist heute dank KI-Tools wie Veo, der Video-KI von Google, nur noch ein paar Klicks entfernt.
Deutsche Unternehmen wie Taxfix und die Deutsche Telekom haben das Potenzial von Veo erkannt und nutzen es bereits für die Erstellung ihrer Creatives. Doch wie genau funktioniert das in der Praxis? Wie können Marken und Agenturen überzeugende Ergebnisse erzielen und wie übersetzt man diese anschließend in eine performante YouTube-Strategie?
Dieser Leitfaden liefert die Antworten und zeigt, wie der Prozess in der Praxis funktioniert.
Dialog statt Knopfdruck: der neue kreative Prozess
Der größte Irrglaube ist, dass KI eine „One-Click-Solution“ sei. Man drückt einen Knopf und heraus kommt ein fertiger Werbespot. Die Realität sieht anders aus: „Der Prozess ist nicht linear, sondern vielmehr ein ständiges Hin und Her zwischen den einzelnen Schritten”, erklärt Henry Bose, Senior Creative Solution Expert bei Google. „Mit generativer KI ist man in einem ständigen Dialog mit dem Tool. Man kuratiert, wählt aus, verfeinert.“
Dieser Dialog zwischen Mensch und KI macht die menschliche Expertise nicht weniger wertvoll. Im Gegenteil: Die besten Ergebnisse entstehen, wenn menschliche Kreativität die KI präzise anleitet. „Man braucht das Wissen, was einen guten Shot ausmacht, um der KI sagen zu können, was sie produzieren soll“, sagt Bose. Allerdings verändert sich die Rolle: weg vom klassischen Regisseur am Set hin zu einem Creative Lead, der eine Vision hat und diese in die Sprache der KI übersetzt.
Schritt für Schritt zum perfekten KI-Video
Wie entsteht also ein professionelles Video, das zu 100 % KI-generiert ist? Malte Schlieker und Malte Paulsen von dem Creative Content Studio 27km geben Einblick in ihren praxiserprobten Workflow:
Schritt 1: die Key Visuals definieren und erstellen
Anstatt direkt ein Video zu prompten, wird zuerst das perfekte Standbild erschaffen. Mit Tools wie Imagen oder Nano Banana werden Charaktere, Stil, Location und Lichtstimmung definiert. Wie sieht unsere Hauptdarstellerin aus? Welche Atmosphäre soll die Szene haben? All das wird hier festgelegt.
Profi-Tipp: Konsistenz ist die größte Herausforderung. Um sie über mehrere Szenen hinweg zu wahren, helfen markante, wiedererkennbare Charaktere (z. B. mit besonderer Haarfarbe) oder nicht menschliche Figuren.
Schritt 2: Bildoptimierung
Das erstellte Bild wird qualitativ hochskaliert und in Programmen wie Photoshop überarbeitet. Hat eine Figur sechs Finger? Steht im Hintergrund etwas, das nicht passt? „Das sind alles Dinge, die sind wahnsinnig aufwendig, wenn wir sie im Video korrigieren müssten, deswegen machen wir es im Bild“, erklärt Paulsen. Dieser Schritt ist also mehr als reine Fehlerkorrektur, er legt die qualitative Grundlage für die spätere Animation und sorgt damit für ein besseres Endergebnis.
Schritt 3: Animieren mit Veo
Erst jetzt wird das optimierte Bild in Veo geladen. Da das Visuelle bereits definiert ist, konzentriert sich der Prompt nur noch auf die Handlung, die Kamerabewegung und den Dialog. Dieser Fokus spart enorm Zeit und erlaubt es, deutlich schneller verschiedene kreative Visionen zu testen, ohne jedes Mal das gesamte Setting neu beschreiben zu müssen.
Schritt 4: Iteration und Schnitt
Jetzt beginnt der iterative Kreislauf: Dieser Vorgang wird nun so oft wiederholt, bis man zufrieden ist. Dabei werden generierte Shots parallel immer wieder in den Schnitt eingefügt, um die Dynamik des Films zu prüfen: Funktioniert der Rhythmus? Passt die Szene ins Gesamtbild?
Profi-Tipp: Falls die Konsistenz zwischen zwei Szenen leicht bricht, hilft ein bewährter Schnitt-Trick: Das Einfügen von B-Roll-Material (z. B. eine Nahaufnahme eines Objekts) zwischen die Clips kaschiert den Bruch und sorgt beim Betrachter für eine „gefühlte Konsistenz“.
Schritt 5: Postproduktion
Am Ende steht die klassische Veredelung: Farbkorrektur (Grading), Sounddesign und das Beheben letzter kleiner KI-Fehler.
Prompting für Profis: die Kunst, die KI zu dirigieren
Das Herzstück der KI-Videoproduktion ist der Prompt. Hier gilt eine einfache Grundregel: Je detaillierter der Prompt, desto besser das Ergebnis. Was du nicht definierst, entscheidet die KI für dich.
Ein guter Prompt enthält idealerweise folgende Elemente:
- Subjekt: Wer oder was ist zu sehen? (Beispiel: eine ältere Frau mit freundlichen Augen und silbernem Haar)
- Szene und Kontext: Wo spielt die Szene? (Beispiel: in einer gemütlichen, sonnendurchfluteten Küche)
- Handlung: Was passiert genau? (Beispiel: Sie rührt langsam in einer Tasse Tee)
- Komposition und Kamerabewegung: Wie ist das Bild aufgebaut? (Beispiel: Nahaufnahme, die Kamera zoomt langsam heraus)
- Visueller Stil: Wie soll es aussehen? (Beispiel: kinematografisch, warme Farben, weiches Licht)
- Audio: Was ist zu hören? (Beispiel: leise Hintergrundmusik, das Klirren des Löffels)
Profi-Tipp: Sollte die KI einen Prompt nicht verstehen, hilft das „JSON Prompting“. Bei dieser Technik wird der Befehl in ein hochstrukturiertes, textbasiertes Format umgewandelt. Bildlich gesprochen: Statt einer vagen Idee erhält die KI eine exakte Einkaufsliste mit klaren Kategorien und Unterpunkten. Dieser strukturierte Ansatz kann helfen, die Kontrolle zurückzugewinnen, wenn die KI auf normale Anweisungen nicht wie gewünscht reagiert.
Noch mehr Tipps und Tricks der Profis gibt es im Veo Creative Bootcamp. Die Aufzeichnung der Session findest du hier.
Mit Veo YouTube erobern: vom Asset zur Strategie
Der kreative Prozess ist gemeistert und das Video-Asset ist produziert. Und nun? Wie lassen sich diese Assets strategisch einsetzen, um konkrete Performance-Ziele zu erreichen? Unternehmen wie die Deutsche Telekom und Taxfix machen es vor: Sie nutzen Veo bereits gezielt, um wirkungsvolle Assets für ihre YouTube-Kampagnen zu erstellen.
Die Deutsche Telekom nutzte Veo beispielsweise, um ihre „Unlimited“-Kampagne zu skalieren. Statt nur eines TV-Spots wurden Dutzende KI-generierte Vignetten erstellt, die dasselbe Kernversprechen – „Die schönsten Dinge sollten kein Ende haben“ – für völlig unterschiedliche YouTube-Zielgruppen übersetzten, vom Heimwerker bis zum Fast-Food-Liebhaber.
Taxfix hingegen nutzt die Geschwindigkeit von Veo, um extrem schnell auf kulturelle Momente zu reagieren und relevante Creatives zu erstellen, die sich nativ in den YouTube-Feed einfügen.
Diese Beispiele zeigen die strategischen Vorteile von Veo für YouTube-Marketer:
- Hyperpersonalisierung: Marken können im großen Stil maßgeschneiderte Creatives für verschiedene Zielgruppen erstellen.
- Reaktionsschnelligkeit: Die Produktion passt sich der Geschwindigkeit von Trends und dem aktuellen Zeitgeist an, nicht umgekehrt.
- Kreativtests im großen Stil: Veo erleichtert es, verschiedene Botschaften, visuelle Stile oder Hooks gegeneinander zu testen, um datengestützt herauszufinden, was wirklich wirkt.
Veo ist damit nicht nur ein Produktionswerkzeug. Es ist ein strategischer Enabler, der es Kreativen erlaubt, ihre Visionen ohne die alten Budget- und Zeitgrenzen auf YouTube zu skalieren und ihre Performance-Ziele zu erreichen.
Video ansehen
Um die Leitidee „Die schönsten Dinge sollten kein Ende haben“ als Video zu realisieren, setzte die Deutsche Telekom auf Veo.
Fazit: die Kreativität neu dirigieren
KI-Tools wie Veo eröffnen Marketern und Kreativschaffenden ein Universum an neuen kreativen Möglichkeiten. Wie die Praxis jedoch zeigt, ist der Erfolg keine Frage eines „One-Click-Befehls“.
Entscheidend ist vielmehr, einen neuen Prozess zu meistern, der auf dem iterativen Dialog zwischen Mensch und KI basiert. Es braucht die Vision des „Creative Lead“, um die Technologie meisterhaft zu dirigieren, und den Mut, traditionelle, lineare Arbeitsabläufe über Bord zu werfen.
Unternehmen und Marken, die sich diesen Wandels annehmen und die neuen Werkzeuge nicht als Ersatz, sondern als Partner für ihre Kreativität begreifen, werden in der Lage sein, ihre Geschichten auf YouTube agiler, persönlicher und wirkungsvoller zu erzählen als je zuvor.