Seit zwei Jahrzehnten ist YouTube Bühne, Spiegel und Treiber des kulturellen Zeitgeists. Mit dem Aufstieg generativer KI entstehen neue Formen des Storytellings, neue Formate – und neue Spielregeln für Marken. Im Gespräch erklären Christopher Völpel, Head of Customer Solutions Engineering Central Europe bei Google, und Henry Bose, Senior Creative Solution Expert bei Google, wie sich Content-Produktion, kreative Prozesse und Markenkommunikation auf YouTube durch KI verändern – und warum dabei nicht nur Technik, sondern vor allem Haltung zählt.
Angesichts rasanter technologischer Entwicklungen fragen sich viele: Wie sieht die Zukunft des kreativen Schaffens auf YouTube aus? Kann die Plattform ihre Rolle auch künftig in Zeiten von KI behaupten?
Henry: YouTube war nie nur wegen technischer Perfektion relevant, sondern weil es Menschen eine Bühne für originelle, einzigartige Ideen gibt. Was einst mit einem verwackelten Zoo-Video begann, ist heute eine Plattform, die vom Schnappschuss bis zur Studioproduktion alles abdeckt. Generative KI verstärkt diese Dynamik. Wenn jede*r professionell wirkenden Content erstellen kann, rückt die menschliche Kuration und die kreative Kraft in den Vordergrund. Die entscheidende Frage ist nicht mehr, ob man etwas produzieren kann, sondern was man zu sagen hat. KI wird zum Werkzeug, das den Sprung von der ersten Skizze zum fertigen Werk beschleunigt.
Christopher: Ich sehe das genauso. Generative KI kann ein Multiplikator von Kreativität auf YouTube sein, weil sie die Einstiegshürden für Videoproduktion senkt. Mehr Menschen können Ideen testen, verfeinern und umsetzen – in einem Bruchteil der Zeit. Das fördert eine neue Form von Agilität. Diese Demokratisierung des Produktionswerts wird eine neue Welle an Inhalten freisetzen. Denn Creatorinnen und Creator können Trends schneller aufgreifen, weiterdenken oder selbst setzen.
YouTube hat im Laufe der Jahre eine Vielzahl von Videoformaten hervorgebracht – von klassischen Vlogs bis hin zu Kurzformaten wie Shorts. Wie befeuert generative KI neue Content-Formate und Storytelling-Ansätze auf YouTube?
Henry: Die wahre Magie entsteht dort, wo KI nicht nur Werkzeug ist, sondern auch kreativer Sparringspartner. Wir sehen erste Experimente einer „synthetischen Authentizität“: Vollständig generierte Charaktere wie Bigfoot treten als Vlogger auf und unterhalten ein Publikum, als wären sie real. Das eröffnet neue Wege für Storytelling. Statt nur die Realität abzubilden, können Creatorinnen und Creator mit KI ganze Welten erschaffen – mit der Unmittelbarkeit eines Vlogs.
Christopher: Generative KI beschleunigt vor allem die Umsetzung von Ideen. Was früher nur einem professionellen Animationsteam vorbehalten war, kann heute ein einzelner Mensch in Stunden prototypisch umsetzen. Das führt zu mehr Experimenten wie interaktiven Erzählungen oder Content-Varianten mit unterschiedlichen Protagonist*innen. So wird Storytelling nicht nur experimenteller, sondern auch personalisierbarer. YouTube könnte damit zur Heimat völlig neuer Genres werden.
Schon jetzt ist YouTube das Zuhause von unzähligen leidenschaftlichen Fans und erreicht allein in Deutschland über alle Screens hinweg mehr als 56 Millionen Menschen.1 Wie nutzen Marken bereits heute generative KI, um die riesige YouTube-Zielgruppe zu erreichen und zu binden?
Christopher: Marken setzen generative KI vor allem zur Effizienzsteigerung ein. Statt einer einzelnen Werbespot-Variante entstehen innerhalb kürzester Zeit viele Versionen – mit angepassten Bildern, Texten oder Sprecher*innen. Das ermöglicht ein bisher unerreichtes Maß an Personalisierung und A/B-Testing. Am Ende geht es darum, YouTubes enorme Reichweite mit technologisch optimierten, hochrelevanten Inhalten auszuspielen, um Kampagnen performanter zu machen und Zuschauende ganz persönlich zu erreichen.
Henry: Marken können mit generativer KI nicht nur mehr Inhalte produzieren – sondern zusammen mit ihren Agenturpartner*innen bessere, kulturell relevante Formate entwickeln, die näher am Puls der Zeit sind. Neben ressourcenintensiven Produktionen lassen sich Trends mithilfe generativer KI schneller aufgreifen und Inhalte schaffen, die sich nahtlos in die Welt der Creatorinnen und Creator auf YouTube einfügen. Marken können so schneller und einfacher den Zeitgeist aufgreifen und aktiver Teil davon werden.
Was heißt das konkret für die praktische Umsetzung? Welche Tools und Plattformen gibt es aktuell, um generative KI in die Videoproduktion auf YouTube zu integrieren – insbesondere bei Marken und Agenturen?
Henry: Viele Marken und Agenturen setzen KI-Tools bereits über die gesamte Produktionskette hinweg ein. NotebookLM für Recherche, Gemini fürs Briefing, Whisk für erste Visuals, Veo für Prototypen von Filmen.
Christopher: Es entstehen multimodale Workflows. Ein Prozess kann mit Gemini starten, über Imagen 4 zur Bildgenerierung führen und mit Veo 3 ein vollständiges Video erzeugen. Bestehender Content wird mit ViGenAiR analysiert und neu arrangiert. Tools wie Flow oder Shorts-Funktionen beschleunigen Produktion und Skalierung. Marken wie Taxfix oder Telekom zeigen, wie das schon heute funktioniert. Die Deutsche Telekom etwa nutzte generative KI, um für einen Produkt-Launch gleich 15 individuelle Video-Assets zu entwickeln – maßgeschneidert für unterschiedliche Zielgruppen. Und Taxfix nutzt als AI-first-Unternehmen inzwischen Veo 3, um TV-Spots für Connected TV zu produzieren.
Video ansehen
Das erste mit Veo 3 generierte Video von Taxfix
Was unterscheidet KI-gestützte Workflows von klassischen Produktionsprozessen?
Henry: Der wichtigste Tipp ist eine mentale Umstellung. Klassische Workflows sind linear: Jedes Gewerk folgt dem nächsten Schritt. Aber mit generativer KI ist man in einem ständigen Dialog mit dem Tool. Man kuratiert, wählt aus, verfeinert. Es geht darum, aus vielen generierten Optionen das Beste zu machen. Dafür braucht es eine klare kreative Vision, Offenheit für das Überraschende und eine hohe Flexibilität sowie Vertrauen zwischen Marke und Agentur.
Christopher: Im Marketing ergeben sich dadurch Chancen für Inhalte, bei denen sich eine klassische Produktion nie gelohnt hätte. Der Schlüssel zum Erfolg jedoch liegt in der bewussten Prozessgestaltung: Unternehmen sollten klar definieren, welche Qualität für welchen Use Case „gut genug“ ist. Es geht nicht darum, alles perfekt zu kontrollieren, sondern bewusst Geschwindigkeit und kreative Vielfalt zu ermöglichen. Der kulturelle Wandel ist dabei fast wichtiger als die Toolauswahl – denn nur wer bereit ist, loszulassen und zu testen, wird das Potenzial generativer Workflows wirklich ausschöpfen.
Wo Potenzial ist, ergeben sich auch Herausforderungen. Welche Herausforderungen bringt KI mit sich – und wie lassen sich Vertrauen und Wirkung sicherstellen?
Christopher: Menschen merken, wenn Inhalte generisch oder lieblos wirken. Aber das bedeutet nicht, dass KI per se ein Qualitätsrisiko darstellt – der kreative Aufwand verlagert sich nur: weg von der reinen Produktion, hin zur konzeptionellen Präzision. Und was das Vertrauen angeht: Die bisherigen Anforderungen an den Wahrheitsgehalt von Inhalten gelten selbstverständlich weiter. Sie werden aber ergänzt um eine neue Verantwortung: Realistisch wirkende KI-generierte Inhalte müssen klar kontextualisiert und gekennzeichnet werden. YouTube führt aktuell entsprechende Funktionen ein, bei denen Creatorinnen und Creator beim Upload angeben müssen, wenn Inhalte synthetisch verändert oder generiert wurden. Das schützt die Community, ohne den kreativen Spielraum einzuschränken.
Henry: Vollkommen richtig. Die größte Herausforderung ist nicht die Technik, sondern die kreative Differenzierung. Wenn KI-Tools die Produktionshürden senken, zählt die Idee umso mehr. Die entscheidende Frage lautet daher: Wofür stehen wir als Marke? Welche Botschaft verfolgen wir – und wie konsequent setzen wir sie um? Strategie und Briefing werden wichtiger denn je. Noch eine Ergänzung zum Thema Vertrauen: Die Veo 3 Challenge beim YouTube Festival ist ein perfektes Beispiel. Hier wird der Einsatz von KI nicht versteckt, sondern zum Kern eines kreativen Wettbewerbs gemacht. Marken konnten ihre Ideen einreichen und zusammen mit der Filmproduktion 27km haben wir Veo 3 genutzt, um drei der Ideen umzusetzen. Diese wiederum werden beim YouTube Festival von der Audience gevotet und ein Gewinner gekürt. Diese positive und transparente Kommunikation schafft hoffentlich Vertrauen und fördert einen aktiven Umgang mit der Innovation.
Für innovative, experimentierfreudige Creatorinnen und Creator ist YouTube eine Plattform, auf der sie ihre Leidenschaft zum Beruf machen. Wie kann generative KI gerade neuen oder aufstrebenden Creator*innen helfen, schneller zu wachsen, ihre Produktion zu skalieren und sich in einem umkämpften Umfeld von der Masse abzuheben?
Henry: Generative KI ersetzt keine Kreativität, sie verstärkt sie. Für Creatorinnen und Creator ist sie wie ein neues Werkzeug im Kasten. Sie hilft dabei, Ideen greifbar zu machen, die früher an Budget oder Ressourcen gescheitert wären. Ob Visuals, Storyboards oder erste Videos: All das lässt sich heute mit KI schneller und einfacher umsetzen. So bleibt mehr Raum für das, worauf es wirklich ankommt: eine starke Erzählhaltung und ein tiefes Verständnis für die eigene Community. Wer klar weiß, was er erzählen will, kann mit KI deutlich agiler und wirkungsvoller arbeiten.
Christopher: Im Moment steht klar das „Enablement“ im Fokus: KI senkt die Einstiegshürden massiv. Langfristig wird KI auch eine zentrale Rolle bei Personalisierung und Reichweitenerweiterung spielen, zum Beispiel durch automatische, qualitativ hochwertige Übersetzungen oder barrierefreie Features wie Untertitel und Bildbeschreibungen. So wird Content nicht nur effizienter produziert, sondern auch inklusiver und globaler gedacht.
Wir haben jetzt viel über kreative Produktion mithilfe von KI auf YouTube gesprochen. Wie sieht es mit der KI-gestützten Rentabilität aus? Laut Nielsen erzielen Marken mit Google AI auf YouTube einen um 33 Prozent höheren ROI im Vergleich zum TV.2 Wie genau kann generative KI dabei helfen, diese Wirkung weiter zu steigern?
Henry: Einer der Hauptgründe für YouTubes starke ROI-Performance sind die KI-basierten Kampagnenformate. Sie ermöglichen es Marken, zur richtigen Zeit am richtigen Ort mit der richtigen Botschaft sichtbar zu sein. Dabei ist das „Creative“ entscheidend – vor allem in seiner Vielfalt. Je mehr unterschiedliche Assets eine Kampagne zur Verfügung hat – ob in Länge, Format, Stil oder Botschaft –, desto besser kann das System lernen und personalisieren. Mehr Creative bedeutet mehr Wirkung. Und genau hier ist generative KI ein Gamechanger: Sie macht es möglich, in kürzester Zeit ein ganzes Set an Varianten zu produzieren – und damit den Kampagnenerfolg signifikant zu steigern.
Generative KI verbessert das Investment, weil sie die Produktionskosten durch Geschwindigkeit und Flexibilität senkt.
Christopher: Wir sollten den ROI aus zwei Richtungen betrachten: Generative KI verbessert das Investment, weil sie die Produktionskosten durch Geschwindigkeit und Flexibilität senkt. Über Rapid Prototyping lassen sich Ideen schnell testen und optimieren – oder auch verwerfen. Gleichzeitig ermöglicht die Kombination aus bestehenden Assets und generierten Szenen sogenannte hybride Videos. Eine Marke kann zum Beispiel hochwertig produzierte Produktshots oder Intro-Elemente mit KI-generierten Szenen anreichern – etwa via Image-to-Video oder Text-to-Video. Das spart Zeit, senkt Kosten und erhöht die Varianz, ohne die Markenidentität zu verwässern. Das Ergebnis: mehr Relevanz, schneller am Markt – und damit ein deutlich höherer Return. Die Telekom liefert mit ihrer „Unlimited“-Kampagne, die aus Veo-generierten Assets besteht, ein tolles Beispiel.
In die Zukunft gedacht: Wie wird generative KI YouTube in den nächsten fünf bis zehn Jahren verändern? Und welche Rolle spielen dabei menschliche Kreativität, Intuition und Pioniergeist?
Henry: Ich glaube, generative KI wird den Mut zur Kreativität auf YouTube neu entfachen. Im Wettbewerb um Aufmerksamkeit werden Marken die neuen technologischen Möglichkeiten für sich nutzen, um aus gewohnten Mustern auszubrechen. Statt auf Nummer sicher zu gehen, werden sie experimentierfreudiger. Für uns als Zuschauerinnen und Zuschauer bedeutet das hoffentlich das Ende der allzu oft leicht überspringbaren, formelhaften Werbung. Stattdessen werden wir mehr unterhaltsame und überraschende Markeninhalte sehen, die uns fesseln und einen bleibenden Eindruck hinterlassen. In dieser neuen Ära rückt die menschliche Kreativität nicht in den Hintergrund – sie wird zum entscheidenden Differenzierungsmerkmal. Das Herzstück bleibt eine gute Idee.
Christopher: Ich glaube, dass teilautomatisierte Workflows die Zukunft sind. Dabei stellen Marken ein Hero-Asset zur Verfügung, aus dem mithilfe von KI eine Vielzahl von personalisierten und auf die jeweilige Zielgruppe zugeschnittenen Assets erstellt werden. Marken, die diese Technologie adaptieren, werden in der Lage sein, nahezu in Echtzeit mit relevantem Video-Content auf aktuelle Ereignisse oder Trends zu reagieren. Stellt euch vor, eine Marke kann binnen Stunden eine professionelle Videokampagne zu einem kulturellen Moment erstellen. Diese Agilität verändert die Art, wie Marken auf YouTube kommunizieren, fundamental – sie gewinnen Tempo, Relevanz und Nähe zur Community. Entscheidend wird dabei eine neue Denkweise sein. Marken, Kreative und Creator*innen werden lernen müssen, iterativ zu arbeiten und an den richtigen Stellen die Kontrolle abzugeben, um Geschwindigkeit zu gewinnen. So können völlig neue Lösungen entstehen, die vorher undenkbar waren.