Kennen Sie sich mit KI-Videos aus? Falls nicht – keine Sorge, damit sind Sie nicht allein. In den vergangenen zwanzig Jahren hat die Marketing-Welt eine digitale Revolution erlebt. Vom klassischen Printmedium hin zu einer Vielzahl von Online-Plattformen – Marketers sind heutzutage in einem viel größeren, komplexeren, sich ständig verändernden Handlungsfeld tätig. Dynamic Content hat sein statisches Gegenstück schnell hinter sich gelassen. Anders ausgedrückt: „Visual is the new king” und setzt seinen Siegeszug fort.

 

Video kills the Text Star: die Zunahme von Video-Content

Aktuelle Trends zeigen, dass die Aufmerksamkeitsspanne nachlässt und Menschen Inhalte lieber über Videos statt in Textform aufnehmen. Dementsprechend sind in den sich ständig weiterentwickelnden sozialen Medien, die wir beruflich wie privat nutzen, immer mehr visuell aufbereitete Informationen zu finden. Im Jahr 2022 werden weltweit 82 % des gesamten Internet Traffics von Privathaushalten auf den Konsum von Video-Content zurückzuführen sein.

Was bedeutet das für hochwertigen Text-Content wie Produktinformationen, Schulungsmaterialien, Bedienungsanleitungen oder Broschüren, die bereits angeboten werden? Heißt das für Unternehmen nun, dass sie sehr viel Zeit, Geld und Ressourcen aufwenden müssen, um aus der eigenen PowerPoint-Schulungspräsentation ein fünfminütiges Video zu machen? Zum Glück lautet die Antwort nein.

Wir möchten Ihnen Synthesia vorstellen. Das Unternehmen bietet eine SaaS-Lösung für KI-gestützte Videoproduktion in personalisierter und mehrsprachiger Form an. Damit ist es führend in diesem Bereich. Wie erzeugt nun diese KI-gestützte Lösung Videos quasi aus dem Nichts? Genau darum geht es in der kürzlich erschienenen Folge von SlaterPod, in der Victor Riparbelli, CEO und Mitbegründer von Synthesia, mehr über die zukunftsweisende Technologie seines Unternehmens erzählt.

Die Software-Lösung nutzt im Wesentlichen fortgeschrittene KI und Deep Learning, um Avatare Text-Content in Videos sprechen zu lassen. Diese Avatare sind entweder generisch menschlich oder können auf Basis real existierender Personen erstellt werden. Das Beste dabei: Die gesprochenen Inhalte können innerhalb kurzer Zeit mehrsprachig mittels maschineller Übersetzungstechnologie erzeugt werden. So ist diese Lösung für jeden erschwinglich, zugänglich und skalierbar.

Text to Speech: Mehrwerte für den B2C- und B2B-Markt

Riparbelli betont dabei, dass die Technologie von Synthesia die traditionelle Videoproduktion nicht ersetzen wird, da diese ihre ganz eigenen Anwendungsbereiche und Nutzen hat. Synthesias innovative Lösung hingegen befähigt Unternehmen vielmehr dazu, ihre Textinhalte (ob bereits vorhanden oder neu) Stück für Stück mittels KI in Video-Content umzuwandeln.

Kostengünstige Optionen zur Produktion von Video-Content wie die von Synthesia eignen sich besonders gut für B2C- und B2B-Firmen mit globaler Ausrichtung. Im B2C-Bereich hat das Unternehmen erfolgreich mit der PepsiCo-Marke Lay’s, UNIT9 und 180 Amsterdam zusammengearbeitet, um ein personalisiertes Videoerlebnis zu schaffen. Die innovative und interaktive weltweite Kampagne mit dem Fußballstar Lionel Messi, der acht verschiedene Sprachen „spricht”, gewann im Juni dieses Jahres sogar einen Cannes Lion Award.

Content, der für interne wie externe Zwecke auf globaler Ebene produziert wird, muss einerseits seine Botschaft laut und deutlich in zahlreichen Sprachen an viele unterschiedliche Zielgruppen übermitteln. Andererseits muss der Content in einem schnell und leicht konsumierbaren Format erstellt werden. Eine wirtschaftlich tragfähige Lösung zu finden, die diesen anspruchsvollen Anforderungen gerecht wird, ist also unabdingbar. Das erklärt auch, warum diese New-Age-Technologie der KI-Videos in den letzten Jahren ein solch rasantes Wachstum im B2B-Segment verzeichnet.

Sprachliche Kompetenz und KI: die Verbindung zwischen Mensch und Maschine

Wird Deep Learning angesichts der stetig zunehmenden KI-gestützten Content-Erstellung die Menschen eines Tages ersetzen? Laut Riparbelli werden die Menschen Seite an Seite mit KI arbeiten. Das betrifft vor allem mehrsprachigen Content. Für Synthesia sind Kooperationen mit Sprachdienstleistern (Language Service Provider, LSP) deshalb ein wesentlicher Bestandteil der Unternehmenstätigkeit.

Es besteht eine Synergie zwischen Menschen und Maschinen, die nicht außer Acht gelassen werden darf. Jeglicher KI-generierte Content, der für eine mehrsprachige Zielgruppe – ob als Text oder Video – erstellt wird, muss kulturellen und regionalen Unterschieden Rechnung tragen. Darum spielen Adaption und Lokalisierung solch eine wichtige Rolle bei einer Übersetzung.

Ein Rohdiamant muss erst geschliffen und poliert werden, damit er glänzt. Ein passender Vergleich für die Tätigkeit menschlicher Post-Editoren, die durch ihre äußerst wichtige sprachliche Bearbeitung für einen qualitativ hochwertigen Content sorgen, ob er nun automatisch erzeugt oder selbst erstellt wurde. Ihr letzter Schliff garantiert, dass der Content seine angestrebte Zielgruppe wirklich überwältigt – in allen Sprachen und über sämtliche Zielmärkte hinweg.