Technik

Video Avatare: Die Zukunft der digitalen Kommunikation

Definition und Relevanz

Ein Video-Avatar simuliert menschliche Kommunikation und nimmt die Rolle einer digitalen Figur ein. Video Avatare kombinieren Gestik, Sprache und Mimik. Damit wird die Begegnung mit einem Video Avatar zu einem interaktiven Erlebnis der fortgeschrittenen Digitalisierung.

Aktuelle Entwicklung

Im Teilbereich der KI – dem Deep Learning – wird es möglich, aus großen Datenmengen und Netzwerken zu lernen. Wird ein Video-Avatar mit den Leistungen der KI verknüpft, bedeutet das, dass die KI realistische Avatare erzeugen kann, die in Echtzeit reagieren können und beispielsweise eine Unterhaltung lebhaft und authentisch führen – wie mit einem echten Menschen. Diese Entwicklung der KI in Verbindung mit einem Video-Avatar begegnet uns immer häufiger im Alltag, im Beruf oder den Medien – auch inzwischen auf Social Media Accounts.

Wir möchten im Folgenden eine Übersicht schaffen, die die Technik und die Einsatzmöglichkeiten von Video-Avatare näherbringen und gehen im Anschluss auf Risiken und Chancen zu diesem technischen Sprung ein.

Grundlagen von Video Avataren

Was ist ein Video Avatar?

Ein Video Avatar ist eine virtuelle Figur, die sich in einem Video bewegt und spricht. Dabei kann die Erscheinung realistisch wie stilistische dargestellt werden.

Unterscheidung nach Darstellung

Fotorealistische Avatare erwecken den Eindruck eines echten Menschen, während stilisierte Avatare als Figuren erscheinen, wie wir sie beispielsweise aus Comics oder dem Anime-Stil kennen.

2D vs. 3D

Bei einfachen Anwendungen wird oft eine zweidimensionale Darstellung (flache Darstellung) genutzt. Etwas aufwendiger in der Produktion sind dreidimensionale Figuren, die aber immersiver wirken.

Technologische Komponenten

Gesichtssynthese und Animation

Die Technik hinter den realistisch wirkenden Gesichter ist die Deepfake-Technologie. Genutzt für die Animation und den Gesichtsausdruck werden GANs (Generative Adversarial Networks).

Sprachsynthese (Text-to-Speech)

Text wird in einer natürlichen Sprache (also dem Menschen gleich) erzeugt. Die KI kann Stimmen personalisieren oder an echten Vorbildern ausrichten.

Bewegungserfassung (Motion Capture)

Künstliche Intelligenz kann menschliche Bewegungen analysieren und auf ein Video-Avatar übertragen, so dass Körperbewegung, Mimik und Gestik realistischer wirken.

Lippensynchronisation und Emotionen

Etwas komplexer in der Darstellung sind die Lippen beim Sprechen. Hier ist die KI mittlerweile so weit, die Lippenbewegung an die gesprochene Sprache anzupassen. Mit dem Gesichtsausdruck und der Lippenbewegung gehen beim Menschen Emotionen einher, die die KI erkennt und überträgt – das betrifft auch den Tonfall.

Anwendungsbereiche

Marketing und Werbung: Video-Avatare übermitteln personalisierte Botschaften und werden damit zu virtuellen Markenbotschaftern. Die Videoanzeigen richten sich nach Zielgruppen automatisch aus.

E-Learning und Bildung: Video-Avatare übernehmen die Rolle einer digitalen Lehrperson und erklären Inhalte in interaktiven Lernumgebungen. Verschiedene Video-Avatare lassen sich an die Bildungsinhalte anpassen.

Kundensupport und Service: Verbraucher können von FAQ-Avataren profitieren, die auf Websites aktiv sind. Damit ist ein 24/7 Support mit virtuellen Assistenten mit Gesicht möglich.

Social Media und Influencer: Wer sich auf Social Media Kanälen umsieht, bekommt die ersten virtuellen Influencer zu sehen. Video-Avatare sind Account-Inhaber auf Instagram, Facebook und Co. Ohne physische Präsenz kann Content erstellt werden.

Vorteile von Video Avataren

Es sind vor allem vier Vorteile, die ein Video-Avatar mit sich bringt: Skalierbarkeit, Personalisierung, Verfügbarkeit (Effizienz) und Barrierefreiheit.

Skalierbarkeit bedeutet, einmal erstellt, kann der Video-Avatar beliebig oft eingesetzt werden. Sprachen und Varianten lassen sich beliebig generieren.

Personalisierung wird durch die Anpassung des Avatars an die Zielgruppe möglich (beispielsweise Unterscheidung nach Alter, Kultur oder Sprache). Je nach Anwenderverhalten können dynamische Inhalte generiert werden.

Verfügbarkeit und Effizienz: Der Video-Avatar ist rund um die Uhr verfügbar, was Personal- und Produktionskosten einsparen kann.

Barrierefreiheit: Die Aufbereitung eines Inhaltes funktioniert visuell wie auditiv. Menschen mit Einschränkungen könnten bei der Informationsgewinnung unterstützt werden.

Herausforderungen und Risiken

  • Ethik und Deepfake-Problematik sind zwei Bereich mit großen Herausforderungen. Da die Videos täuschend echt wirken, besteht die Gefahr von Manipulation. Transparenz und Kennzeichnung von KI-Einsatz ist in diesem Zusammenhang erforderlich.
  • Datenschutz und Persönlichkeitsrechte sind der zweite Bereich, der Risiken birgt, denn nachgeahmte Gesichter und Stimmen erfordern eine Zustimmung und es ist datenschutzrechtlich bedenklich, sensible Daten zu speichern oder weiterzuverarbeiten.
  • Technische Herausforderungen sind in Form von hohem Rechneraufwand für Echtzeit-Avatare gegenwärtig. Welche Qualität der Video-Avatar in seinem Kontext widerspiegelt, hängt zum einen von den Trainingsdaten ab, zum anderen von der Prozessorleistung des Anbieters und Übertragungsgeschwindigkeit des Anwenders.
  • Akzeptanz und Vertrauen bei Anwendern mit gemischten Gefühlen zu erzeugen ist eine schwierige Aufgabe. Der Nutzer muss sich mit und bei der KI-Figur wohlfühlen. Gefühle der Entfremdung oder Ablehnung dürfen nicht getriggert werden.

Zukunft oder heute schon verfügbar?

Avatare könnten ins Metaverse oder in virtuellen Welten zu zentralen Kommunikationsformen werden. In Meetings, Events und Lernräume könnte der Anwender sich komplett selbst einbinden und eintauchen. Tatsächlich gibt es schon Video-Avatare, die auf Echtzeit antworten. Die Kombination mit Chatbots und Sprachassistenten ist inzwischen auch schon möglich. Einige Avatare können bereits emphatisch reagieren, indem sie Emotionen in der Stimme oder Gesichtsausdruck erkennen. Entwicklung, wie diese, werden vorangetrieben, um Video-Avatare noch realistischer zu gestalten.

So können wir am Ende unseres Beitrages festhalten, dass Video-Avatare ein vielseitiges Werkzeug in der digitalen Kommunikation sind, das noch großes Potential in sich birgt. Video-Avatare und KI verändern die Kommunikation, Bildung und das Marketing grundlegend. Video Avatare sind mehr als ein Trend – sie sind ein Teil der digitalen Zukunft.

(Bildquelle: Pixabay.com – CC0 Public Domain)