Es ist soweit: Die Maschine lernt Videos verstehen

Viele Dinge, die wir heute in der Realität erleben, waren vor einigen Jahren noch Science-Fiction. Dazu zählen z.B., dass wir heute einer Maschine Sprachbefehle geben können, dass Autos selbst fahren oder dass sich Maschinen untereinander austauschen und vernetzen.

Ein Thema, dass lange Zeit auf der Agenda stand, war das Verstehen von Video-Inhalten. Das Verstehen von Dokumenten-Inhalten ist mittlerweile ein alter Hut. Maschinen lesen in allerbester Qualität die Inhalte aus Briefen und Rechnungen.

Jetzt hat Microsoft auf der Build 2017 den Video Indexer vorgestellt, einen Dienst, der mit Hilfe von künstlicher Intelligenz Inhalte von Videos automatisch ausliest, verschlagwortet, transkribiert und indexiert, um die Inhalte zu verstehen. Die Software versteht, was in dem Video passiert. Die gesprochenen Texte werden automatisch transkribiert, es werden unzählige Schlagworte angelegt und sogar die einzelnen Personen, die in einem Video auftreten, werden aufgelistet.

Möchte man wissen, wer was an welcher Stelle gesagt hat, klickt man auf das Bild der Person und der Videoplayer springt an die entsprechende(n) Stelle(n).

Möchte man wissen, an welcher etwas über ein bestimmtes Thema gesagt wird, so klickt man auf den passenden Tag. Doch das ist eigentlich noch Spielerei.

Quelle: Microsoft

Solche Systeme wie der Video Indexer spielen ihre wahren Stärken in dem Moment aus, in dem automatisch bestimmte Prozesse und Workflows angestoßen werden, wenn ein „Trigger“ ausgelöst wird. Schau dir einfach mal die beiden Videos von nexx.tv an. Dort siehst du ein Video von Nike und ein Reisevideo. In beide wurde der Video Indexer integriert.

Oder schau dir dieses Video an: Hier wird in einer mobilen App, die einfach nur zuhört, wenn eine Episode der Big Bang Theory läuft, Produktwerbung zu den Themen eingeblendet, die gerade in der Sendung besprochen werden.

Für die Werbebranche ist diese neue Technologie eine wahre Goldgrube. In Zukunft könnte jedes veröffentlichte Video (auch private Videos bei YouTube) indexiert werden. Die Betreiber wüssten dann genau, über was in dem Video geredet wird, wer was wann sagt. Dadurch könnten Werbung und aktive Handlungsaufforderungen genau in dem Moment eingeblendet werden, in dem z.B. über Schuhe, Reisen, Autos, Computer oder was auch immer gesprochen wird. Genial?

Die Frage, wo hier die Grenzen des Erlaubten liegen, bleibt allerdings offen. Hier wird die Justiz mal wieder hinterher hecheln und Regeln und Gesetze nachträglich erstellen.

Aber egal. Der Video Indexer ist jedenfalls ein tolles Ding. Probiere es aus.

Was hältst du von dieser Technologie?

Bild: geralt / OpenClipart-Vectors / GDJ

One thought on “Es ist soweit: Die Maschine lernt Videos verstehen

  1. An sich ja keine schlechte Technologie, die man sicherlich auch in andere Bereiche übertragen kann. Wenn Bürosoftware nicht nur die direkten Eingaben nutzen kann, sondern sich diese vielleicht sogar selbst besorgen kann, wäre das sicherlich eine grosse Arbeitserleichterung.

Comments are closed.