71606051 98de 46ec 993d b0004fb94002


Google-Algorithmus knackt Videogrenze

- Ferhat Ziba

Logo
Mister-Wong

Dass Google durch eine bestimmte Technik Webseiten untersucht ist schon lange kein Geheimnis mehr. Ganz im Gegenteil. Es entstehen ganze Firmen, die sich auf die sogenannte SEO-Optimierung spezialisieren. Das heißt die Inhalte der Seitentexte so zu schreiben, dass möglichst viele Algorithmen von Google darauf anspringen und die Seite dadurch weiter oben erscheint. Naja, das war etwas (sehr sehr) einfach ausgedrückt, es kommen natürlich noch Verlinkungen, Klickzahlen, und und und dazu. Doch was bisher undenkbar war, ist dass Google auch den Inhalt eines Videos in Fakten umwandeln kann. Mit Hilfe von künstlicher Intelligenz soll das jetzt möglich sein

Angefangen mit Fotos

Der Start zu dieser neuen Welle an künstlicher Intelligenz war rund vor einem Jahr, im Februar 2016, als Google eine neue Software vorstellte. Diese Software konnte ziemlich genau den Aufnahmeort eines Bildes erkennen- anhand des Bildes selbst! Das klingt gespenstisch und jeder Privatsphäre-liebende Mensch wird zusammenschrecken, doch das ist möglich. Davon abgesehen, wer mit seinem Smartphone Bilder macht muss damit rechnen, dass viele Leute darauf zugreifen können (doch wer will das denn schon? Also keine Panik!). Der Suchmaschinengigant hatte wieder einmal etwas entwickelt, was ihn von der Konkurrenz absetzte. 

Generell steckt das Unternehmen extrem viel Geld in die Forschung rund um neuronale Netzwerke. Also Systeme, die ähnlich arbeiten wie das menschliche Gehirn. Bei den Bildern ist eine Software zu Gange, die –nebenbei erwähnt- den Europameister im chinesischen Brettspiel „Go“ problemlos schlug. Das ist deshalb beeindruckend, weil „Go“ durchaus flexibler und komplexer ist als Schach. Doch zurück zu der Aufnahmeerkennung. 

Forscher der Cornell University aus Ithaca, New York, brachten der Maschine nicht nur asiatische Freizeitbeschäftigungen bei. Sie kann auch anhand von Bildern den Ort bestimmen, an dem es aufgenommen wurde. Ein Selfie vorm Eiffelturm zum Beispiel. Oder ein Familienbild von der Golden Gate Bridge waren kein Problem für die Software.

Das System lernt dazu

Gelernt hat das Programm, das den Namen „PlaNet“ trägt, durch eine Einspeisung von über 91 Millionen Fotos aus Flickr. Dabei wurden über die Exif-Daten der Bilder die Koordinaten mit eingespeist. Die Weltkugel kennt „PlaNet“ zudem nur in 26.000 kleinen Vierecken, denen die Bilder dann dank der Koordinaten zugeordnet wurden. Dadurch lernte die Maschine von Bild zu Bild mehr dazu und neue Fotos können anhand des Hintergrundes zugeordnet werden. 

An dieser Stelle erneut der Aufruf zu keiner Panik. Denn die Prozentwerte über den Erfolg der Maschine lassen die Gemüter wieder etwas runterfahren. 2,3 Millionen Fotos wurden durch die Software bearbeitet. In 48 Prozent der Fälle gelang es, die Bilder dem richtigen Kontinent zuzuordnen. 28,4 Prozent der Bilder wurden auch im richtigen Land platziert, bei 10 Prozent konnte die richtige Stadt ermittelt werden und 3,6 Prozent der Bilder sortierte die Software sogar in den richtigen Block.

Vergleichsweise noch relativ wenig Präzision. Doch Speicher und Netzwerke werden immer größer, es ist also nicht ausgeschlossen dass die Maschine irgendwann eine deutlich höhere Quote erreicht!

Doch nun zu den Videos

So viel zu der Vorgeschichte von KI, an der Google arbeitet. Ein weiteres Projekt kristallisierte sich jetzt heraus. Eine Google Software ist in der Lage, den Inhalt eines Videos zu erkennen und mit entsprechenden Schlagworten zu versehen. Das war bisher nur manuell möglich. 

Auch hier wird eigentlich über Bilder gearbeitet. Die Software erstellt von jeder Sequenz viele Standbilder, die sie anschließend auf deren Inhalt prüft. Es kann dabei relevante von irrelevanten Inhalten unterscheiden. Liegt ein spielender Hund vor einem Wandschrank, kann die Maschine also erkennen dass der Schrank im Hintergrund nicht zu der Geschichte des Videos beiträgt. Am Ende werden diese Auswertungen für alle Bilder des Videos übereinander gelegt und die wichtigen Inhalte herausgefiltert.

Klingt einfach. Was in Wirklichkeit schwere Arbeit im IT Bereich mit sich brachte, lässt den Endnutzer in Zukunft spielend leicht Videos mit Schlagworten versehen. Möglich wäre das für Firmen mit großem Video-Input, in erster Linie Youtube. Demnach ist auch auf der Streaming-Plattform bald ein Ranking der Videos denkbar, das dem der Suchmaschinen gleicht. Revolutionär ist es auf alle Fälle. Bis von der Theorie wirklich was in die Praxis umgesetzt wird, dauert es vermutlich noch eine Weile. Doch Google ist überraschend weit mit der Forschung an selbstlernenden, neuronalen Systemen!