Sind Bilder Duplicate Content?

Duplicate Content ist das im Bereich SEO wohl am häufigsten genutzte Schlagwort. Weil Google Seiten mit Douplicate Content mit schlechterem Ranking abstraft, gilt es solche doppelten Inhalte unbedingt zu vermeiden. Aber, wie sieht es bei der Verwendung von Bildern aus? Bilder sind längst zu einer eigenen Kommunikationsform im Netz geworden. Und hier soll es nicht um die fehlenden ALT Tags bei Bildern gehen, die angeblich ein wichtiger Rankingfaktor sind. In diesem Artikel geht es um die Verwendung von Bildern, die auf mehreren Websites erscheinen. Das können eigene Bilder sein, die man mit dem Handy gemacht hat. Typischerweise sind das im Web aber Stockfotos. Bekanntere Stockfotos langweilen inzwischen. Es stellt sich die Frage, ob diese Fotos nur die Leser nerven, oder auch Google. Dass Google ähnliche Bilder oder Bildausschnitte erkennen kann hat der Konzern aus Mountain View längst mit seiner Bildersuche bewiesen. Aber kann Google auch die Inhalte von Bildern erkennen? Bislang katalogisiert Google Bilder nicht nach deren tatsächlichem Inhalt, sondern primär nach dem daneben stehenden Text, dem ALT Tag und dem Dateinamen.

Kann Google den Inhalt von Bildern erkennen?

Die Antwort lautet: die Ingenieure von Google arbeiten daran und werden immer besser. Wie weit das Projekt fortgeschritten ist, das kann man sich eindrucksvoll unter cloud.google.com/vision/ selbst testen. Google nutzt dabei zur Erkennung von Bildinhalten nicht die eigenen Rechner, sondern die Google Cloud. Das neue Auge von Google bietet unvorstellbare Möglichkeiten. Millionen von Internetusern haben nicht umsonst Captchas von Katzenbildern gelöst, denn Google erkennt hier nicht nur Katzenrassen, sondern inzwischen auch Gegenstände, Orte und Gesichtsausdrücke. Es kann einen Ball von einem Apfel unterscheiden und beispielsweise Logos erkennen.

Was kann Google auf Bildern erkennen?

Eigentlich gibt es schon jetzt kaum etwas, das Google auf Bildern nicht erkennt. Das Geheimnis von Google Cloud Vision liegt in den Algorithmen des „Machine Learning“, die für den Erfolg der Suchmaschinen verantwortlich sind. Die gewaltigen Datenmengen werden genutzt, um den eigenen Algorithmus zu trainieren. Google nutzt dabei gezielt die Crowd Intelligence der User. Angefangen von Gesichtserkennung, Erkennung von Emotionen, über Erkennung von Logos bis hin zur Erkennung von kompletten Bildinhalten ist laut Aussage von Google schon vieles jetzt machbar.

Erkennung von Gegenständen

Das oben gezeigte Video ist natürlich schon beeindrucken. Aber um die Fähigkeiten der Vision Cloud API zu überprüfen habe ich selbst mal getestet und war beeindruckt. Im ersten Versuch habe ich mal ein Hundefoto hochgeladen. Ich wäre ja nicht erstaunt gewesen, wenn Google das Motiv als Hund erkannt hätte. Aber die Erkennung geht da wesentlich weiter. Google erkennt tatsächlich auch die Rasse.

Google Cloud Vision API erkennt Hunderassen
Google Cloud Vision API erkennt Hunderassen

Google erkennt Labrador Retriever und auch Golden Retriever. Ok, dann steigern wir mal den Schwierigkeitsgrad.

Erkennung von Personen

Wir laden mal das Portrait des ersten schwarzen US Präsidenten hoch. Wenn Google Hunderassen erkennt, dann vielleicht auch Personen.

Google cloud-Vision API erkennt Persomen
Google cloud-Vision API erkennt Persomen

Und siehe da, Google spuckt nicht nur den Namen „Barack Obama“ aus, sondern gleichzeitig  „Vereinigte Staaten von Amerika“. Es wird inzwischen sicherlich schwieriger Google glaubhaft zu versichern, dass „Barack Obama“ der Präsident der Russischen Föderation ist. Aber dann steigern wir den Schwierigkeitsgrad noch einmal. Google erkennt auch anstößige Inhalte. Das wollen wir doch gleich mal testen. Ein typischen Foto von einer Frau mit nackter Brust wäre zu einfach. Ein bei Pixabay herunter geladenes Foto einer hübschen rothaarigen Frau, die nackt auf einem Bootssteg liegt soll den Algorithmus von Google ein wenig aus dem Konzept bringen.

Google erkennt Inhalte für Erwachsene
Google erkennt Inhalte für Erwachsene

Neben Begriffen, wie „rotes Haar“ und „Nacktheit“  hat die Google Cloud anscheinend auch Phantasie, denn es tauchen Begriffe, wie „weibliche Ejakulation“ auf und die hinter der Cloud steckende Crowd brachte das Bild der hübschen jungen Frau sogar mit „Telefonsex“ in Verbindung.

Google erkennt nicht jugendfreie Inhalte

Google wirbt ja damit, dass hier auch Inhalte für Erwachsene erkannt werden. Unter dem Reiter „Safe Search“  wird für das Bild von der nackten Schönheit bei Inhalt für Erwachsene angezeigt: „möglich“.  Naja, anstößig ist das Bild ja nun wirklich nicht.

Nachdem der Erwachsenenfilter beim letzten Foto nur bedingt angeschlagen hat und das Foto der hübschen Rothaarigen als „möglicherweise“ nur für Erwachsene einstufte, wollen wir jetzt wissen, was für Google nicht jugendfrei ist. Also testen wir die „Safe Search“ und füttern die Google Cloud Vision API mal mit einem anstößigen Foto.

Google erkennt "nicht Jugendfreie" Inhalte
Google erkennt „nicht jugendfreie“ Inhalte

Die Safe Search schlägt sofort Alarm und stuft das Bild als „sehr wahrscheinlich“ nur für Erwachsene geeignet ein. Google erkennt sogar noch genauer, was auf den Bildern passiert. Ein weiteres Foto von einer Frau in Handschellen wurde sofort mit „Bondage“ und „BDSM“ in Verbindung gebracht. Auch die angelegten Handschellen wurden zuverlässig erkannt.

Google erkennt auch Orte auf Bildern

Für einen weiteren Test wurde die Funktion Landmarks getestet. Google wirbt damit, dass Orte erkannt und zugeordnet werden können. Den Eifelturm zu erkennen ist sicherlich zu einfach. Deshalb haben wir bei Pixabay ein Bild von Dubrovnik heruntergeladen und mit der Google Cloud Vision API geprüft, ob Google das eigentlich typische Postkartenmotiv diese kroatischen Stadt auch erkennt.

Google Cloud Vision API erkennt Landmarks
Google Cloud Vision API erkennt Landmarks auf Bildern

Zu unserem Erstaunen wird hier nicht nur Dubrovnik erkannt, sondern gleich eine Karte von der Innenstadt dieser Perle an der Adria mitgeliefert. Wie zuvor erhöhen wir also noch einmal den Schwierigkeitsgrad. Dubrovnik ist von einer Stadtmauer umgeben, die komplett begehbar ist. Von hier aus bieten sich ungewöhnliche Ausblicke auf die Adria und auf die Altstadt von Dubrovnik. Da das Foto im Vordergrund Dächer zeigt und nur im Hintergrund der alte Hafen von Dubrovnik zu erkennen ist, wird es nun gar nicht mehr so einfach das Rätsel zu lösen.

Ungewöhnliche Perspektiven verwirren den Google Algorithmus nicht
Ungewöhnliche Perspektiven verwirren den Google Algorithmus nicht

Google stellt wieder einmal unter Beweis, dass solche Aufgaben spielend zu lösen sind. Google erkennt nicht nur Dubrovnik, sondern spuckt auch Schlagworte, wie „Dach“, „Reise“ und „Tourismus“ aus. Übrigens auch die Bilddatenbank „Pixabay“, bei der wir das Bild herunter geladen hatten.

Google erkennt Marken und Logos

Google verspricht, dass Logos und Marken erkannt werden. Wir machen den Test mit einem der bekanntesten Getränke der Welt.

Google Vision erkennt Marken und Logos
Google Vision erkennt Marken und Logos

Klar war das zu einfach. Das hätte vermutlich auch jedes dreijährige Kind erkennen können. Außerdem wurde ja nur das Coca Cola Logo hochgeladen. Also fordern wir Google mal heraus. Eine Nachtaufnahme voller Leuchtreklame des bekannten Markengetränkes. Zusätzlich spiegeln sich andere Lichter auf dem eigentlichen Logo. Aber auch diese schwierige Aufgabe kann die Bilderkennung von Google problemlos meistern.

Google Cloud Vision API erkennt zuverlässig Marken und Logos
Google Cloud Vision API erkennt zuverlässig Marken und Logos

Fazit

Noch steckt die Bilderkennung in den Kinderschuhen, aber dank der lernfähigen künstlichen Intelligenz, die dahinter steckt, wird die Bildersuche in den nächsten Jahren wohl immer ausgereifter. Man wird sich den von Suchmaschinenoptimierern angemahnten ALT Tag dann gewiss sparen können. Vielleicht erfahren wir dann auch gleich den Namen der hübschen Rothaarigen und falls der Datenschutz es zulssen würde auch gleich die Adresse von Ihr.