Bilderklau als Ranking-Faktor in der Google Bildersuche

Bilderklau als Ranking-Faktor in der Google Bildersuche

Bildkopien als Rankingfaktor
Bildkopien als Rankingfaktor

Im Zusammenhang mit der neuen Google Bildersuche rücken wichtige Dinge in den Hintergrund, obwohl sie wahrscheinlich direkt miteinander verknüpft sind. Aber da die Materie sehr komplex ist, und sich nur wenige wirklich intensiv damit beschäftigen, werden sie leicht vergessen. Im folgenden Artikel möchte ich einen dieser Punkte thematisieren: das (oft unerlaubte) Kopieren von digitalen Bildern im Internet – und wie Google das als positiven Rankingfaktor verwendet. Das grundlegende Problem in der Google Bildersuche

Zum Hintergrund: Rankingfaktoren für die Bildersuche

Um die Billionen Bilder im Internet in eine sinnvolle Reihenfolge zu bringen, analysiert Google zahllose Faktoren und gewichtet sie unterschiedlich. So ist zum Beispiel klar, dass der „Alt-Text“ im Laufe der Zeit stetig an Bedeutung gewonnen hat. Die Wichtigkeit des Dateinamens ist dagegen rückläufig. Zwingend erforderlich ist das Auftauchen des Keywords (für das ein Bild bei Google rankt) im „umliegenden Text„, also kurz vor dem Bild und kurz nach dem Bild (im Quelltext, wohlgemerkt). Siehe: Google Images Rankingfaktoren (Infografik).

Bilder-Seo
Bilder-Seo

Um den Algorithmus so weit wie möglich vor unerlaubter Manipulation zu schützen, werden seit einigen Zeit sog. User-Signale verstärkt mit einbezogen. Dazu gehört zum Beispiel die „Klickrate“ in den Suchergebnissen. Thumbnails, die häufiger angeklickt werden, sind offenbar interessanter als solche, die weniger oft angeklickt werden. Auch die Keyword-Dichte spielt bei Bildern noch eine wichtige Rolle. So ist zum Beispiel zu erklären, dass Bilder, die auf einer Seite eingebunden sind, die nur das Keyword im Titel hat (und sonst nichts, außer massenhaft Werbung natürlich), durchaus in der Google Bildersuche weit vorne gelistet sein können. [Update Juni 2018: das hat sich geändert: inzwischen spielt die Qualität des Seiten-Kontextes eine zunehmend große Rolle].

Problem 1: Anzahl der Bildkopien ein Rankingfaktor

Bildkopien ermitteln
Bildkopien ermitteln

Einer der wichtigsten Rankingfaktoren für Bilder ist jedoch die Anzahl der Bildkopien. Je öfter ein Bild eingebunden wird, um so besser, denkt sich Google. Denn das spricht dafür, dass es sich offenbar um ein „gutes, interessantes“ Bild handelt. (Um das Ganze einfach zu halten, verzichte ich hier auf die Unterscheidung von „physikalischer“ Kopie und einem Hotlink. Im Grunde behandelt Google beides gleich). Nun sind jedoch in den allermeisten Fällen diese Bildkopien ohne eine entsprechende Einwilligung beim Urheber dupliziert und eingebunden worden.

Also: Google wertet die Anzahl der Bildkopien (und Hotlinks) als positives Signal – aber da die meisten Bilder ungefragt kopiert worden sind, stützt Google sein Bilderranking damit offenkundig auf ein illegales System.

Um zu ermitteln, wie viele Kopien es vo einem Bild gibt, kann man gut die Funktion „Weitere Größen“ in der Google-Bildersuche nutzen (wenn man auf ein Bild rollt, siehe Abb. rechts). Von meinem „Mahatma Gandhi„, rechts, das ich vor ca. 5 Jahren gemalt habe (siehe Speedpainting), existieren inzwischen tausende von Kopien. Ich konnte mir inzwischen den Link aus der Bildersuche „zurückerobern“, aber nur, weil ich eine völlig verspamte Galerie gebaut habe, in der ich einige meiner Bilder klaue. Hier kann man sich das anschauen

Schaut Euch mal daraufhin traffic-relevante Keywords in der Google Bildersuche an, z.B.

Ich habe jeweils das erste Bild nach oben in das Suchfeld gezogen (Search by image) und dann auf „Alle Größen“. Dann sieht man, wie viele Kopien dieses Bildes weltweit existieren.

Problem 2: Google verlinkt auf spamige Bilderfarmen

Oft kopierte Bilder werden bei Google also weiter vorne gelistet. Nun stellt sich die Frage: auf welche Seite verlinkt Google denn aus der Bildersuche? Wenn der Klick auf die Seite des Urhebers ginge, dann wäre das für den vielleicht noch zu akzeptieren. Aber: Google kümmert sich überhaupt nicht um die Frage der Autorenschaft. Früher ging der Link wahrscheinlich zu der Seite mit der höchsten Keyword-Dichte, inzwischen kommt der Faktor „Freshness“ hinzu. In vielen Fälle führt der Link aus der Google-Bildersuche auf eine verhältnismäßig neue Spam-Seite (nach meiner Schätzung über 25% alle Bilder).

spamige Bilderfarmen
spamige Bilderfarmen

Denn es gibt zahllose Bilder-Farmen, die diese beiden Punkte ausnutzen. Das geht so: Zunächst wird eine Liste mit traffic-relevanten Keywords erstellt. Von diesen Keywords werden dann automatisert die Top-Bilder bei Google herunterkopiert. Für jedes Bild wird automatisiert eine neues Seite erzeugt, die außer dem Keyword im Titel und kurz vor und kurz nach dem Bild keinen Inhalt hat (hohe Keyword-Dichte). Und was passiert? Nach wenigen Tagen zeigt der Link von diesem Top-Bild in der Google-Bildersuche auf diese neue (fresh) Seite (Keyword-Density). Natürlich werden diese Seiten gnadenlos mit Werbung vollgeballert. Nach einigen eigenen Test – ich habe zwei solcher Galerien erstellt, in denen ich meine eigenen Bilder klaue – zeigt sich sogar, dass der Link mit einer höheren Wahrscheinlichkeit auf die Spamseite zeigt, wenn dort (massiv) Adsense eingebunden ist. Der Suchgigant verdient also offenbar an dem Bilderklau gut mir …

System Bilderklau

System Bilderklau
System Bilderklau

Google unterstützt mit seiner Bildersuche also das „System Bilderklau„. Dieses Ärgernis wird allwöchentlich bei der Analyse der neuen Bidox-Zahlen deutlich (der Bidox ist ein Bilderindex für die ca. 5.000 wichtigsten Bilder-Keywords, Danke an Ingo Henze für diesen Index). Woche für Woche tauchen da Bildergalerien vorne auf, die nichts anderes tun als andere Bilder zu kopieren. Sie sind in Ländern beheimatet, wo man offensichtlich keinerlei Zugriff auf die Betreiber hat. Und sie profitieren davon, dass den meisten Website-Betreibern gar nicht bewusst ist, dass ihre Bilder so umfangreich geklaut werden. Und: unter dem Deckmantelchen „Personensuchmaschine“ eignen sich ebenfalls viele Systems ohne Gnade Bilder an. Hier ein paar Beispiele aus der Vergangenheit:

Wann nimmt Google Urheber ernst?

Es wird dringend Zeit, dass Google anfängt, Urheber-Interessen ernst zu nehmen. Folgende Punkte sind dabei wichtig:

  1. Verzicht auf den Rankingfaktor „Bilderkopien“
  2. Verlinkung auf die „Urheber-Website“
  3. Verzicht auf den „Freshness-Faktor“ (weil ein Urheber sein Bild kaum neu hochlädt)
  4. Gänzlich Verzicht auf Hotlinks als Rankingfaktor

Aber das ist realistischer Weise nicht zu erwarten. Denn damit würde sich in der Tat aus Usersicht die Qualität der Ergebnisse verschlechtern. Und Google bewertet die (vorgeschobenen) User-Interessen stets höher als die Rechte einzelner. Das zeigt auch die neue Google-Bildersuche.

Problem nicht gelöst, sondern kaschiert

Ich vermute sogar, dass dieser Zusammenhang mit ein Grund ist, warum Google die neue Bildersuche eingeführt hat. Denn bei zahllosen Bildern gelangen die Besucher auf fragwürdige, mit Werbung zugepflasterte Seiten. Oftz ein Ärgernis. Mit der neuen Google-Bildersuche scheint das Problem gelöst: niemand muss sich mehr über diese spamigen Bilderfarmen ärgern. Aber: Google hätte das Problem mit den eigenen Rankingfaktoren lösen können und müssen, anstatt einfach ein neues Bildersuche einzuführen.

Google Bildersuche: Bildkopien als Rankingfaktor
Google Bildersuche: Bildkopien als Rankingfaktor

Weiterlesen

17 Gedanken zu „Bilderklau als Ranking-Faktor in der Google Bildersuche

  1. Ich veröffentliche wegen so was selbst erstellte Bilder und Grafiken seit längerem eigentlich nur noch mit fettem (c)-Hinweis an einer Stelle im Bild, wo man ihn ohne größeren Aufwand mit einem Grafik-Tool nicht entfernen kann.

    Dein Ergebnis, dass Bilder-Gallerien mit viel Adsense gut ranken, hätte ich allerdings so nicht erwartet, weil ansonsten beim SEO Adsense doch schon öfter mal als eher negativer Ranking-Faktor diskutiert wurde.

    Blöd, dass man als Webmaster in Deutschland wieder mal zu denen gehört, die das Nachsehen bei Themen wie diesem haben.

    Viele Grüße
    Micha

  2. Hallo,

    Was hältst Du von einem 5. Punkt: Den Auswerten von Copyright Angaben im EXIF TAG? Welcher Spammer macht sich schon die Mühe und schreibt diese um?

    1. ja, natürlich. Google liest die Daten längst aus, auch wenn sie noch nicht ins Ranking einfließen. Das Problem ist: das geht nur bei Fotos, und auch nur, wenn die Kamera das macht bzw. korrekt voreingestellt ist. Im Verhältnis zu den verfügbaren Bildern vermutlich nur ein verschwindet geringer Teil, der die Exif-Daten korrekt aufberitet. Daher nutzt Google das bislang noch nicht direkt (vermutlich).

      1. Nun, es gibt Tools wie z.B. ExifTool mit denen man diese Tags, übrigens auch IPTC und XMP Tags, erstellen und ändern kann. Das funktioniert generell mit JPEGs.

        Ich versehe auf diese Art und weise alle meine Fotos mit Copyright Hinweisen in den entsprechenden Kommentar Tags. Interessant ist auch, dass z.B. Flickr und Picasa (Google+) diese Kommentar-Tags als Bildbeschreibung verwenden.

        Genutzt hat es mir aber leider nichts, meine einst gut besuchte Galerie mit selbst fotografierten Hintergrundbildern ist inzwischen wegen massiven Bilderklaus in der Bedeutungslosigkeit verschwunden.

  3. Mit dem Einfließen der vielen Faktoren wird die Bildersuche für die meisten Urheber immer unwichtiger. Während es früher so war, dass neue Bilder für Verlinkungen und damit für ein Steigen des Bildes im Ranking (also für mehr Besucher) gesorgt haben, ist es aufgrund der nun einfließenden Faktoren immer schwieriger zu ranken.
    Wie Du schon beschrieben hast, werden die wenigsten Urheber ihre Bilder in regelmäßigen Abständen neu veröffentlichen. Eher ist es so, dass die Algorithmen hinter der Bildersuche gar nicht bekannt sind.
    Dass damit dem Bilderklau Tür und Tor geöffnet wird und letztendlich Google der Profiteur ist, ist offensichtlich.

    1. Also bei manchen Suchwörtern wie IC und Regionalexpress habe ich seit Jahren die gleichen Uralt-Bilder im Rennen, kann auch sonst keine wirklich zunehmende Schwierigkeit beim Ranken feststellen. Wenn Freshness eine zunehmende Rolle spielt, dann vielleicht bei manchen Suchwörtern mehr als bei anderen.

      1. Mit Freshness ist hier ja auch eher „alter Wein in neuen Schläuchen“ gemeint. Also wenn z.B. Dein Regionalexpress Nr.1 Bild von einer anderen Seite kopiert wird, dann bleibt zwar das Bild vermutlich auf Platz 1, nur es ist dann nicht mehr das von Deiner Seite, sondern die Kopie.

        Wir können das gerne mal testen. :-)

        1. Da freut sich der Abmahnanwalt :-)

          Aber danke für die Erläuterung, tatsächlich hatte ich den Begriff aus diesem Blickwinkel noch nicht betrachtet.

          1. Nicht testen? Schade.
            Hätte mich mal interessiert, wie einfach oder schwer das ist. Es wäre ja nur für einen kurzen Test-Zeitraum von höchstens ein paar Wochen.

          2. Ab einer bestimmten Ebene kann man hier wohl nicht mehr antworten. @Schnurpsel, es war nur ein Spaß – so einen Test können wir gerne machen.

          3. Ja, die Ebenen sind begrenzt. Macht ja auch Sinn, sonst würde das ja bis zur Unleserlichkeit immer schmaler werden.

            Gut, Test ist gut, können wir noch absprechen, würde sagen, irgendwann nach Pfingsten oder so. Habe übrigens auch ein Bild aus dem (im weitesten Sinne) Bahnbereich auf Platz 1. :-)

            Ich werde einstweilen schonmal den Regionalexpress und IC in die Ranking-Überwachung aufnehmen.

          4. Beim IC müssten wir etwas aufpassen, das Bild ist nicht von mir und ich kann einer Nutzung auf fremden Seiten nicht zustimmen. Der Regionalexpress (das Fahrzeug ist übrigens inzwischen verschrottet) kann aber gern genutzt werden ;)

  4. Ich probier es jetzt mal aus und bin gespannt wie ein Flitzebogen. Wenn das so einfach geht wäre das ein echter Hammer. Ich poste hier das Ergebnis.

  5. Bildersuche ist sehr relevant. Sie bietet vor allem zahlreiche gute zusätzliche Vorteile. Das sollte sich kein Projekt entgehen lassen.

Kommentare sind geschlossen.

Kommentare sind geschlossen.