Was ist ein Hotlink? Warum hat Google damit Probleme?

Was ist ein Hotlink? Warum hat Google damit Probleme?

Was ist ein Hotlink?
Was ist ein Hotlink?

Seit Jahren beklagen ich und andere, dass die Google Bildersuche ein Problem mit Hotlinks hat. Bereits vor 6 Jahren habe ich das zum ersten mal hier geschildert. Der Artikel ist jedoch in die Jahre gekommen, und mich erreichen ständig neue Anfragen, was denn genau ein Hotlink sei und wie man sich davor schützen könne. Daher hier der aktuelle Stand- erläutert anhand anschaulicher Grafiken:

Erklärung: Was ist ein Hotlink?

Um das zu erklären, muss man sich zunächst vergegenwärtigen, wie Bilder auf HTML-Websites eingebunden werden. In einen <img …>-tag wir als „src“-Attribut eine Bild-URL angegeben. Der Browser lädt dann das Bild vom angegebenen Server (oder auch Host) herunter und zeigt es an. Dabei gibt es zwei Möglichkeiten:

  • das Bild liegt auf dem gleichen Server wie die HTML-Datei (dann genügt auch ein sog. relativer Pfad)
  • oder das Bild liegt auf einem anderen Server.
Website auf Server A - Bild auf Server B
Website auf Server A – Bild auf Server B

Für kleine Websites mit bis zu 10.000 Bildern ist der erste Fall völlig unproblematisch. Aber dass das Bild auf dem gleichen Server liegt, ist durchaus nicht Standard. Gerade größere Portale (mehr als 100.000 Bilder) sind längst dazu übergangen, ihre Bilder auf eigene Bilderserver auszulagern (auch als CDN bezeichnet: Content-Delivery-Network). Die Gründe dafür sind vielfältig und absolut nicht fragwürdig:

  • Speicherplatz optimieren
  • Redundanzen vermeiden
  • Bilder / Medien asynchron laden verbessert die Ladegeschwindigkeit einer Website

Wikipedia, Amazon, Ebay, facebook und viele mehr binden also Bilder ein, die auf anderen Servern liegen.

Soweit so gut.
Break…

Wie funktioniert die Google Bildersuche?

Als nächstes muss man sich bewusst machen, was eigentlich in der Google Bildersuche passiert. Wenn man auf ein Thumbnail in der Google-Bildersuche klickt, öffnet sich die Seite, auf der das Bild zu sehen ist. Zumindest ist das bei uns in Deutschland (noch) so. In jedem Fall aber bietet Google einen Link zu einer Website an, auf der das Bild eingebunden ist. Solange Google nur eine Seite kennt, auf der das Bild zu sehen ist: kein Problem. Dann wird dieser Link als URL benutzt.

Google Bildersuche Thumbnail verlinkt eine Website URL
Google Bildersuche Thumbnail verlinkt eine Website URL

Aber: was, wenn das Bild auf zwei oder mehr Seiten eingebunden ist?

Ein Bild auf mehreren Seiten

Das ist durchaus nicht selten. An dieser Stelle ist es (leider) egal, ob das Nutzen des Bildes auf verschiedenen Seiten rechtlich OK ist oder nicht. Denn Google kann ja nicht wissen, welcher Bildrechte-Inhaber mit welchem Website-Betreiber eine gültige Vereinbarung hat oder nicht. Möglicherweise ist gar keine Vereinbarung nötig, weil der Website-Betreiber seine Bilder einfach nur ausgelagert hat und auf zwei verschiedenen Seiten anzeigt.

Kurzum: häufig gibt es mehrere oder sogar viele Seiten, auf denen ein und das selbe Bild gezeigt wird.

Break 2 …

Egal, ob zu sehen oder nicht

Es spielt (leider) (noch) keine Rolle, ob das Bild letztendlich auf der Seite auch tatsächlich zu sehen ist oder nicht. Allein das Einbinden einer Mediendatei mit Hilfe des „src“-Attributes genügt, um Google zu signalisieren, dass das Bild zu der Website „gehört“. Eine Medien-Ressource kann mit folgenden Methoden „verlinkt“ werden:

  • img
  • iframe
  • href
Bild Ressourcen: Wenn externe Host, dann Hotlink
Bild Ressourcen: Wenn externe Host, dann Hotlink

Das bedeutet: selbst wenn eine Website ein Bild nur verlinkt (mit <a href=“bild-url.jpg“>), ohne dass es mit einem <img> aufruf verbunden ist – das Bild ist demnach auf der Website gar nicht zu sehen), kann Google den Link aus der Google Bildersuche auf diese Website setzen.

Definition Hotlink

Ein Hotlink ist ein Bild (oder auch jedes andere Medium wie Video, PDF etc.), das über das „src“-Attribut auf einer Website eingebunden bzw. „verlinkt“ ist und das von einem anderen Server geladen wird. 

Warum ist Hotlinking ein Problem?

Google hat also die Wahl, ob Seite A oder Seite B als Linkziel des Thumbnails dient. Nach welchen Kriterien Google diese Frage entscheidet, ist geheim und umstritten. Sicherlich spielen mittlerweile folgende Faktoren eine Rolle:

  • Erste Indexierung des Bildes auf welcher Seite?
  • Onpage-Relevanz (des Suchbegriffs in der Google-Bildersuche)
  • Trust der Website
  • Anzahl der uniquen Bilder der Website
  • Aktualität der Website

Lange Zeit war die Aktualität ein sehr starken Faktor, was dazu führte, dass im die Seite verlinkt wurde, die am jüngsten war. Das führte zu folgendem Problem, das leider immer noch sehr häufig missbraucht wird:

Ein Website-Betreiber erstellt ein automatisiertes System, dass zu tausenden von trafficstarken Bilder-Suchbegriffen automatisch die ersten 5-10 Bildergebnisse abscant. Die Bild-Ressourcen werden auf automatisch generierten Websites einfach eingebettet oder auch nur verlinkt. Neben einigen automatisch geklauten Texten werden dann zahlreiche Werbebanner auf der Seite gezeigt. Fertig ist die Bilderfarm-Spam-Galerie.

Hotlink Landingpage
Hotlink Landingpage: Voll von Werbebanner, Bild unter ferner liefen …

Und was macht Google?

Google indexiert die neue Seite, und weil dort erstens sehr viele relevante Bilder zu finden sind, und die Seite jünger ist als alle anderen, verlinkt Google die Thumbnails mit den Spam-Seiten. Zum Teil wurden über 50% der Top-10-Bilder von Bilderpiraten mit Hilfe von Hotlinks gekapert. Vor allem Ingo Henze beschäftigt sich seit Jahren mit diesem Problem und hat zahlreiche Fallbeispiele beschrieben. Sehr häufig bemerken es die Rechte-Inhaber überhaupt nicht – und wenn doch: dann kann man meist auch nichts machen. denn die Seiten werden in Ländern betrieben, wo die deutsche Justiz kaum Eingriffsmöglichkeiten hat.

Problem Hotlinking: Google verlinkt den Spam!
Problem Hotlinking: Google verlinkt den Spam!

Einzige Lösung bleibt eine Meldung bei Google. Doch leider: selbst wenn Google diese Domain dann ausschaltet, hat der Inhaber des automatisierten Systems längst eine andere Domain registriert, mit der in Minutenschnelle ein neuer Klon erzeugt wird. Eine scheinbar never-ending-story zulasten der Bildrechte-Inhaber, die das meist überhaupt nicht merken.

Was tun gegen Hotlinking?

Für den Website-Betreiber gibt es praktisch keine Möglichkeit, Hotlinking zu unterbinden. Zwar kann man via htaccess bestimmte Domains aussperren (siehe dazu diesen Artikel von Daniel Weihmann), so dass die eigenen Bidler dort nicht angezeigt werden. Aber man weiß ja nicht vorher, welche neuen Spam-Domains es gibt. Erst wenn diese Domains in der Bildersuche verlinkt werden, kann man aktiv werden. Aber da die Bildersuche immer noch relativ träge ist, vergehen oft Tage oder Wochen, ehe sich die Linkziele in der Bildersuche ändern. Bis dahin ist längst eine neue Domain am Start…

Google Bildersuche Hotlink-Spam
Google Bildersuche Hotlink-Spam: teilweise über 50% gekapert

Es gibt keine Lösung …

Die einzige Möglichkeit, das Hotlinking-Problem zu lösen, liegt bei Google. Dort müsste man die Kriterien für die Thumbnail-Links anpassen. Aber wie sollte das gehen? Bilder auszulagern ist ein vollkommen sinnvoller Prozess.

  • Wenn Google nur Linkziele zuließe, die auf dem gleichen Server liegen wie die Website, würden Wikipedia, Amazon, und so weiter alle aus den Bildersuche-Ergebnissen fliegen. Geht nicht.
  • Die Website der ersten Indexierung zu nutzen ist auch schwierig. Erstens könnte das Bild vorher schon woanders eingebunden gewesen sein, und der Crawler hat es nur nicht bemerkt. Und zweitens spricht auch einiges für die Methode, den jeweils aktuellsten Artikel zu dem Thema zu bevorzugen.
  • Entscheidend ist sicherlich die Onpage-Relevanz eines Artikels, aber: die ist gerade hinsichtlich der Suchintention in der Bildersuche meist kaum klar zu definieren. Weill jemand, der ein Thumbnail in der Bildersuche anklickt, eher eine Website mit langem Text und dem einen Bild? Oder will man eher eine Sammlung zahlreichen Bilder? Onpage-Relevanz ist alsentscheidendes Kriterium also auch fragwürdig.

Kurzum: das Hotlinking-Problem ist systemisch bedingt und in absehbarer Zeit nicht zu lösen. Wir alle werden damit leben müssen, dass kriminelle Programmierer unsere Bilder für ihre egenen Zwecke missbrauchen. Zumindest, solange sie sich auf vorderen Positionen der Google Bildersuche befinden.

Wer das Thema weiter verfolgen möchte, sollte unbedingt auch den Schnurpsel-Blog von Ingo abonnieren oder bookmarken.

Weiterlesen?

13 Gedanken zu „Was ist ein Hotlink? Warum hat Google damit Probleme?

  1. Würde denn der Lösungsansatz von Daniel Weihmann das Problem nicht beheben? Wenn ich in die .htaccess z.B. folgende Zeilen einfüge (ungetestet):


    RewriteEngine On
    RewriteCond %{HTTP_REFERER} !^http(s)://(\w+\.)?(google|bing|pinterest|meinedomain)\.\w+/.*$ [NC]
    RewriteCond %{REQUEST_URI} \.(png|gif|jpg)$ [NC]
    RewriteRule ^.* – [F]

    Dann könnte doch niemand (außer Google, Bing, Pinterest und ich) mein Bild „hotlinken“, oder machen die das dann „blind“ im Wissen, dass Google darauf Zugriff hat?

    [Edit: zwei Zeilen werden von WordPress herausgefiltert, daher hier der Code als Bild: http://www.tagseoblog.de/images20/hotlink-schutz-htaccess.jpg)

    1. keine Ahnung, ob das funktionieren würde. Aber für mich wäre es nicht zu gebrauchen, weil ich meine eigenen Bilder durchaus auf (meinen) anderen Domains verwenden möchte. Außerdem habe ich in vielen Fällen auch nichts dagegen, wenn meine Bilder genutzt werden (z.B. im schulischen Bereich).

      Danke für den Hinweis, mal sehen, was die Techniker dazu sagen :-)

      1. Naja, Du könntest Deine Domains ja in den RegExp mit einbauen. Das Ganze funktioniert natürlich nur, wenn der Referrer übermittelt wird, also bei https-to-http würde das versagen…

        Im Quelltext oben sind leider ein paar Zeichen weggefiltert, aber es geht ja nur um das Prinzip ;)

  2. Ich habe tatsächlich „größere“ Probleme mit Hotlinking, da Google die hotlinkte Kopie der Produktbilder vor dem Original vorzieht. Auf der Zielseite wird dann mit Adsense abgeräumt, da die Bilder auch nicht zum Original verlinkt sind. Habe sogar schon mehrere Requests an Google eingereicht. Alles ohne Erfolg.
    Als Du den ursprünglichen Artikel geschrieben hattest, hatten wir zusammen an einer Lösung getüftelt, aber das Protokoll erlaubt halt nur ganz oder gar nicht (Sperre). Sprich, wenn man sperrt, sperrt man auch Google aus. Ausnahmen aus einer RegEx definieren geht leider nicht :(

    1. Könnte das Problem vielleicht sein, dass bei den Tests der Referrer verloren ging (https-to-http) und die htaccess-Regel deshalb nicht funktionierte. Dann üssten die Bilder ja „nur“ via https erreichbar sein. Es mag mir irgendwie nicht einleuchten, dass die htaccess-Regel nicht funktionieren soll …

  3. Auf den von Martin bei mir im Blog verwiesen Artikel aus dem Jahr 2012 kann man setzen, wenn man eine überschaubare Anzahl an Websites hat, die das Bild Host-übergreifend anzeigen dürfen -> Whitelist. Das passt sicher für viele.

    Da die typischen Bilder-Spam-Seiten eher nicht mit einer .de-Domain unterwegs sind, ließe sich in der .htaccess auch ein Einbinden nur von z.B. .de-Domains erlauben.

    Das Pflegen einer Blacklist ist zu viel Aufwand und lohnt sich sicherlich nur für Webmaster, die ein paar bestimmte Seiten vom Hotlinking aussperren wollen. Ich hatte da mal mit ein paar hochfrequentierten Foren zu kämpfen, die ein paar Bilder von mir per Source eingebunden hatten. Hier war dann schnell Schluss mit dem für mich unnützen Traffic und den damit verbundenen Serverlasten.

  4. Ich versehe meine Bilder mittels php-Script automatisch mit einem Wasserzeichen, sobald diese nicht mehr über die von mir direkt im Script definierten HTTP_REFERER verlinkt sind!

    Einfach alle Bilder der Seite über das Script jagen:

    RewriteCond %{REQUEST_FILENAME} \.(jpe?g|gif|png|JP?G|GIF|PNG)
    RewriteCond %{QUERY_STRING} !^$
    RewriteRule . image.php [QSA]

    Im Script kannst Du dann z.B. per Array alle erlaubten Hosts eintragen und diese mit dem aktuellen HTTP_REFERER abgleichen -> Wenn der nicht erlaubt ist (Hotlink) oder leer (passiert durch firewalls ecc), dann wird das Wasserzeichen als Text oder auch als Grafik mittels php Image-Funktionen über das Bild geschrieben und das neue Bild ausgegeben.

    Da ja Hotlinking (soweit ich weiß) nur bei „identischen Bilddateien“ funktioniert, also nicht nur die URL gleich ist, sondern auch der BitWert o.ä. (keine Ahnung was Google hier genau heran zieht) sollte das das Hotlinking verhindern, da ja für Google „neue Bilder“ sich immer erst im Ranking beweisen müssen…
    …das System jedenfalls funktioniert; ob es tatsächlich vor Hotlinking schützt müsste man testen – Ich selber habe leider keine so guten Bilder an denen man das austesten könnte!

  5. @Armin
    Da der Google-Bot ohne Referrer abfragt, „sieht“ er aber nicht das geändert Bild, falls leere Referrer erlaubt sind. Insofern ist für Google das Bild immer das selbe.

    Wenn leere Referrer nicht erlaubt sind, bekommt Google das veränderte Bild vorgesetzt und man bekommt möglicherweise eine manuelle Maßnahme „Nicht übereinstimmende Bilder“.

    Kurz und gut, für das Ranking in der Bildersuche hat so etwas praktisch keinen positiven Nutzen.

  6. Guten Morgen,

    puh, das ist wirklich ein Problem, welches immer mehr von Bedeutung für mich wird. Ansich hatte „Admin“ natürlich einen super Vorschlag,alle Bilder über ein Script zu ziehen. Wie siehst das denn genau aus, ich habe leider nicht so weitreichende Kentnisse um das vernünftig burteilen zu können aber „Schurpsel“ hat da ja Bedenken geäußert was leere Referrer angeht. Kann mir das vielleicht kurz jemand erklären?
    Ich bin berade erst dabei mich intenvier mit diesem Thema auseinander zu sentzen und habe daher noch nicht so ein großen Wissenspool ;-)

  7. Bei gleichartigen Bildern ist es mir immer noch ein Rätsel, welches Bild google bevorzugt. Ich schwanke zwischen: Wer es zuerst veröffentlicht hat und wer die meisten backlinks auf seine Seite zu verzeichnen hat… bzw. den meisten traffic hat

Kommentare sind geschlossen.

Kommentare sind geschlossen.