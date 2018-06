Vor einigen Tagen überraschte mich eine Meldung bei Seo-Suedwest: Google erkennt wohl keine Bilder aus Div-Tags. Christian bezog sich dabei auf eine Twitter-Q&A mit John Müller, seines Zeichens Webmaster-Optimierer bei Google. Die Frage war: „Kann Google Bilder indexieren, die in einem Div-Container eingebunden werden? Also z.B. div src=image.jpg“ – Johns Antwort: „Ich bin sicher, dass nicht … – aber teste es!“ … Was liegt für einen Bilder-Seo näher, als das tatsächlich zu testen.

Die Frage ist für mich auch deshalb von Bedeutung, weil ich bislang davon ausgegangen bin, dass Google alle Bilder bzw. Bild-URL in einem Quellcode indexieren würde. Ich dachte bislang, dass ein HTML-Dokument in Gänze abgescannt würde – und dass bei jeder URL, die am Ende eine Bild-Endung hat (also .jpg, .png, .gif, .svg, .webp), geprüft würde, ob sie existiert. Diese These basiert darauf, dass Google an sich extrem „neugierig“ ist und im Zweifelsfall alles indexieren möchte, was irgendwie auffindbar ist.

Testumgebung

Ich habe daher zwei Testumgebungen aufgesetzt: eine hier im tagSeoBlog und eine auf meiner Domain Bildersuche.org.

Auf jeder Seite habe ich ein Bild mit Text (das, was jeweils getestet wird) sowie ein Kunstwort, mit dem man recht einfach in der Google-Suche prüfen kann, ob die jeweilige Seite oder das Bild indexiert ist.

Die Bilder sind jeweils nur rund 25 kb groß sind (640 x 440 px). Ich weiß aus Beobachtungen der letzten Monate, dass Google solche Bilder sehr flott indexiert (anders als größere Formate). Daher kann man davon ausgehen, dass nach nunmehr 4 Tagen die Ergebnisse belastbar sein sollten. Inzwischen sind alle relevanten Seiten indexiert.

Der Test ist auch insofern sehr einfach, weil es nur um „ja oder nein“ geht. Man muss also keine Rankings interpretieren oder sonstewas. Entweder ist ein Bild in der Google Bildersuche zu finden – oder eben nicht. Da ich gerade dabei war, habe ich zudem noch einige andere Tests aufgesetzt, die vergleichbar sind.

Die Tests

Folgende Fragen habe ich getestet:

Ergebnisse

Die Ergebisse als Tabelle:

Was nicht klappt bzw. nicht indexiert wird:

In der Tat werden Bild-URLs, die in div-Containern eingebettet sind, nicht indexiert und nicht in der Google Bildersuche angezeigt. Dabei spielt es keine Rolle, ob der Aufruf über eine src oder eine style-Anweisung erfolgt.

eingebettet sind, nicht indexiert und nicht in der Google Bildersuche angezeigt. Dabei spielt es keine Rolle, ob der Aufruf über eine src oder eine style-Anweisung erfolgt. Auch in HTML-Kommentaren werden Bild-URLs offenbar ignoriert.

werden Bild-URLs offenbar ignoriert. Gleiches gilt für <p>-Absätze oder <h…> Überschriften.

Im Grunde ist das alles logisch, denn diese Tags bzw. ihre Attribute enthalten keine Inhalte, sondern sie sind strukturierende Elemente.

Anders bei den übrigen Tests:

Ein iframe muss sich sogar auf eine Quelle (src) beziehen, von wo die Inhalte geladen werden. Folglich folgt Google dieser URL und indexiert das Bild.

muss sich sogar auf eine Quelle (src) beziehen, von wo die Inhalte geladen werden. Folglich folgt Google dieser URL und indexiert das Bild. Dass eine Bild-URL im Text gecrawlt und dann auch indexiert wird, ist ja schon lange bekannt. Ich wollte es lediglich nochmals verifizieren.

gecrawlt und dann auch indexiert wird, ist ja schon lange bekannt. Ich wollte es lediglich nochmals verifizieren. Auch dass Google Javascript ausführt , ist bekannt. Wenn eine Bild-URL erst über eine Javascript-Funktion generiert wird, ist das für Google kein Hindernis und das Bild wird indexeirt.

, ist bekannt. Wenn eine Bild-URL erst über eine Javascript-Funktion generiert wird, ist das für Google kein Hindernis und das Bild wird indexeirt. Naja, und dass Google nun auch Base64-Bilder (Inline-Images), die nur im Quellcode vorliegen, indexiert, hatte Ingo ja schon vor einiger Zeit beschrieben.

Interessant scheint mir noch folgendes: wie man auf der Testseite mit dem „Bild-URL im Style-Attribut eines Div“ sehen kann, wird das Bild vom Browser zwar angezeigt, aber nicht indexiert. So kann man Bilder einbinden und anzeigen, die ggf. nicht von Google indexiert werden sollen.

Fazit

Meine ursprüngliche These, dass der Googlebot 2.1 sich die gesamte HTML-Datei vornimmt und jegliche Bild-URL verwertet, ist demnach falsch. Offenbar werden nur solche Elemente ausgewertet, die potentiell tatsächlich Inhalte (im redaktionellen Sinne) enthalten können. Dazu gehören nicht strukturierende Tags wie <div>, <h1> oder <p>. Weder src-URLs noch style-Attribute werden von der Crawler-Suche nach Bild-URLs beachtet. Das ist aber auch scheinbar logisch, weil diese Bilder ja sowieso von keinem Browser angezeigt würden. Ich sage „scheinbar“, weil natürlich auch Bild-URLs, die nur im Text vorkommen, nicht angezeigt werden. Aber in dem Fall denkt Google wohl: der Text ist Teil des Inhalts, also werden Bild-URLs geprüft.

So oder so sollte man aber natürlich Bilder so einbinden, wie es eine saubere HTML-Struktur vorsieht: als Image-Tag, am besten im Rahmen eines figure- oder picture-Elementes.

Natürlich steht dieser Artikel unter dem Vorbehalt, dass es möglicherweise länger dauert, ehe die oben genannten Bild-URLs gecrawlt und indexiert werden. Ich halte es aber für sehr unwahrscheinlich, dass sich da noch etwas tut. Falls ja, gibt es die Info natürlich hier im Blog :-)

