Fehlerhafte „Anzahl der Bilder“ bei der Google Bildersuche

Die Anzahl der angezeigten Bilder in der Google Bildersuche (direkt unter dem Sucheingabefeld) ist fehlerhaft. Das ist zwar nicht neu, aber leider wissen es viele nicht, was zu Verwirrung und falschen Schlüssen führen kann. Daher habe ich das Problem nochmal genauer unter die Lupe genommen. Grob verallgemeinert kann man sagen: bei einer geringen Anzahl von Bildern stimmt die Zahl meist ungefähr überein, aber sobald es mehr als 500 Ergebnisse werden, fängt Google an, die Anzahl der indexierten Bilder deutlich nach oben zu schrauben.
Alte und neue Bildersuche

Nehmen wir als erstes Beispiel die Site-Abfrage für die Bildergalerie dieses Blogs (hier in der Google Bildersuche). Es wird angezeigt, dass Google „ungefähr“ 3.100 Ergebnisse gefunden hat. Wow. Wenn ich nun in den alten Modues wechsel – der Button dafür befindet sich (leider) ganz unten am Ende der Seite -, dann werden mir plötzlich 3.130 Ergebisse angezeigt. Nagut, steht ja auch „ungefähr“ da. Diese kleine Schwankung ist zu verkraften. Allerdings: ich habe erst ca. 1050 Bilder in dieser Galerie hochgeladen (511 Bilder, je, groß und als Thumbnail plus 11 Kategorien (auch je als Thumbnail) plus ein paar kleine Design-Elemente. Google kann also gar nicht 3.100 finden, egal ob +-30. Google zeigt oben unter den Suchfeld also eine fast verdreifachte Anzahl der Ergebnisse an.

Wenn man nun in der Google-Bildersuche die Bilder durchzählt, dann kommt man am Ende auf 681 Bilder. Das ist bei beiden Versionen identisch (wenn ich mich bei der neuen Darstellung nicht verzählt habe ;-) ). Und diese Zahl ist ja auch durchaus realistisch. [Btw: Interessant ist übrigens, dass von diesen 681 Bildern insgesamt 509 große Bilder dabei sind, und folglich nur 172 Thumbnails. Das bestätigt meine These, dass Google die Thumbnails nach einer gewissen Zeit wieder löscht, wenn es ein identisches großes Bild dazu gibt.]
Von ca. 522 großen Bildern hat Google 509 indexiert. Ich halte das für einen sehr guten Wert. Theoretisch müsste man jetzt mal nachprüfen, welche Bilder nicht bei Google zu finden sind. Aber dafür habe ich gerade nicht die Muße ;-)
Wenn ich nun in der alten Bildersuche ein wenig auf den hinteren Seiten herumblättere, verändert sich bei mir ständig die anzahl der gefundenen Ergebnisse – ohne ersichtlichen Grund. Von 2.990 bis 3.340 ist alles mal dabei. Die Schwankung liegt also in diesem Fall bei +-350 bzw. bei ca. 10%.

SafeSearch-Filter „moderat“ und „off“

Besonders heikel wird es, wenn man den safeSearch-Modus ändert. Denn statt der zuvor gezeigten 3.100 Bilder werden nun angeblich 3.370 gefunden. Beim Thema SafeSearch hatte ich ja empfohlen, aktiv zu werden, wenn man im „off“-Modus eine Differenz feststellt. Ich habe dann allerdings wie oben beschrieben die Bilder durchgezählt: es sind effektiv genauso viele wie im „moderaten“-Modus. Das bedeutet, dass auch hier die Anzeige der „gefundenen Ergebnisse“ deutlich abweicht. Allerdings alles im Rahmen der soweiso drei mal zu großen Zahl.
Wenn man zwischen der deutschen und der internationalen Bildersuche wechselt, kommt es zu vergleichbaren Schwankungen.
Ein zweites Beispiel: briefmarken-bilder.de

Bei meinem neuen Projekt „Briefmaken-Bilder“ kann man im Prinzip das Gleiche feststellen: es werden „ungefähr 2.060 Ergebnisse“ von Google angezeigt (siehe hier). Aber bislang habe ich erst 800 hochgeladen, von denen sind allerdings erst 525 im Bildersuche-Index, wenn man die Seiten durchblättert und zählt. In diesem Fall zeigt Google also die fast vierfache Menge an. Auch hier kann man die üblichen Schwankungen um ca. 10% der von Google progostizierten Gesamtzahl feststellen.
Ein drittes Beispiel: duplicon.de
Noch viel klarer wird das Missverhältnis, wenn ich die Site-Abfrage meiner Firmendomain Duplicon durchführe (siehe hier). Da zeigt mir Google „ungefähr 1.180 Ergebnisse“ an, obwohl es effektiv nur 200 sind, die auch alle indexiert sind. Erst wenn man in der alten Google-Bildersuche auf die letzte Seite blättert, bemerkt auch Google den Fehler und zeigt dann korrekt: „Seite 10 von 200 Ergebnissen“.
Viertes Beispiel: martin-missfeldt.de

Bei allen bisher genannten Galerien sind weniger als 1.000 Bilder im Google-Bildersuche-Index. Bei meiner Homepage Martin-Missfeldt.de sind es allerdings mehr (siehe hier). Bei der Site-Abfrage wird angeziegt, dass Google „ungefähr 13.000“ Ergebnisse findet. Wohl kaum, denn ich habe dort bislang erst ca. 2.000 Bilder hochgeladen. Das Problem, wenn mehr als 1.000 Bilder von Google indexiert sind: man kann nicht mehr nachzählen. Es werden nämlich nur max. 1.000 Bilder angezeigt. Es lässt sich also bei Galerien jenseits der 1.000 Bilder nur spekulieren. Gleichwohl ist die Wahrscheinlich, dass dann etwas grundsätzlich anders ist, extrem gering.
Weitere Beispiele…
Nun mag man vermuten, dass diese Vervielfachung der angezeigten Ergebnisse nur mit der Site-Abfrage zu tun hat. Ich habe die drei Beispiele zuvor deshalb genannt, weil ich da genau weiß, wie viele Bilder es tatsächlich gibt, und wie viele im Bildersuche-Index sind. Aber das Ganze ist auch bei vielen andere Suchanfragen so. Ein paar Beispiel:
- „Apfelbaumrinde“ zeigt „ungefähr 1.910 Ergebnisse“ an, es sind aber nur 346
- „Augenringmuskel“ zeigt „ungefähr 861 Ergebnisse“ an, es sind aber nur 506
- „Rankingpeter“ zeigt „ungefähr 1.370 Ergebnisse“ an, es sind aber nur 472
- „Madenaugen“ zeigt „ungefähr 1.370 Ergebnisse“ an, es sind aber nur 297
- „Spiegeleiweiss“ zeigt „ungefähr 99 Ergebnisse“ an, es sind aber nur 80
- „Nasengurke“ zeigt „ungefähr 42 Ergebnisse“ an, es sind aber nur 40
- und so weiter…

Ich habe ca. 100 Tests durchgeführt, die alle zeigen, dass die Anzahl der Bilder viel zu hoch geschätzt ist. Aber es lässt sich kein wirklich klares Muster der Falschheit ablesen. Aber in der Tendenz kann man sagen, dass es die Fehleinschätzung von Google mit zunehmender Anzahl tatsächlich indexierter Bilder deutlich größer wird. Anders gesagt: je mehr Bilder im Index, um so mehr übertreibt Google.
Bei einigen Keywords wird auf der letzten Seite unten ein kursiver Text eingeblendet:
Um Ihnen nur die treffendsten Ergebnisse anzuzeigen, wurden einige Einträge ausgelassen, die den 472 bereits angezeigten Treffern sehr ähnlich sind.
Sie können bei Bedarf die Suche unter Einbeziehung der übersprungenen Ergebnisse wiederholen.
Wenn man dann allerdings den Link zur „Einbeziehung der übersprungenen Ergebnisse“ anklickt, werden nur die identischen Ergebnisse angezeigt und nicht irgendwelche angeblich übersprungenen.
Fazit

Warum die Anzahl der Ergebnisse so falsch ist, kann ich nicht sagen. Aber es wird Zeit, dass Google das Problem mal in den Griff bekommt. Denn wie bereits gesagt: es hat noch nie funktioniert. Und sooo schwer kann das doch eigentlich gar nicht sein, oder? Einfach die Anzahl im Index auslesen. Oder ob Google die Bilderauswahl zu jeden key jeweils on the fly neu berechnet?
Festzuhalten bleibt:
- Die Anzahl der „ungefähr gefundenen Ergebnisse“ in der Google-Bildersuche ist fast immer zu hoch – meist viel zu hoch.
- Mit zunehmender Anzahl der tatsächlich indexierten Bilder vergrößert sich die Fehleinschätzung.
- Man muss in aller Regel davon ausgehen, dass nur ein Drittel bis ein Viertel der angezeigten Bilder tatsächlich im Index hat.
- Das Gesagt betrifft nur Galerien, die bis maximal 1.000 Bilder im Google Index haben. Mehr Bilder zeigt Google nicht an, so dass man die tatsächliche Anzahl indexierter Bilder nicht mehr überprüfen kann. Ich gehe jedoch davon aus, dass sich die genannte Fehleinschätzung bei zunehmender Bilderanzahl noch vergrößert.
Wer also einen Shop oder eine Website besitzt und auch in Sachen Bilder optimieren möchte, sollte sich durch die von Google genannte Anzahl der „ungefähr indexierten Ergebnisse“ nicht blenden lassen. „Ungefähr…“ bedeutet in der Google Bildersuche: „Viel viel weniger als…„.
21 Gedanken zu „Fehlerhafte „Anzahl der Bilder“ bei der Google Bildersuche“
Interessant fand ich kürzlich auch, daß es bei SafeSearch „Aus“ weniger Bilder laut Anzeige wurden. Es müßten nach meinem Verständnis ja mehr Bilder werden oder zumindest müßte die Anzahl gleich bleiben (falls es gar keine anzüglichen Bilder gibt).
Und es gibt auch nicht wirklich fast 60000 Simsalseo-Bilder. :-)
Ja, habe ich auch schon erlebt, dass bei safeSearch-Off weniger Bilder angezeigt werden. Bei der „Strikt“- Einstellung kommt das sogar noch häufiger vor, dass dann merh Bilder angezeigt werden als im „moderate“-Modus. Das sind eben die erwähnten „Schwankungen“, warum auch immer.
Wegen Simsalaseo ist das Thema bei mir wieder hochgekommen (das klingt irgendwie merkwürdig ;-) ). Einige waren tatsächlich der Meinung, dass es schon so viele Bilder dazu gäbe ;-)
Besonders ärgerlich finde ich die Begrenzung auf ca. 1000 Bilder bei den Suchergebnissen; z.B. beim Stichwort „Paris“ meldet Google „Ungefähr 166.000.000 Ergebnisse“, zeigt mir aber nur 1000 an, da ist also nur ein minimaler Bruchteil der Bilder über die Suche direkt auffindbar. Bei der organischen Suche ist es natürlich genauso.
Naja, mehr als 1000 Bilder wird sich kaum jemand anschauen. Und wenn, muss man eben die Suchanfrage verfeinern. Die Begrenzung finde ich an sich nicht schlimm, auch wenn ich nicht verstehe, warum das so ist.
Naja also für mich spielt es keine echte Rolle, da ich momentan nicht wirklich Bilder Seo mache, aber gibt es denn irgendeine sinnige Möglichkeit meine Indexierten Bilder zu überwachen.
Hast du oder irgendjemand da einen Trick auf Lager, wenn Google in dieser Variante keine guten Zahlen rausrückt?
Ich frag mich auch ein wenig aus welchem Grund Google das macht? Übertreiben sie nur, um dem USer vorzugaukeln, dass sie toll viele Ergebnisse haben?
Nein, ich kenne kein Tool oder dergleichen, mit dem man das abfragen könnte. Ich würde daher immer empfehlen, die Bilder auf Subdomains zu verteilen und jeweils nur max. 1000 hochzuladen. Bei den ganz großen Sites geht das natürlich nicht, aber in vielen Fällen ist das die beste Möglichkeit, um den Überblick zu behalten.
Ich hatte vor einiger Zeit das Gefühl dass Google zunächst keine neuen Bilder bei „Strikt“ anzeigt. Als müssten diese erst validiert werden.
Konkret aufgefallen bei einem sehr großen Relaunch (so viele gabs davon ja nicht die letzten Monate ;) wo als „Strikt“ zunächst nichts angezeigt wurde, bei „Moderat“ jedoch (damals) 300 Bilder von keinen keines in den Filter fallen könnte.
Ist dir auch sowas aufgefallen in letzter Zeit?
Sorry, aber ich versteh das nicht ganz. Das bei „strikt“ nichts angezeigt wird, aber bei „moderat“ 300, kann doch sein. Dann ist sich Google aufgrund welches Signals auch immer nicht sicher, ob die Bilder wirklich „strikt“-safe sind.
Es geht darum, dass die Bilder sowie die Domain im Grunde neu sind. Und keines der Bilder könnte, aus welchem Grund auch immer, anstößig u.ä. sein. Daher meine Vermutung, dass Google zunächst alle neuen Bilder nicht bei Strikt anzeigt, sondern diese erst nachträglich geprüft werden.
Trefferzahlen in Suchmaschinen sind immer wieder ein Ärgernis. Das Problem der „zu hoch geschätzten“ Trefferzahlen gibt es leider in praktisch allen allgemeinen Internet-Suchmaschinen. Für den Normalnutzer ist das wohl zweitrangig, aber bei wissenschaftlichen Recherchen schon sehr ärgerlich (ich arbeite an einer Uni-Bibliothek).
Mein Kenntnisstand ist, dass die Treffer aus verschiedenen Teil-Indexen kommen und die Ergebnisse aus einem Teil-Index dann einfach hochgerechnet werden. Allerdings fällt auf, dass die Trefferzahlen immer zu hoch sind, ganz besonders bei der Site-Search. Da habe ich schon Beispiele gefunden, wo Google „ungefähr 30.300 Treffer“ meldet, es werden aber nur 135 angezeigt.
Ich weise in meinen Schulungen zum Thema Internetrecherche schon seit Jahren darauf hin, dass die Trefferzahlen in Suchmaschinen unbrauchbar sind. Nachprüfen kann man es ja häufig auch nicht, da nur maximal 1.000 Treffer angezeigt werden. Ich denke mal, mehr zeigen die Suchmaschinen nicht an, damit man eben nicht genau nachprüfen kann, wie viel wirklich im Index drin ist. Da muss dann die Aussage „ein paar hundert Milliarden Webseiten und Bilder“ reichen.
Der Link ganz am Ende der Trefferliste sollte eigentlich schon ein paar mehr Treffer zu Tage fördern – zumindest bei der Websuche funktioniert das auch meist. Alternativ kann man in die URL der Google-Trefferliste &filter=0 anhängen, dann wird der Zwangsfilter für (angebliche) Duplikate abgeschaltet.
Danke für den Hinweis :-)
Naja das ist ja im Endeffekt nichts neues, das Spielchen kennste doch bereits von den normalen SERPS. Wieso weshalb warum, weiss sicher nur Google selbst, denn sicher ist eins: Google ist definitiv in der Lage die korrekten Zahlen zu liefern (wenn sie wollten), „Falschzahlen“ auszuliefern ist eher nen Extraaufwand für Google, also machen die das mit „Vorsatz“, Matt Cutts hatte ja irgendwann mal (sorry Quelle grad nicht mehr greifbar) sogar gesagt das die solche Suchergebnisangaben auch gerne spasseshalber „randommässig“ raushauen, quasi irgendwelche Zahlen. Maybe auch um SEOs in die Irre zu führen, denn mit solchen willkürlichen Zahlen kann keiner was anfangen, schon gar nicht die Konkurrenz für ein key ermitteln :)
Das ist mir ein wenig zu „Verschwörungstheoretisch“ ;-) . Ich glaube nicht, dass Google da absichtlich Falschzahlen rausgibt. Letztlich könnte man damit höchstens im Vergleich zur Konkurrenz zu punkten versuchen, aber das scheint mir zu plump.
Ich glaube eher, dass es mit der Methode zu tun hat, wie Google die Bilder bzw. Daten strukturiert (siehe hierzu auch den Kommentar von Bibliothekswelt oben). Scheinbar werden die Ergebnisse tatsächlich on the fly berechnet und eingeblendet, und ein echtes Zählen würde offenbar zu viel Zeit beanspruchen. Daher wird, wie Bibliothekswelt sagt, eben nur geschätzt.
Aber klar: das ist schon lange so :-)
Stimmt schon, dass Googles Daten leider gerne mal unzuverlässig sind, ist wohl war. Trotzdem stellt sich mir da eben immer wieder die Frage warum nur. Klar können SEos damit dann wenig anfangen, andererseits sind gerade SEOs darüber ja aufgeklärt, die einzigen die hier ins straucheln gebracht werden sind ja eher die normalen User und im Grunde könnte Google dann ja auch keine solchen Daten präsentieren.
Wie immer alles sehr strange
Einen hab ich noch. :-)
Besonders lustig war mal der Fehler, als die Anzahl quasi mit der Nummer der Trefferseite multipliziert wurde. Ist aber schon eine Weile her:
http://schnurpsel.de/wundersame-vermehrung-wie-google-trefferzahlen-steigert-269/
Man muss übrigens nicht wirklich Bilder zählen. Wenn man auf ein Bild in der Bildersuche klickt, öffnet sich ja erstmal ein Link von Google Images mit dem Vorschaubild. Dieser endet wie folgt:
ved=1t:429,r:2,s:0
Hinter r: steht die Position in der Bildersuche.
Bei der alten Bildersuche war das etwas anders, ich glaube da stand es hinter &start=
du musst die anzahl der seiten rechnen also zb auch bei wordpress blogs archive und kategorien und tags. dadurch ergibt sich die differenz
Die Kommentare sind geschlossen.