IDF*WDF und der Schwafel-Score

IDF*WDF und der Schwafel-Score

Google Schwafel-Score
Google Schwafel-Score

Die allseits geschätzte Astrid Jacobi hat gestern bei t3n einen interessanten Artikel gepostet: „SEO: Google-Patent berechnet den Schwafel-Score einer Website„. Wer ihn nicht gelesen hat, sollte das nachholen. Darin beschriebt sie ein Google-Patent, dass (mal wieder) durch Bill Slawski öffentlich wurde: „Google Scoring Gibberish Content to Demote Pages in Rankings?„. Das Patent wurde schon vor vier Jahren eingereicht, aber erst vor einigen Tagen bestätigt. Wahrscheinlich ist die „Erfindung“ längst im Google-Algorithmus enthalten. Ich halte sie jedoch, vor allem vor dem Hintergrund der zunehmenden Verbreitung der WDF*IDF-Tools, für bedenkenswert.

Google Spam
Google Spam

Während es beim Panda um „zu dünnen“ Content geht, und beim Pinguin der Spam-Verdacht anhand von Links konkretisert wird, zielt dieses Patent auf die Auswertung der Inhalte an sich.

Beim Gibberish Content Score, oder auch Schwafel-Score geht es im das Identifizieren von belanglosen Texten. Also solche Inhalte, die nur für Suchmaschinen zusammengebastelt wurden. Zwei Bereiche sind aus Google-Sicht für diese Text-Analyse wichtig: der Sprach-Score und Stuffing-Score. In beiden Fällen geht es um das statistische Vergleichen von Texten. Beim Sprach-Score wird die Reihenfolge der Begriffe untersucht. Astrid nennt als Beispiel „wie grün sind deine Blätter“. Diese Reihenfolgen ist weitaus gebräuchlicher als „grün deine Blätter sind wie“. Man kann es auch „Yoda-Sprache“ nennen, die nicht gut ist, Google sagt.

Mainstream ist am Besten

Dieser Ansatz allein zeigt schon, wie sehr Google den Mainstream als Qualität definiert. Alles, was – statistisch gesehen – von der Norm abweicht, ist potentiell spamig. Aber: Durchschnitt lässt sich ermitteln. Daher hat Google eine Art Filter eingebaut.

Der zweite Punkt für die Identifizierung von Schafel-Content nennt sich „Stuffing-Score“. Wenn das Patent nicht schon vor 4 Jahren eingereicht worden wäre, würde ich denken, dass Google dem lieben Karl damit eine Breitseite vor den Bug setzen wollte :-). Denn der Stuffing-Score prüft, ob nicht zu viele relevante Keywords im Text enthalten sind (!). Im Patent nennt Google das Katzenbeispiel, dass auch Astrid aufgreift: For example, the index key „cat“ is associated with queries „cat“, „cat food“, „tabby cat“, „cat show breeds“, „how to wash a cat“ and „funny cat photos“. Im Zusammenhang mit dem Keyword (Erklärung) „Katze“ kommen demnach besonders häufig folgende Terme vor:

  • Katzenfutter
  • Lustige Katzenbilder
  • Wie bade ich eine Katze
  • Getigerte Katzen
  • Weiße Katzenbabies

Statistisch gesehen ist es wahrscheinlich, dass in einem „normalen“ (d.h. guten) Text drei der Terme genutzt werden. Aber eben nicht alle. Wenn alle 5 Terme im Text vorkommen, deutet das laut dem Google-Patent darauf hin, dass „Stuffing“ vorliegt. Nicht mehr das allseits beliebte Keyword-Stuffing, von dem wir alle wissen, dass es nur in der Urzeit des Internets funktioniert hat. Nein, es ist ein „Term-Stuffing“. Und genau hier wird es für die User der WDF*IDF-Tools kniffelig.

WDF*IDF: riskant für Deine Analyse es ist

Denn WDF*IDF macht ja genau das: statistisch auswerten, welche Terme besonders häufig auftreten. Wer seine Texte entlang der WDF*IDF-Tool-Empfehlungen zusammenbastelt, läuft demnach Gefahr, einen überoptimierten Text zu generieren. Überspitzt formuliert muss man sich bei einem Text über „Golf“ entscheiden, ob es um Sport, ein Auto oder eine Meeresströmung geht.

So schön die Tools auch sind: aber sie können erstens keine schönen Texte schreiben, und zweitens liefern sie inhaltlich nur den optimalen Durchschnitt. Wer den Durchschnitt zu gut abbildet, ist ein Schwafler.

Fazit

Um bei Google vorne zu stehen, braucht ein Text neben ca. 3/4 gutem Durchschnitt noch 1/4 individuelle Klasse. Grob vereinfacht – und völlig nichtssagend ;-)

Hier das „Original-Patent“ mit dem reizenden Titel „Identifying gibberish content in resources „.

Google Schwafel Score gegen blödsinnigen Content
Google Schwafel Score gegen blödsinnigen Content

Weiterlesen?

22 Gedanken zu „IDF*WDF und der Schwafel-Score

  1. Ganz ehrlich? Vielleicht einfach nur Texte schreiben so wie man sie selber als hilfreich uns lesenswert erachten würde. Da brauch es dann keine Tools für die mir sagen, ob mein Text nun gut ist oder nicht!

  2. Guten Morgen Sascha,

    ääääh, Martin. Großer! Was redest Du denn da?!? Ich bin wirklich entsetzt, weil Du Dich gerade (absichtlich?) geoutet hast, dass Du Dich kaum über BILD-Zeitungs-Niveau zum Thema „Termgewichtung“ informiert hast.

    Funktionale Werkzeuge (nochmal: FUNKTIONALE Werkzeuge) und die richtigen Methoden vorausgesetzt, ist es bereits per Design unmöglich, einen „Schwafel-Text“ zu schreiben. Ich kann Dir aus dem Stegreif zwei Dutzend Menschen zeigen, die Dir zu Deiner Enttäuschung mitteilen werden, dass sie auf dieser Basis _die Besten_ Inhalte erstellen, die sie jemals erstellt haben. Termgewichtung ist nunmal mehr, als „WTF“ zu sagen und Kurven zu schrubben …

    Eine der wichtigsten Kernfragen im Rahmen der Termgewichtung ist die Überprüfung Deiner Inhalte auf ihre Differenzierungsfähigkeit. Das Werkzeug meldet DIR, wenn DU mal wieder zu sehr abgeschrieben hast. ;-)

    Wenn Du das Gibberish-Patent aufmerksam liest, stellst Du fest, dass auch hier (oh nein!) ein Algorithmus dahintersteckt. Und was wird es auf dieser Basis demnach geben? Genau: Werkzeuge und Methoden die Dir ein Signal geben, wenn Du „schwafelst“. Tools, die in großen Umgebungen Deinen Inhalt zum Beispiel erst gar nicht freigeben: Ein Traum für Foren, UGC und die Verfasser von Pressemitteilungen. *g*

    Natürlich sorry für die Anrede mit dem Ritterhelm – ich wollte nur kurz Deine geschätzte und wertvolle Aufmerksamkeit. :-)

    Viele Grüßle vom Karl

    1. :-) Meine Aufmerksamkeit hast Du immer.

      Vielleicht habe ich das missverständlich formuliert: Ich will die Tools gar nicht verteufeln, sondern dazu anregen, sie richtig zu nutzen. Dass Du das kannst, steht außer Frage. Aber es hat sich in meinen Augen eine Stimmung breit gemacht, dass man einfach nur die Top-20 Terme für ein Keyword ermitteln bräuchte und daraus einen Text zusammenschrauben könnte, der dann automatisch gut ranken würde. Das ist (und war) nicht so. Das Google-Patent bestätigt das (wenn es denn im Einsatz ist, wovon ich ausgehe). Wenn man die Tools dazu nutzt, um heraus zu bekommen, ob man belangloses Zeugs schwafelt (wenn die eigene Kurve nämlich mit der WDF*IDF-Kurve übereinstimmt), um so besser :-)

      Im Übrigen habe ich nie behauptet, das Thema oberhalb des Bild-Zeitungs-Niveaus zu bearbeiten ;-)

  3. Hallo Martin,

    interessanter Artikel und spannende Anregung mal wieder darüber zu diskutieren. Ich bin der Meinung, dass man mit der WDF Termgewichtung sehr zielführende Texte erstellen kann. Der Redakteur sieht sehr gut, welche Begriffe der Wettbewerb nutzt und welche themenspezifische und relevante Begriffe implementiert werden sollten.

    Nutzt also die WDF Termgewichtung und schreibt themenspezifische Texte, welche die wichtigen, relevanten Begriffe beinhalten, Mehrwerte und konkreten Nutzen für den Leser bieten. Vollkommen klar, dass Google allgemeine Artikel mit zahlreichen themenübergreifenden Keywords als Spam deutet. Dafür sollte man doch aber keine Termgewichtung vornehmen.

    Beste Grüße
    Jens

  4. Ihr macht es den Leuten von Google auch nicht leicht.

    Sieht Google die Anzahl von Links als Rankingkriterium, schießt Ihr wie wild mit Links auf Eure Projekte.

    Sobald Google des spitz gekriegt hat und Content als Kriterium stärker gewichtet, kauft Ihr billige mit Keywords gestuffte Texte ein und haut sie auf Eure Seiten.

    Verbessert Google seinen Algo und analysiert die Texte besser kommt ein pfiffiger KK, analysiert die Google-Kriterien hat damit Erfolg und teilt sein Wissen zur Verfügung, so dass wieder alle (künstliche) Texte mit optimierter Termgewichtung auf ihre Affiliate-Seiten knallen.

    Es wird die Zeit kommen, da werden Seiten abgetraft, deren Inhalte zu gut sind, um wahr zu sein :-(

  5. Hoffentlich wird irgendwann das täglich neu sortierte Zufallsranking kommen. Dann könnt ihr SEOs endlich zum Jobcenter tingeln und mit echter Arbeit versuchen Geld zu verdienen und nicht mehr Träume verkaufen.

  6. Geht es nicht einmal mehr darum, dass ganze einfach nicht zu übertreiben?

    Die vorhandenen Tools sind doch in Ordnung. Die Tools gepaart mit etwas Hirnschmalz und das kommt gut :-)

    Gruß
    Thomas

  7. Och bitte…Jagt doch nicht gleich die nächste Sau durchs Dorf. Ein blödsinniger Text ist ein blödsinniger Text, egal ob er mit WDF-Tools auf Kurve getrimmt wurde oder nicht. Google hat einen Pfeil mehr im Köcher um geistigen Durchfall aus den Serps zu halten. Gute Texte, die mit Hilfe von WDF-Tools verbessert wurden, ziehen weiterhin und werden es auch immer tun.

  8. naja google übertreibt es wieder mal gründlich. Meines Erachtens sollten die Praktiken dieses Konzerns mal vom EU Gericht überprüft werden. Zum Beispel hat G. kürzlich ein ganzes Dorf in Pakistan von G-Play rausgeworfen (Also zur quasi Android-freien Zone erklärt) nicht weil die Pakistanis zur Taliban gehören, sondern weil jeder 100 Pads zuhause hatte. „Voting-Manipulation nannten sie das“. Was können die lieben Leute dafür dass sie internetsüchtig sind? Und dann schmeisst sie der Verursacher dieser Sucht raus. Das ist blanker Rassismus! Wenn ein texanischer Milliardär 100 Pads auf dem WC hat ist das sicher straffrei bei Google. Wo bleibt da die Gleichheit? Naja ich sage ja immer „Der Tag wird kommen!“

  9. Einmal mehr fühle ich mich bestätigt, daß man einfach versuchen sollte den Content zu produzieren, der einen selber als Besucher sinnvoll weiterhelfen würde. Das ganze dann ansprechend präsentiert und ein wenig optimiert, daß eine Suchmaschine das auch gut einsortieren kann und alles sollte gut sein.
    Ich habe das Gefühl, je mehr man da versucht bis an die Schmerzgrenzen der Optimierung zu gehen, desto mehr schmerzen einen solche Änderungen und ziehen im Zweifel massive Anpassungen nach sich.

    Gruß,
    Jens

  10. Wer sich mal ein neues und kostenloses WDF*IDF Tool ansehen möchte, kann gerne unseres ausgiebig testen. Funktioniert ohne Anmeldung und Bezahlen und dem ganzen Kram.

    WDF*IDF Tools machen definitiv Sinn Jan, Reiner & Co.

    Wenn Ihr möchtet, wie gesagt einfach mal ausprobieren :)

Kommentare sind geschlossen.

Kommentare sind geschlossen.