Wie Suchmaschinen Texte erkennen (und was Sparck Jones damit zu tun hat)

Stell dir vor, eine Suchmaschine ist wie ein neugieriger Bibliothekar. Sie läuft von Regal zu Regal, schaut sich jedes Buch an, blättert durch die Seiten – und versucht, sich zu merken, worum es darin geht. Genau das passiert, wenn Google & Co. deine Website „crawlen“.
Die Maschine liest deinen HTML-Code (ja, auch den langweiligen), zieht sich den Text raus und packt ihn in ihren Index. Zack – schon bist du in ihrer großen Kartei.
Doch nur gefunden zu werden reicht nicht. Die spannende Frage lautet: Wie entscheidet Google, ob dein Text überhaupt relevant ist?
Keywords sind nicht alles
Früher konntest du einfach dein Keyword 37 Mal in den Text pressen, und schon standest du oben. Heute lachen Suchmaschinen darüber nur müde.
Relevanz bedeutet heute:
- Benutzt du deine Begriffe an den richtigen Stellen (z. B. Überschrift, Zwischenüberschriften, Meta-Title)?
- Ist dein Text lang genug, um das Thema wirklich zu behandeln – aber nicht so langatmig, dass man einschläft?
- Und vor allem: Ist dein Inhalt wirklich nützlich für die Menschen, die suchen?
Google ist nicht dumm: Ein Text ohne Mehrwert fliegt durch den Algorithmus schneller auf die hinteren Seiten als du „Keyword-Stuffing“ sagen kannst.
WDF*IDF – die nerdige Abkürzung
Jetzt wird’s kurz mathematisch, aber keine Sorge: keine Angst vor Zahlen.
WDF*IDF ist im Grunde eine Formel, die misst, wie wichtig ein Wort in deinem Text wirklich ist.
- WDF (Within Document Frequency) schaut: Wie oft kommt das Wort in deinem Text vor – und in welchem Verhältnis zur Gesamtlänge?
- IDF (Inverse Document Frequency) guckt: Taucht dieses Wort auch überall sonst im Internet auf? Wenn ja, ist es wohl nicht so besonders.
Oder anders gesagt:
Wenn du einen Text über „Schokolade“ schreibst, wird die Formel irgendwann gähnen – das Wort liest sie überall. Aber wenn in deinem Text einmal „Kakaonibs“ vorkommt, denkt sie: aha, das ist ein spezielles Detail, das Mehrwert bringen könnte.
So lernen Suchmaschinen zu unterscheiden zwischen „Allerweltsbegriffen“ und spannenden, fachlich relevanten Details.
Karen Sparck Jones – die vergessene Heldin
Hier kommt die Story, die fast niemand kennt:
In den 60ern saß eine britische Informatikerin namens Karen Sparck Jones in ihrem Büro und fragte sich: „Wie können Computer eigentlich verstehen, was in Texten steht?“
Sie erfand die Idee der Inverse Document Frequency – also genau jenes „IDF“, das heute noch im Kern von Suchmaschinen steckt. Ihre Arbeit war die Grundlage für alles, was Google & Co. heute machen.
Ohne sie gäbe es keine ordentliche Suche – wir würden wahrscheinlich immer noch durch chaotische Linklisten klicken wie in den 90ern.
Und das Beste: Sie sagte einmal den Satz:
“Computing is too important to be left to men.”
Bäm.
Was heißt das jetzt für dich?
Suchmaschinen sind wie strenge, aber faire Lehrer. Sie wollen Texte, die Substanz haben. Die Spaß machen zu lesen. Die Menschen weiterbringen.
Also:
- Nutze deine Keywords, aber bitte mit Hirn.
- Schreib so, dass Menschen hängen bleiben – nicht nur Algorithmen.
- Bau spannende Details ein, die echte Relevanz zeigen (Schokolade ist nett, aber Kakaonibs machen’s besonders).
- Denke daran: Am Ende zählt nicht die Formel, sondern die einfache Frage – hilft dein Text wirklich dem Leser?
👉 SEO ist kein Zahlenspiel. Es ist ein Balanceakt zwischen Mathematik und Menschlichkeit. Oder anders gesagt: Zwischen Sparck Jones und dem Schokohunger deiner Zielgruppe.
Links:
- https://www.cl.cam.ac.uk/archive/ksj21/
- https://scholar.google.com/citations?user=HzDsaGYAAAAJ&hl=en
- http://mi.eng.cam.ac.uk/reports/svr-ftp/johnson_icassp99.pdf