ENTITÄTEN

Viele Informationen zu einem „DING“

 Entitäten – Erfassung komplexer semantischer Zusammenhänge 

Was sind Entitäten? Was ist eine Entität?

Entität ist ein lateinischer Begriff der so viel bedeutet wie das „Ding“ oder das „Existierende“. In der Informatik werden Objekte als Entitäten bezeichnet, die zahlreiche gesammelte Informationen enthalten. Generell wird die Bezeichnung Entität als Sammelbegriff verwendet, um das Wesen komplexer Sachverhalte, Gegenstände oder Ereignisse in der Gesamtheit anzusprechen. Entitäten gewinnen zunehmend Bedeutung im Bereich der Suchmaschinenoptimierung. Im SEO-Segment wird der lateinische Begriff als Oberbezeichnung für den gesamten semantischen Raum verstanden.

INHALTSVERZEICHNIS

  • Einleitung
  • Entität: eine kurze Definition
  • Entitäten und Ontologien: Woher kommt das eigentlich?
  • Googles Nutzung von Entitäten
  • Was fasst Google als Entität auf?
  • Sind alle Knowledge Graph-Boxen Entitäten-Boxen?
  • Karussells als Entitäten-Boxen?
  • Relativität des Entitätsbegriffs
  • Inwiefern sind Entitäten für SEO wichtig?
  • Fazit: Entitäten und ihre Bedeutung
  • Holistische Webseiten: Schlüssel bei der Suchmaschinenoptimierung
  • Weiterführende Links
Entitäten

EINE EINLEITUNG

Entitäten sind aktuell in aller Munde, und das, obwohl sie schon seit einigen Jahren – genauer gesagt seit Hummingbird-Update und Einführung des Google Knowledge Graphs 2012/2013 Relevanz für die Suchmaschinenoptimierung haben. Das wachsende Interesse ist sicherlich auf Neuerungen in den Ausspielungen von Entitäts-Boxen, aber auch auf die zunehmende Bedeutung von Voice Search zurückzuführen, wofür wiederum Entitäts-Boxen von großer Relevanz sind. Im Folgenden wollen wir uns damit beschäftigen, was genau eigentlich Entitäten sind, was sie für Google sind und was das für SEO bedeutet.

Eine kurze Definition

Abgeleitet aus der Philosophie, genauer gesagt aus der philosophischen Teildisziplin Ontologie (Seinslehre), bedeutet „Entität“ wörtlich „Seiendes“. Eine Entität im philosophischen Sinne kann dinglicher oder geistig-abstrakter Natur sein. Entitäten in dem von uns gemeinten Sinne gehen jedoch auf die Begriffsverwendung in der Informatik bzw. der Semantik zurück. Entitäten können beispielsweise Personen, Unternehmen, Bauwerke, POIs oder auch abstrakte Begriffe sein. Sie werden von Google in den so genannten Knowledge Graph-Boxen (auch: Entitäten-Boxen) ausgespielt, die über oder neben den ersten SERPs angezeigt werden.

Entitäten und Ontologien: Woher kommt das eigentlich?

Für alle, die „Deep Learning“ auch gerne mit den eigenen, internen neuronalen Netzwerken betreiben, erläutern wir hier noch einmal genauer, woher das Konzept „Entität“ eigentlich kommt und wie es mit einem anderen relevanten Begriff, der so genannten Ontologie, zusammenhängt. Wer sich rein auf die Bedeutung bei Google und die Praxis für SEO konzentrieren möchte, darf an dieser Stelle gern zum nächsten Abschnitt springen.

Eingangs wurde schon kurz erwähnt, dass der Begriff „Entität“ ursprünglich aus der Philosophie, genauer gesagt der Ontologie, stammt und „Seiendes“ bedeutet. Ontologie – als Lehre vom Seienden – bezieht sich in der Philosophie immer auf die Gesamtheit des Seins. Es gibt also nur eine Ontologie, wenngleich unterschiedliche Philosophen natürlich unterschiedliche Theorien über das Sein entwickelt haben. (Das ist an dieser Stelle interessant zu erwähnen, weil auch die Informatik neben dem Begriff der Entität den der Ontologie kennt, der allerdings etwas anderes meint.)

Entitäten im philosophischen Sinne können physische Dinge sein, aber auch abstrakte Konzepte. Im klassischen Sinne wird unter Entität das Wesen oder die Substanz eines Dings verstanden. Was damit genau gemeint ist, wollen wir hier einmal beiseitelassen, handelt es sich doch um eines der wohl meist diskutierten und komplexesten Probleme der Philosophiegeschichte.

Ontologie & Entitäten erklärt von SUMAGO

Ontologie & Entitäten erklärt von SUMAGO

Springen wir daher in der Geschichte etwas weiter vor, um den Bogen zu unserem Hauptthema zu schlagen. Erst mit der formalen Logik und logischen Semantik im 20. Jahrhundert veränderte sich der Begriff der Entität nachhaltig. Er wurde zur Bezeichnung für ein sprachliches bzw. gedankliches Objekt oder für ein außersprachliches Bezugsobjekt. Maßgeblich für diese Entwicklung waren vor allem die Arbeiten der Logiker und Sprachphilosophie William van Orman Quine und Charles Sanders Peirce.

Quine bestimmte das „Sein“ einer Sache als „eine gebundene Variable sein“. Mit dieser logischen Formalisierung des Seins war der Schritt dafür gelegt, Entitäten nicht mehr als Wesen oder Substanz einer Sache zu verstehen, sondern als Knoten einer Art logisch-semantischen Netzwerks, wie es heute in der Informatik üblich ist. Ontologie wurde als Begriff von diesen Theoretikern – weil klassischerweise zur Metaphysik gehörig – aber generell eher abgelehnt; man sah die Logik und Sprachphilosophie an die Stelle der spekulativ-metaphysischen Ontologie treten.

Insofern ist es, philosophisch betrachtet, schon einigermaßen amüsant, dass sich in den letzten Jahren vor allem durch die Forschung zu Künstlicher Intelligenz der Begriff der Ontologie in die Semantik „eingeschlichen“ hat.

In der Informatik bezeichnet man mit dem Begriff „Ontologie“ semantische Netze zwischen verschiedenen Entitäten. Diese semantischen Strukturen werden mit der Graphentheorie dargestellt bzw. erfasst (daher auch der Name „Knowledge Graph“). Ein Graph hat Knoten und Kanten. Knoten sind die Entitäten, Kanten die Relationen zwischen diesen Entitäten.

Ungefähre kulturwissenschaftliche Entsprechung dieses linguistischen Phänomens wären die Bedeutungsgewebe (webs of significance), wie sie der Ethnologe Clifford Geertz beschreibt.

Diese Begriffsverwendung von „Ontologie“ ist eigentlich irreführend, schon deshalb, weil Ontologie „Lehre von“ bedeutet, der Begriff aber in der Informatik nicht die Lehre von diesen „semantischen Netzen“, sondern die Netze selber bezeichnet. Zudem kann es, wie oben bereits erwähnt, im eigentlichen Sinne des Wortes nur eine Ontologie geben, weil es um das Sein per se geht, und eben nicht um konkrete Domänen. (Schema.org als Gesamtprojekt wird allerdings auch als Ontologie bezeichnet, was diesem Gesamtheitsanspruch des ursprünglichen Begriffs dann wieder gerecht wird.)

Googles Nutzung von Entitäten

Google nutzt Entitäten für den Aufbau des Semantischen Webs: Konkret bedeutet das: Das Konzept der „Entitäten“ ist ein Element des Algorithmus, der darauf abstellt, Inhalte (statt wie früher über Keywords) über Kontexte zu verstehen – so, wie es Menschen in der natürlichen Sprache tun. Relevant wurden Entitäten für Google insbesondere mit der Einführung des Knowledge Graph (2012) und des Hummingbird-Updates (2013).

INFOBOXEN

Was ist der Knowledge Graph?

Der Knowledge Graph ist Googles Wissensdatenbank für die semantische Suche. Der Knowledge Graph sammelt Suchbegriffe, interpretiert sie auf Basis bereits bestehenden Wissens (hier kommen dann auch die Entitäten ins Spiel) und sammelt dann Informationen aus verschiedenen Quellen, um diese in aggregierter Form Nutzern auszuspielen. Dafür gibt es verschiedene Ausspielungsformen:

  • Infobox über den Suchergebnissen,
  • Infobox rechts neben den Suchergebnissen,
  • Karussell,
  • Know-Simple-Boxen über den Suchergebnissen,*
  • als Antworten des Google Assistant.

Das, was über den Knowledge Graph in Boxen ausgespielt wird, sind das, was Google als Entitäten fasst.

*Know-Simple ist eine von Google eingeführte Kategorie von Suchanfragen. Darunter fallen alle Suchanfragen, für die eine Antwort in ein oder zwei Sätzen genügt.

Hummingbird-Update

Mit dem Hummingbird-Update präsentierte Google 2013 die wohl fundamentalste Änderung an seinem Algorithmus seit 2001. Mit dem Namen „Hummingbird“, der englische Begriff für „Kolibri“ weist Google auf die angestrebten Kerneigenschaften des Updates hin: Die Suche so schneller und zielgenauer werden. Die Basis dieser Verbesserung ist, wie auch beim Knowledge Graph, die Semantik. Dokumente werden nicht mehr nach einzelnen Keywords durchsucht, sondern nach semantischen Netzen miteinander sinnhaft verknüpfter Begriffe (d.h. Ontologien). So ist Google in der Lage, Suchanfragen besser zu verstehen und adäquatere Ergebnisse auszuspielen, weil der Kontext der einzelnen Begriffe „verstanden“ wird.

Eine Entität ist, wie schon im vorangegangenen Abschnitt dargestellt, einzigartig. Sie bekommt eine Art „Referenznummer“, einen Uniform Resource Identifier (URI). Jedem URI werden die Eigenschaften zugeordnet, die die Entität näher bestimmen. Mithilfe des URI werden so auch Homonyme unterschieden, also gleiche Wörter mit unterschiedlicher Bedeutung. So haben dann beispielsweise Tau (=Morgenreif), Tau (=Seil) und Tau (=griechischer Buchstabe) drei verschiedene URI.

So weit, so gut. Doch wie findet Google nun heraus, welche Eigenschaften zu welchem URI bzw. zu welcher Entität gehören?

Dafür bedarf es eines Resource Description Frameworks (RDF). Ein RDF ist eine Methode, im Web logische Aussagen über Entitäten zu formulieren. Das RDF ist wichtiger Bestandteil des Semantischen Webs und beruht auf gerichteten Graphen. Logische Aussagen werden modelliert, indem zwei Entitäten (Subjekt und Objekt) über ein Prädikat miteinander verknüpft werden.

Die komplexen strukturellen Beziehungen zwischen den verschiedenen Entitäten werden aber erst mit den Ontologien hergestellt. Dies sind modellierte Systematiken auf Basis der Graphentheorie (s.o.), die man phänomenologisch als Wissensbereiche auffassen kann. Ontologien ermöglichen es Maschinen dann, vermittels Inferenzregeln „selbsttätig“ logische Schlüsse zu ziehen – und im Falle von Suchmaschinen wie Google adäquate Antworten auf Suchanfragen auszuspielen.

Was fasst Google als Entität auf?

Was prinzipiell als Entitäten (im Sinne der Informatik) gelten kann, lässt sich leicht aus der Übersicht über Entitätstypen auf Schema.org entnehmen. In der natürlichen Sprache haben wir eine recht gute Intuition dafür, was Entitäten sind. Was aber versteht Google darunter?

Personen als Entitäten - SEO der Zukunft? von SUMAGO

Personen als Entitäten – SEO der Zukunft? von SUMAGO

Sind alle Knowledge Graph-Boxen Entitäten-Boxen?

Oft wird gesagt, dass die Knowledge Graph-Boxen ein guter Indikator dafür sind, was Google als Entitäten begreift. Dabei wird in einigen Beiträgen zum Thema spekuliert, dass Google bestimmte Entitäten „bevorzugt“ oder nur bestimmte „Dinge“ als Entitäten anerkennt. Aus unserer Sicht ist das nicht die plausibelste Interpretation. Schauen wir uns das etwas genauer an.

Olaf Kopp schreibt in Bezug auf Entitäten bei Google Folgendes:

„Es wirkt so, als ob Google relevante Entitäten in den Knowledge Graph Boxen rechts von den Suchergebnissen (Search Engine Result Pages, kurz SERPs) darstellt. Ich nenne sie deshalb auch gerne Entitäten-Boxen. Alles, was oberhalb der SERPs etwa als Direct-Answer-Box bzw. Featured Snippet Box dargestellt wird, sind eher Konzepte bzw. Themen. Die Karussell-Darstellungen ganz oben beziehen sich z.B. auf Events, Filmen, Serien.“

Wenn man sich die Entitäten Boxen mal genauer ansieht, kommt man zu dem Schluss, dass

  • Personen
  • Unternehmen
  • Tiere
  • Bauwerke
  • Städte/Orte

eine besondere Rolle als Entitäten spielen.“ (Quelle: https://blog.searchmetrics.com/de/2017/11/20/knowledge-graph-funktionsweise/?fbclid=IwAR0Ty62SOj5-uirAssAHf4weasbCUIrkvL21uxHDZKMztXHoFnVFeF6Bj7Y)

Er unterscheidet also zwischen Boxen, die Entitäten enthalten und solchen, die „eher Konzepte bzw. Themen“ enthalten. Dadurch wird zumindest suggeriert, Konzepte und Themen wären keine Entitäten.

Knowledge Graph am Beispiel von Elon Musk

Knowledge Graph am Beispiel von Elon Musk

Unterstützt wird dies prinzipiell erst einmal durch die Unterscheidung zwischen Entitäten und Entitätstypen. Nach einer Art Type-Token-Unterscheidung ist mit Entität das individuelle Ding gemeint, mit Entitätstyp eine Klasse.

Ein Beispiel: „Peter Heinrich Brix“ ist eine Entität (der eine norddeutsche Schauspieler), „Kunde“ ist ein Entitätstyp, weil „Kunde“ nicht ein Individuum meint, sondern eine Klasse von Menschen, die eine bestimmte Handlung ausüben. In diesem Sinne wäre „Kunde“ eher ein „Konzept“ und würde – nach Olaf Kopps Verständnis – damit nicht als Entität zählen.

Googele ich „Kunde“ oder „Kunde was ist das“ bekomme ich oberhalb der SERPs den Wörterbucheintrag in einer Box sowie rechts oben eine Box „Ergebnisse für…“ mit einem Kurzeintrag zur Definition von „Kunde“ ausgespielt. Ein Klick in die Box führt zu einer weiteren Google-Ergebnisseite, die dann rechts oben eine Box enthält, die direkt auf den Wikipedia-Eintrag verlinkt. Diese Boxen dürften nach Kopp also keine Entitäten-Boxen sein.

Schauen wir uns aber die Suchintention für den Suchbegriff „Kunde“ genauer an. Wahrscheinlich ist, dass ich bei Google nach ein „Kunde“ oder „Kunde was ist das“ suche, weil ich den Begriff erklärt haben möchte. Dann kann in dem Moment „Kunde“ – rein logisch betrachtet – doch durchaus eine Entität sein, nämlich in seiner Eigenschaft als Begriff, und nicht in seiner Anwendung im sprachlichen Kontext.

Bei Wikipedia heißt es über das zur Entität modellierte Objekt: „Das Objekt kann materiell oder immateriell, konkret oder abstrakt sein.“ (Quelle: https://de.wikipedia.org/wiki/Entit%C3%A4t_(Informatik))

„Kunde“ wäre dann ein immaterielles, abstraktes Objekt mit der Zeichenfolge K-U-N-D-E und den modellierten Eigenschaften, eine Kategorie von Personen zu bezeichnen, die eine Kaufabsicht hat oder einen Kauf getätigt hat ODER einen Landstreicher zu bezeichnen ODER ein Synonym für den Erhalt einer Nachricht zu sein.

Diese Sichtweise kann durchaus auch mit einer Quelle plausibel machen, die Olaf Kopp heranzieht. In dem von ihm zitierten wissenschaftlichen Artikel „A Framework for Benchmarking Entity-Annotation Systems“ von Marco Cornolti, Paolo Ferragina und Massimiliano Ciaramita (letzterer ist Mitarbeiter von Google Research Zürich) heißt es:

„An entity (or concept, topic) is a Wikipedia article which is uniquely identified by its page-ID.“ (Quelle: https://static.googleusercontent.com/media/research.google.com/de//pubs/archive/40749.pdf)

Hier wird eine Entität quasi mit einem Wikipedia-Artikel gleichgesetzt. Ferner heißt es in demselben Beitrag:

„Most recent work adopts anchor texts occurring in Wikipedia as entity mentions and the respective Wikipedia pages as the mentioned entity, because Wikipedia offers today the best trade-off between catalogs with a rigorous structure but low coverage (such as WordNet, CYC, TAP), and a large text collection with wide coverage but unstructured and noisy content (like the whole Web). The process of entity annotation involves three main steps: (1) parsing of the input text, which is the task to detect candidate entity mentions and link each of them to all possible entities they could mention; (2) disambiguation of mentions, which is the task of selecting the most pertinent Wikipedia page (i.e., entity) that best describes each mention;” (https://static.googleusercontent.com/media/research.google.com/de//pubs/archive/40749.pdf)

Das bedeutet zunächst einmal nur, dass Wikipedia-Seiten für Google als Referenz für die Identifikation von Entitäten herangezogen werden, neben Quellen wie WikiData (ehemals Freebase) und dem CIA World Factbook. Das macht Sinn, denn in dem Moment, wo es einigen Wikipedia-Eintrag gibt, kann das Konzept oder Ding eindeutig identifiziert werden. Und es macht ebenfalls Sinn, anzunehmen, dass, wenn es zu etwas einen Wikipedia-Eintrag gibt, es auch als Entität interpretiert werden kann. Warum?

Zunächst einmal unterstellen wir dafür, dass Entitäten nicht nur Personen und Dinge sein können, sondern auch Begriffe. Es wurde schon geklärt, dass dies durch die Definition von „Entität“ durchaus gedeckt ist.

Wikipedia ist nun nichts anders als der „Brockhaus“ der digitalen Welt. Und was schlugen wir im Brockhaus oder Duden nach? Begriffe, deren Bedeutung wir kennenlernen wollten. Und Begriffe sind als Zeichenfolgen mit Denominationseigenschaften (also dem, was sie bezeichnen) Entitäten. Demnach kann eigentlich alles, was eine Wikipedia-Seite hat, eine Entität sein.

Brockhaus = Wikipedia = Entitäten | SUMAGO

Brockhaus = Wikipedia = Entitäten | SUMAGO

In der Quintessenz bedeutet das unter anderem: Was eine Entität ist und was nicht, hängt nicht primär am Wort selbst, sondern an der Art und Weise seiner Verwendung.

Das Wort „Kunde“ kann – als abstraktes Denkobjekt – selbst Entität sein und wird als solche ausgespielt, wenn eine Suchanfrage mit der Suchintention erfolgt, den Begriff zu begreifen. Gefragt wird also nach einer „Begriffs-Entität“.

Dasselbe gilt für alle Begriffe. Suche ich nach „Pleistozän“, geht Google davon aus, dass ich wissen will, was der Begriff bedeutet. Entsprechend bekomme ich zum eine Wörterbuch-Box und eine Begriffs-Box.

Um aber auf unser Beispiel „Kunde“ zurückzukommen: Eine Suchanfrage „Sixt Kunde Jung von Matt“ ist auch eine Wissensabfrage, die „Kunde“ enthält. Es ist aber keine, die nach einer konkreten Sache, Person oder einem Begriff fragt, sondern nach einem komplexeren Sachverhalt, nämlich (vermutlich), ob Sixt Kunde von Jung von Matt sei. Entsprechend erhält man auch keine Knowledge Graph-Boxen. „Kunde“ wird nicht als Entität nachgefragt, sondern wird hier als prädikatives Attribut angewendet.

Vermutlich spielt es für die Praxis kaum eine Rolle, ob man Wissens-Boxen, Themen-Boxen etc. als Entitäten-Boxen auffasst oder nicht.

Wenn es aber darum geht, zu verstehen, was Google als Entitäten fasst, gibt es aus unserer Sicht gute Gründe anzunehmen, dass Googles Algorithmus den Begriff „Entität“ ziemlich genau so auffasst, wie wir es in der natürlichen Sprache auch tun, wie es in der Semantik definiert ist – und wie es auch in RDFs und Ontologien abgebildet wird, z.B. über den Klassenbegriff oder Literalwerte.

Dann wären auch Themen-Boxen, Wissens-Boxen oder Featured Snippets Entitäts-Boxen in dem Sinne, dass sie alle Entitäten behandeln – die einen eher physische Entitäten (z.B. Personen, Tiere, Bauwerke) oder konkrete immaterielle Entitäten (z.B. Unternehmen), die anderen abstrakte immaterielle Entitäten (Begriffe).

Karussells als Entitäten-Boxen?

Einzig die Karussells scheinen aus dieser Regel herauszufallen. Anscheinend werden sie dann gezeigt, wenn Google annimmt, dass die Suchanfrage auf eine einigermaßen klar umrissene Gruppe von Entitäten abzielt, beispielsweise „deutsche Schauspieler“ oder „Filme 2018“. Das Karussell lässt sich begreifen als eine Übersicht über wichtige Entitäten zur Suchanfrage.

Warum bekomme ich aber hier keine Begriffs-Box ausgespielt? Weil Google die Suchanfrage so interpretiert, dass der Suchende eben nicht wissen will, was ein „deutscher Schauspieler“ ist. Er geht davon aus, dass wir nicht hören wollen „ein in Deutschland wirkender oder dort enkulturierter Mensch, der seinen Lebensunterhalt damit verdient, in kulturell determinierten Räumen Rollen zu spielen“ (oder so ähnlich), sondern dass wir nach einer Übersicht über wichtige Personen-Entitäten suchen, auf die „deutscher Schauspieler“ als Attribut zutrifft.

Weiterhin ist die Relevanz von Bildern ausschlaggebend für die Ausspielung eines Karussells. Bei einer Suchanfrage „Erdzeitalter Übersicht“ ist es kaum möglich (und auch nicht sinnvoll), ein Karussell mit Bildern für einzelne geologische Zeitalter auszuspielen. Stattdessen bekommt der User eine Wissens-Box mit einer Tabelle gezeigt. Diese Tabellenform ist aus meiner Sicht das Äquivalent des Karussells für Suchanfragen nach einer einigermaßen klar umgrenzten Gruppe von Entitäten, die sich nicht bildlich darstellen lassen.

Strenggenommen spielen Karussells wie auch Wissens-Boxen mit Tabellen o.ä. also eine Anzahl von Entitäten aus und können damit als „Multiple-Entitäten-Boxen“ aufgefasst werden.

Relativität des Entitätsbegriffs

Was Google als Entität begreift und was nicht, ist also nicht absolut zu beantworten, sondern nur in Relation zur Suchanfrage. Man könnte aber durchaus sagen, dass alle Knowledge Graph-Boxen Entitäten behandeln.

Nicht, weil die darin verhandelten Dinge oder Begriffe per se Entitäten sind, sondern weil Google die Suchanfrage als Frage nach der Definition oder Beschaffenheit eines einzelnen Dings, einer Person oder eines Begriffs begreift und entsprechend Boxen ausliefert, in denen die wichtigsten Informationen aggregiert sind.

In Bezug auf abstrakte immaterielle Entitäten (Begriffs-Entitäten) gilt: Wird derselbe Begriff in einer anderen Suchphrase verwendet, versteht Google, dass hier nicht nach der begrifflichen Entität gefragt wird, sondern nach dem Begriff in seiner sprachlichen Anwendung.

Wenn wir dieser Idee folgen, sehen wir auch, dass dann alle von Schema.org abgebildeten Entitätstypen von Google auch als solche aufgefasst werden (können) und prinzipiell Googles Verständnis von Entitäten auch mit den gängigen Entitäts-Definitionen aus der Logik und der Informatik kompatibel ist.

Eine Unterscheidung zwischen Entitäts-Boxen und anderen Knowledge Graph-Boxen ist aus unserer Sicht nicht logisch. Alle Knowledge Graph-Boxen scheinen all das auszuspielen, was wir gemeinhin als Entitäten bezeichnet würden (oder in einer Ontologie so modellieren).

Zwar kann man, wenn man mag, freilich die einzelnen Boxen typisieren und nach Karussells, Wissens-Boxen etc. unterscheiden. Die Frage ist, mit welchem Zweck.

Die verschiedenen Knowledge Graph-Boxen geben jedenfalls eigentlich keinen Fingerzeig darauf, was Google als Entität auffasst. Sie suggerieren allenfalls, dass Google ein durchaus konventionelles und akkurates Verständnis von Entitäten im logischen wie im informatisch-semantischen Sinne hat.

Inwiefern sind Entitäten für SEO wichtig?

Warum aber sollte man sich für die Suchmaschinenoptimierung mit Entitäten überhaupt befassen?

Die Antwort liegt auf der Hand: Entitäten sind Intentionen von Suchanfragen oder Bestandteile derselben. Stellt die eigene Seite relevante Informationen zu einer Entität bereit, sollte man auch auf diese optimieren. Das bedeutet zunächst einmal, dass man semantisch die entsprechenden Felder abdeckt. Man zeigt damit Google an, dass die eigene Seite für diese Entitäten und Themenfelder (Ontologien) relevant ist.

Auch wenn das heute eigentlich nicht mehr eigens erwähnt werden sollte: Diese Art der Optimierung ist nicht so verstehen, dass es sich um eine mehr oder weniger stumpfe Optimierung für den Algorithmus handelt; die inhaltliche „Oberfläche“ einer Seite ist für den Nutzer gemacht, und das begreift auch Google und bewertet entsprechend. Die die so oft aufgemachte Dichotomie „Optimieren für die Suchmaschine“ versus „Optimieren für den User“ ist seit dem Vormarsch des Semantischen Webs eigentlich hinfällig – jede Optimierung für den Nutzer ist eine für den Algorithmus und vice versa.

Optimierungen jenseits der inhaltlichen Ebene sind insofern zwar „für den Algorithmus“, dienen aber natürlich auch dem User, insofern sie eine bessere Ausspielung von Suchergebnissen ermöglichen. Insbesondere strukturierte Daten helfen dabei, Google diese Relevanz für Entitäten und Ontologien anzuzeigen. Dabei werden mittels der Auszeichnungen von Schema.org Inhalte auf Websites gekennzeichnet, um diese für Google leichter erkennbar zu machen.

Über die Frage, wie essenziell das Hinterlegen strukturierter Daten für gute Rankings letztlich ist, gehen die Meinungen auseinander. Am sinnvollsten ist es, strukturierte Daten einfach als einen Baustein einer insgesamt gut optimierten Website zu betrachten.

Entitäten bei Google für bessere Rankings und SEO by SUMAGO

Entitäten bei Google für bessere Rankings und SEO by SUMAGO

Auch jenseits der semantischen Relevanz, die man für eine (oder mehrere) Ontologien durch eine Optimierung auf Entitäten erzeugen kann, gibt es mindestens einen weiteren wichtigen Grund für das Thema Entitäten im Bereich SEO, nämlich die Optimierung für die Sprachsuche. Die Entitäten-Boxen sind das, was durch den Google Assistant bei einer Suchanfrage nach der Entität vorgelesen wird. Bei wachsender Relevanz der Sprachsuche gewinnt daher das „Beherrschen“ der Entitäten-Box an Bedeutung. Wer über die Inhalte der Entitäten-Box Kontrolle ausübt, schaltet damit einstweilen Mitstreiter in der Sprachsuche weitgehend aus.

Aufgrund der Prädominanz von Wikipedia und einigen wenigen anderen Quellen sind Personen- und Unternehmens-Entitäten weitgehend die einzigen, für die es sich zu optimieren lohnt. Das gilt jedoch auch nur dann, wenn man ein wirklich bekanntes Unternehmen bzw. eine bekannte Marke bzw. Person ist. In der Regel wird das Unternehmen, die Marke oder Person dann eine Wikipedia-Seite haben; man kann dann durch Markups auf der eigenen Seite relevante Entitäten definieren, die mit dieser Marken- oder Personen-Entität in Verbindung stehen. Was auf der eigenen Seite so markiert ist, sollte sich inhaltlich auch im Wikipedia-Eintrag wiederfinden und überhaupt konsistent in allen Kanälen widerspiegeln.

Wer als Unternehmen bereits eine Entitäten-Box hat, sollte diese in jedem Fall für seine Zwecke nutzen und durch strukturierte Daten und Optimieren aller einzelnen Kanäle – einschließlich der Wikipedia-Seite – für seine Zwecke optimieren.

Fazit: Entitäten und ihre Bedeutung

In diesem Beitrag haben wir versucht, alles zusammenzustellen, was wichtig ist, um zu verstehen, was eine Entität ist und einen kleinen Einblick zu geben, wofür Entitäten genutzt werden können.

Letztlich sind wir der Meinung, dass Entitäten als Teil der strukturierten Daten sicherlich ein relevanter Baustein von SEO sind. Sie sind aber – wie strukturelle Daten allgemein – kein Allheilmittel; eine Knowledge Graph-Optimierung (KNO), die darauf abzielt, eine Knowledge Graph-Box zu erringen, lohnt sich nur in wenigen Fällen.

Älterer Beitrag von 2017

Entitäten in Bezug auf Suchmaschinen

Die Entwicklung von Suchmaschinen und das daraus resultierende Ranking von Webseiten ist ein kontinuierlicher Prozess. In der Anfangsphase dienten vor allem bestimmte Keywords innerhalb einer Webseite zur Bestimmung der Relevanz. Dieser Rankingfaktor bestimmte bis vor wenigen Jahren auch noch maßgeblich das Suchverhalten des Marktführers Google. Der Konzern arbeitet seit seiner Gründung permanent an der Verfeinerung der Suchalgorithmen. Mehrere Updates nach der Jahrtausendwende hatten die Abkehr von der rein keywordlastigen Suche zum Ziel. Mit dem Hummingbird-Update im Jahr 2013 vollzog das Unternehmen eine Wende von der keyworddominierten Suche hin zu einer semantischen Suche. Entitäten, also die ganzheitliche Betrachtung eines Themas, rücken seither in den Vordergrund bei der Suchmaschinenoptimierung. Im Bereich SEO sehen sich Webmaster mit neuen Herausforderungen konfrontiert, da die Semantik von Texten eine tragende Rolle für das Ranking in den SERPs spielt.

Semantische Suche in der Praxis

Seit dem Hummingbird-Update ist der Algorithmus von Google in der Lage, Webseiten-Content und Dokumente hinsichtlich der Semantik zu durchsuchen und auf diese Weise Antworten auf komplexe Suchanfragen zu liefern. Ein Grund für die Veränderungen liegt in der Zunahme von Sprachanfragen an die Suchmaschine. Dieser Trend zwingt die Anbieter dazu, sich mit der Linguistik der menschlichen Sprache auseinanderzusetzen, um die richtigen Ergebnisse zu liefern. In der Praxis werden sämtliche Entitäten einer Suchanfrage berücksichtigt. Gibt ein Nutzer beispielsweise die Suchanfrage: „Wo gibt es ein gutes Restaurant in München?“ in die Suchmaske ein, werden die Entitäten Restaurant und München in Beziehung zueinander gesetzt und das Prädikat „gibt“ sowie das Attribut „gutes“ bei der Suche berücksichtigt.

Entitäten sind vereinfacht ausgedrückt Oberbegriffe für Dinge, Personen, Ereignisse, Gegenstände oder Sachverhalten, die sich aus komplexen Einzelaspekten zusammensetzen. Ein konkretes Beispiel für Entitäten ist folgender Sachverhalt:

Der Begriff Versicherung ist eine Entität, also ein Oberbegriff, der mit semantisch passenden Worten näher beschrieben wird. Eng mit dem Begriff verbunden sind unter anderem Auto, Altersvorsorge, Schaden, Risiko, Sicherheit, Vertreter und Beitrag. Auf einer suchmaschinenoptimierten Webseite sind diese und viele weitere Begriff Bestandteil des Contents. Die Gesamtheit aller Umschreibungen erzeugt ein konkretes Bild von dem Begriff Versicherung und führen zu einer eindeutigen Erklärung der Entität.

FOLGEN FÜR SEO

Aus der Tatsache, dass Google in der Lage ist, Entitäten zu erkennen und diese als Rankingfaktor in die Bewertung von Webseiten einfließen lässt, leiten sich für den SEO-Bereich konkrete Maßnahmen ab. Der Content von Landingpages muss in der Zukunft beispielsweise einen breiten semantischen Raum abdecken. Keywords im klassischen Sinne spielen zwar weiterhin eine Rolle, verlieren aber weiterhin an Bedeutung. Nach der Erstellung von semantisch angereichertem Content, besteht die Möglichkeit, dass Google die Entität erkennt und über den Algorithmus bestimmten Suchanfragen zuordnet. Googles Ziel mit der Verwendung von Entitäten ist, den Usern bessere Suchergebnisse bezüglich der Relevanz zur Suchanfrage zu liefern.

Holistische Webseiten: Schlüssel bei der Suchmaschinenoptimierung

Holistische Webseiten können in der Zukunft eine Schlüsselposition bei der Suchmaschinenoptimierung einnehmen. Der Begriff „holistisch“ wird mit den Worten „ganzheitlich“ oder „allumfassend“ treffend beschrieben. Holistischer Content beantwortet eine User-Frage erschöpfend. Es werden unterschiedliche Kriterien und Aspekte einer Entität beleuchtet und nahe am Thema liegende Sachverhalte erklärt. Der Nutzer erhält umfassende Informationen zu einem Thema und seine Suchanfrage wird detailliert beantwortet. Eine holistische Webseite kommt allein aufgrund des Umfangs nicht ohne Entitäten und einen semantischen Kontext aus.

Weiterführende Links:

Entitäten bei Wikipedia

Nutzer, die nach Entitäten gesucht haben, suchten auch nach:

Einheit, Einheiten, Glossar, Datenbank, Datenbanken, Marketing, Gegenstände, Ens, Artikel, Flexikon, Grundlagen, Datenmodellierung, Übung, Übungen, Onlinemarketing, Doccheck, Mengen, Menge, Übungsaufgaben, Attributwerte, Management

JA, ICH WILL MEHR ERFAHREN!




Ich bitte um Informationen zu (bitte auswählen):

Mit dem Absenden dieses Kontaktformulars erklären Sie sich damit einverstanden, dass Ihre Daten zur Bearbeitung Ihres Anliegens verwendet und gespeichert werden. Weitere Informationen und Widerrufshinweise finden Sie in unserer Datenschutzerklärung