Entitäten basierte Suche Teil 1: Alles was Du zum Knowledge Graph, Indexierung, NLP, Ranking, E-A-T und die semantische Suche wissen musst.

Entitäten basierte Suche
SEOcampixx 2020
„Knowledge Graph, Knowledge
Vault, Hummingbird & BERT
sind die zentralen Bestandteile
für die Google-Suche. Entitäten
sind das verbindende Element.“

Freebase
Google kauft Freebase
2010

Die wichtigsten Google Updates
… der letzten 10 Jahre
2012

2013

2014???

2015

2019

Machine Learning in der Suche
Google Engagement in Sachen Machine Learning
2011:
Start von
„Google
Brain“
2014:
Kauf von Deep
Mind, Dark
Blue Labs &
Vision Factory
2015:
Einführung
Rankbrain &
Vorstellung
Quanten-
Computer
2019:
Einführung
„BERT“

Rolle: Machine Learning Specialist
Ausbildung: Fachangestellter für Medien- und
Informationsdienste Bibliothek
Studium: Informationsmanagement
Team: DeepSense – Text Mining Foundation
Themenbereiche:
• Natural Language Processing & Text Mining
• Information Retrieval
• Semantik
• Suchmaschinenoptimierung
• Web Scraping

Hallo! Mein Entitätsname ist Olaf Kopp
Attributs- Wert-Paare sind …
• Firma: Aufgesang
• Rolle 1: Co-Founder
• Beruf: Head of SEO /
CBDO
• Rolle 2: Blogger
• Rolle 3: Autor
• Rolle 4: Podcaster
• Rolle 5: SEAcamp
Mitveranstalter

Olaf Kopp, Co-Founder, Head of SEO, CBDO
Mein thematischer Kontext
• Content-Marketing
• Customer Journey
Management
• Digitaler
Markenaufbau
• Semantische SEO
• Content SEO
• Online-Marketing-
Strategien
• Leadership

Mein Engagement & Projekte
Online Marketer| Unternehmer | Autor | Podcaster | Mitveranstalter

Aufgesang GmbH
Agentur für digitale Marketing-Kommunikation
Retargeting
Public
Relations
Strategieentwicklung
Workshops
Marketing-
Automation
Content-Marketing
Lead Management
PPC-Werbung
Monitoring
Social-Media-
Marketing SEO & SEA

Worum geht es heute?
Erster Teil
1. Die wichtigsten Google Updates der letzten zehn Jahre
2. Wie funktioniert Google heute und zukünftig?
3. Was sind Entitäten und wie sind sie organisiert?
4. Wie ist der Google Knowledge Graph aufgebaut?
5. Wie funktioniert das Data Mining für den Knowledge Graph und den Knowledge
Vault?
Zweiter Teil:
1. Welche Rolle spielt Natural Language Processing (BERT) für die semantische Suche?
2. Was ist Kontext?
3. Wie funktioniert Natural Language Processing?
4. Wie funktionieren Word Embeddings?
5. Wie arbeitet Otto damit?
6. Welche Rolle spielen Entitäten für das Ranking?
7. Welche Rolle spielen Entitäten für E-A-T?
8. Was können SEOs daraus lernen?

Seit 2013 Forscher & Pionier zu …
Entitäten, Knowledge Graph, Natural Language Processing, E-A-T & Digitaler
Markenaufbau
• Über 6 Jahre Recherche in Sachen
Semantische Suche
• Über 80 aktive Google Patente aus
den letzten 7-8 Jahren

Wie funktioniert Google heute?
Information Retrieval & Scoring
Index
Bilder
Ne
ws
Büch
er
Dokumen
te
Video
s
Flüg
e
Knowledge
Graph
Query-Processor
(Rankbrain & BERT)
Enti
tät
Enti
tät
Enti
tät Enti
tät
Enti
tät
Enti
tät
Entität ?
Entitäten-
Schnittstelle
Scoring-Engine
(Hummingbird)
Personalisierung
Suchintention &
Semantische
Interpretation
Cleaning-Engine
Scoring &
Sortierung
(Dokument)
© Olaf Kopp, Aufgesang GmbH

Knowledge Graph
Aufbau
Quelle: Entity Oriented Search, Krisztian Balog

Knowledge Graph
Aufbau
Entität
(Knoten)
Entität
(Knoten)
Entität
(Knoten)
Entität
(Knoten)
Entität
(Knoten)
Entität
(Knoten)

Knowledge Graph
Informationen sind in Form von strukturierten Daten gespeichert

Semantisch Suche in der Praxis

Semantische Suche in der Praxis
Beziehungen zwischen Entitäten
Bundes-
präsident
Deutschland
Frank Walter
Steinmeier

Verknüpfung verschiedener Suchanfragen

Entitäten beim Search Query Processing
Test im eingeloggten Zustand. Erste Suchanfrage

Test im eingeloggten Zustand. Zweite Suchanfrage

Test im eingeloggten Zustand. Dritte Suchanfrage

Neue SERPS, durch neuen Kontext

Verknüpfung verschiedener Suchanfragen
Quelle: Identifying teachable moments for contextual search,
US20190026338A1
“Methods, systems, and apparatus,
including computer programs encoded on a
computer storage medium, for receiving a
series of queries provided from a user
device, the series of queries including two
or more queries, obtaining a query pattern
of the series of queries based on one or
more entities and one or more aspects
associated with the two or more queries,
….“

Entitäten
Die Hauptaufgaben von Entitäten in der Suche
• Zentrales Organisations-Element
• Interpretation von Suchanfragen
• Kategorisierung auf Dokumentenebene
• Bewertung auf Domainebene bzw. Verfasser-Ebene
• Ausgabe einer Ad hoc Antwort in Form eines Knowledge Panel, Featured
Snippet …

ENTITÄTEN
Benannte Entitäten und Konzepte
Benannte Entitäten:
• Personen
• Unternehmen
• Tiere
• Bauwerke
• Städte/Orte
• Bücher
• Filme
• Veranstaltungen
• …
Konzepte:
• Emotionen
• Friede
• Entfernung
• Wetter
• Thema
• Website
• ….

Entitäten Boxen (Knowledge Panel)

Knowledge Panel = Entitäten-Boxen
Entitäts-Typ: Person

Knowledge Panel
Entitäts-Typ: Film & Computerspiel

Knowledge Panel
Entitäts-Typ: Buch & Mannschaft

MyBusiness Box
Lokale Unternehmens-Entitäten

Knowledge Panel
Google Patent
Die grundsätzliche Funktionsweise bei der Auslieferung
eines Knowledge Panel:
1. Identifikation einer oder mehrerer relevanter
Entitäten in der Suchanfrage
2. Identifikation von relevanten Quellen zur
Hauptentität
3. Erstellung relevanter Suchergebnisse bezüglich der
Suchanfrage
4. Prüfung ob die Suchanfrage sich wirklich auf die
tatsächliche Hauptentität bezieht
5. Ermittlung eines Entitätstyps für die nachgefragte
Hauptentität
6. Auswahl eines geeigneten Knowledge Panel
Templates passend zum ermittelten Entitätstyp
7. Ermittlung von relevanten Content-Elements
bezüglich der Hauptentität aus einer relevanten
und vertrauenswürdigen Quelle.
8. Ermittlung eines eines weiteren Content-Elements
aus einer weiteren Quelle.
9. Auffüllen der Platzhalter im ausgewählten
Knowledge Panel Template mit den ausgewählten
Content-Elementen.
10. Zusammenführen von Suchergebnissen und
Knowledge Panel auf einer Suchergebnisseite
Quelle: Providing knowledge panels with search results, US9268820B2

Knowledge Panel & Knowledge Cards
Google Patente
Durch die Analyse von Suchanfragen
können die am häufigsten angeforderten
Informationen für eine bestimmte Entität
identifiziert werden. Wenn dann ein
Benutzer eine Abfrage sendet, die sich
auf die bestimmte Entität bezieht,
können die am häufigsten angeforderten
Informationen als Antwort auf die
Abfrage in einem Panel bereitgestellt
werden.
Quelle: Identifying and ranking attributes of entities, US9047278B1

Knowledge Cards
Stellen gesuchte Informationen / Attribute zu Entitäten dar

Entitäts-Typ
Hierarchien zwischen Entitäts-Hautp- & -Sub-Typen & Entitäten-Domains
Auszug aus DBpedia Ontology; Quelle: Entity-Oriented Search – Krisztian Balog

Entitäts-Typ
Jeder Entitäts-Typ hat ein Set an möglichen Attributen und in Beziehung
stehenden Entitäten (siehe schema.org)

Entitäts-Typ
Kriterien für die in den SERPs angezeigten Attribute
• Häufigkeit der Kookkurrenzen aus Typ bzw. Entität + Attribut bei Suchanfragen
Quelle: Identifying and ranking attributes of entities, US9047278B1

Entitäts-Typ
Zuordnung einer Entität in eine Typen-Klasse
• Sobald eine Entität einen Schwellenwert von für eine Typen-Klasse
charakteristischen Schlüssel-Attribute erreicht kann diese dieser zugeordnet
werden.
Quelle: Object categorization for information extraction, US20070203868A1

Entitäts-Typ
Suchanfragen bezüglich Entitäts-Typen

Entitäten
Entitätsnamen und ID

Entitäten und E-A-T
Entitäten-Relevanz für Personen über Vision API

Entitäten und E-A-T
Entitäten-Relevanz für Unternehmens-Logos über Vision API

Anspruch an eine Wissens-Datenbank
Vollständigkeit via Data Mining

Data Mining
Prozess
Identifikation
potentieller
Entitäten
(Named Entity
Recognition)
Extrahierung
von
semantischen
Klassen und
Typen
Extrahierung
der
Beziehungen
zwischen den
Entitäten

Data Mining
Datenquellen für den Knowledge Graph

Data Mining
Datenquellen: Strukturiert vs. unstrukturiert
Strukturiert & Semistrukturiert
+ Richtigkeit
+ Funktionale Einfachheit
- Abhängigkeit
- Vollständigkeit
- Nur bedingt skalierbar
Unstrukturiert
+ Vollständigkeit
+ Aktualität
+ Skalierbarkeit
- Richtigkeit
- Funktionale Komplexität
- Fehleranfällig

Data Mining
Search Profile Cards

Data Mining
Aus strukturierten Daten
Beispiel für eine strukturierte Datenquellen sind Freebase, Wikidata, Google my
Business, CIA World Factbook, Datensets wie z.B. Common Crawl.

Data Mining
… aus semistrukturierten Daten (z.B. Wikipedia)

Data Mining
Attribute sammeln mit Wikipedia als Startpunkt
Quelle: Google Patent Unsupervised extraction of facts, US9558186B2
Wikipedia-Beiträge werden als Seed-Dokumente genutzt um erste Attributs-Wert-Paare und
Entitäts-Typen für einzelne Entitäten zu extrahieren. Danach können weitere Informationen aus
anderen unstrukturierten Dokumenten zu der jeweiligen Entität gewonnen werden.

Data Mining
Wikipedia verfügt über die meisten Typen-Klassen
Quelle: Entity Oriented Search von Krisztian Balog

Data Mining
Geschlossene vs. Offene Extrahierung
Geschlossene Extrahierung
Entitäten sind bereits
erfasst, werden nur durch
neue Attribute, Beziehungen
… ergänzt.
Offene Extrahierung
Entitäten müssen nicht
bekannt/erfasst sein Auch
neue (Tail-)Entitäten können
identifiziert und erfasst
werden.
2013 bis heute zukünftig

Data Mining
Problem: Zu wenig strukturiert erfasste Entitäten, Attribute und Beziehungen

Data Mining
Problem: Zu wenig strukturiert erfasste Entitäten, Attribute und Beziehungen
Quelle: https://cikm2013.org/slides/kevin.pdf

Data Mining
Knowledge Vault
Quelle: https://cikm2013.org/slides/kevin.pdf

Data Mining
Knowledge Vault
Data Mining
bei Google
Knowledge
Graph
Entitäten-
SchnittstelleIndex
Bilder
News
Bücher
Websites
VideosApps
Crawler
Manuell validierte & strukturierte Daten
Scholar
zukünftig

Data Mining
Knowledge Vault
Data Mining
bei Google
Knowledge
Graph
Entitäten-
SchnittstelleIndex
Bilder
News
Bücher
Websites
VideosApps
Crawler
Data Mining via
NLP(BERT)
• Entität ?
• Urheber ?
• Beziehung ?
• Attribut ?
• Entitätstyp?
Labeler
• Labels
• Anntotationen
Scholar

Data Mining
Anspruch an einen Knowledge Graph
Vollständigkeit
vs.
Richtigkeit

Data Mining
Vollständigkeit
So viele Informationen wie möglich in Form von
• Entitäten
• Attributen und Werten
• Beziehungen
• Entitäts-Typen & Entitäten-Domains
• …

Die große Herausforderung Richtigkeit

Richtigkeit

Data Mining
Supervised Machine Learning
Wikipedianer,
Webmaster …

Data Mining
Knowledge Vault
(nicht validierte
Daten)
Data Mining
Fehlende Validität ist der Hauptgrund dafür, dass der KG nur langsam wächst
Knowledge
Graph
(validierte
Daten)
Entitäten-
SchnittstelleIndex
Bilder
News
Bücher
Websites
VideosApps
Crawler
Scholar

Data Mining
Knowledge Vault
Data Mining
Machine Learning erhöht Skalierbarkeit des Data Minings exponentiell
Knowledge
Graph
Machine
LearningIndex
Bilder
News
Bücher
Websites
VideosApps
Crawler
Scholar

Data Mining via Machine Learning & NLP
Trainingsdaten aus u.a. Books, Wikipedia Knowledge Graph
Quelle: https://www.cbc.ca/radio/q/blog/are-bert-and-ernie-a-gay-couple-finally-the-answer-1.4828952

Data Mining via Machine Learning & NLP
Trainingsdaten aus u.a. Books, Wikipedia Knowledge Graph

Data Mining
Unsupervised Machine Learning

Häufigkeit als Proof für Validität
Erreicht die Häufigkeit eines Attribut-Werte-Paares aus bestimmten
Datenquellen einen gewissen Schwellenwert ist die Aussage valide.
Quelle: Attribute-value extraction from structured documents, US8645391B1

Data Mining
Machine Learning
Die Fortschritte im Machine
Learning machen Methoden wie
Natural Language Processing und
Vektorraumanalysen für Google
immer performanter und skalierbarer in
der Praxis anwendbar, was die
Interpretation von Entitäten,
Suchanfragen und Inhalten sowie deren
Ranking immer besser möglich macht.

Data Mining
Via NLP über Wortbeziehungen
Subjekt ---------- Prädikat ----------- Objekt
Triple

Entitäten
Über Triples lassen sich nicht in der Query erwähnte Entitäten identifzieren

Data Mining
aus unstrukturierten Daten (Google Patente)
Quelle: Automatic discovery of new entities using graph reconciliation, US10331706
Quelle: Computerized Systems and Methods for Extracting and Storing Information regarding Entities ,
US10198491B1

Danke!
Fragen?
Olaf Kopp
Co-Founder / CBDO / Head of SEO
Aufgesang GmbH
kopp@aufgesang.de
Ihr findet mich bei:
www.xing.com/profile/Olaf_Kopp/
www.linkedin.com/in/olafkopp/
www.instagram.com/olaf_kopp/
twitter.com/olaf_kopp
www.facebook.com/olaf.kopp
www.amazon.de/Olaf-Kopp/e/B00BEQGURG
www.termfrequenz.de/moderatoren/olaf-
kopp/

Entitäten basierte Suche Teil 1: Alles was Du zum Knowledge Graph, Indexierung, NLP, Ranking, E-A-T und die semantische Suche wissen musst.

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Ähnlich wie Entitäten basierte Suche Teil 1: Alles was Du zum Knowledge Graph, Indexierung, NLP, Ranking, E-A-T und die semantische Suche wissen musst.

Ähnlich wie Entitäten basierte Suche Teil 1: Alles was Du zum Knowledge Graph, Indexierung, NLP, Ranking, E-A-T und die semantische Suche wissen musst. (20)

Mehr von Olaf Kopp

Mehr von Olaf Kopp (7)

Entitäten basierte Suche Teil 1: Alles was Du zum Knowledge Graph, Indexierung, NLP, Ranking, E-A-T und die semantische Suche wissen musst.