Enhanced SEO with
Machine Learning (ML)
~ Ende 2015
Machine learning is a field of computer science
that gives computer systems the ability to "learn"
(i.e. progressively improve performance on a
specific task) with data, without being explicitly
programmed.
Source: https://en.wikipedia.org/wiki/Machine_learning
Beispiel: Erkennung von Soft 404 - “Einfache” Programmierung
Bewertung der gecrawlten 200er Seite
- Wenn “404” oder “Error” “Not Found” in Inhalt oder Titel der Seite und
- Wenn weniger als 3 Sätze auf der Seite sind und
- Wenn … oder ….
-> dann “Soft 404”
-> andernfalls “200 OK”
Beispiel: Erkennung von Soft 404 - Machine Learning / Supervised
Datenbeschaffung / Aufbereitung
● Crawl von 500 200er (depth first) Seiten der Top 10.000 Domains (je
Sprache)
● Crawl von 404 Seiten der gleichen Domain (www.domain.de/fehler12987319)
Für jede der gecrawlten Seiten
● Erkennung des Sentiments des Textes
● Anzahl der Wörter selber
● Die vorkommenden Wörter und Ihr Umfeld
Beispiel: Erkennung von Soft 404 - Training & Abfrage
URL Inhalte Anzahl
Links (ohne
Boilerplate)
Sentiment … (Weitere
informatione
n, Header,
Caching…)
Status Code
/beispiel.html Text über Musik 200 (12) 0.1 ... 200
/fehler123.html Es ist ein Problem
aufgetreten
189 (1) -0.5 ... 404
Train
Beispiel: Erkennung von Soft 404ern - Training & Abfrage
URL Inhalte Anzahl
Links
(ohne
Boilerplate)
Sentiment … (Weitere
informatione
n, Header,
Caching…)
Status Code
/beispiel.html Langer Text über
Musik
200 (12) 0.1 ... 200
/fehler123.html Es ist ein
Problem
aufgetreten
189 (1) -0.5 ... 404
Train
/seite123.html 404 Es tut uns
leid...
133 (0) -0.2 ... ?
Abfragemit
unbekanntenDaten
Word2vec & andere unsupervised ML Algorithmen
Train Query
Warum sollte sich ein SEO mit ML auseinandersetzen?
ML: Analyse von NDAs
Quelle: https://futurism.com/ai-contracts-lawyers-lawgeex/
Geschwindigkeit
.. while it took humans anywhere from 51 minutes to more than 2.5 hours to complete all five NDAs, the AI
engine finished in 26 seconds.
Analysis of NDAs: The neural network boasts 94 percent accuracy (versus humans' 85 percent)
Qualität
Analyse von Datenmengen die schwer manuell
auswertbar sind
Google besser verstehen
Lösung für Kunden
Abstrakte Übersicht der ML Bestandteile
Daten / Datenaufbereitung etc.
Algorithmus & Training, Optimierung
ML-Model
Predictions
Beispiel: Content Audit
Ziel
- Vergleich des Inhalts-Umfangs von
Wettbewerber-Websites
- Aufzeigen welche Inhaltsbereiche fehlen oder ausgebaut
werden können
Daten
Classification via
Google Natural
Language
Analyze Data
Content Audit
Inhalte von verschiedenen Seiten extrahieren, Boilerplate
entfernen
Auch möglich: Nur einzelne Bereiche (Blog, Kategorien, ...) / CSV-Artikeldaten etc.
Daten
Classification via
Google Natural
Language
Analyze Data
Content Audit
Google Cloud Natural Language
https://cloud.google.com/natural-language/
Daten
Classification via
Google Natural
Language
Analyze Data
Content Audit
Google Cloud Natural Language
https://cloud.google.com/natural-language/
ML - APIs: Make predictions on existing models
Daten / Datenaufbereitung etc.
Algorithmus & Training, optimierung
ML-Model
Make Predictions
Daten
Classification via
Google Natural
Language
Pivot Data
Content Audit
Text Übersetzen ins Englische (Google Natural Language nur auf Englisch)
=GOOGLETRANSLATE(A1;”DE”;”EN)
Query Google Natural Language API (Spreadsheet Script)
Ergebnis
Content
Classification via
Google Natural
Language
Analyze Data
Content Audit
Content
Classification via
Google Natural
Language
Pivot Data
Content Audit
/Home & Garden/Pest Control
Palmenmann: 11, 1001plants: 0, Evrgreen: 1
Content
Classification via
Google Natural
Language
Pivot Data
Content Audit
/Business & Industrial/Construction & Maintenance/Building Materials & Supplies
Palmenmann: 1, 1001plants: 1, Evrgreen: 38
Content
Kategorie
mapping
Content Audit
Inhalte von verschiedenen Seiten extrahieren, Boilerplate
entfernen
Auch möglich: Nur einzelne Bereiche (Blog, Kategorien, ...) / CSV-Artikeldaten etc.
Analyze Data
Train ML Algo
Predict Kategorie
Content
Kategorie
mapping
Content Audit
Kategorie mapping einer Seite (z.B. anhand der Navigation)
Analyze Data
Train ML Algo
Predict Kategorie
Content
Kategorie
mapping
Content Audit
Analyze Data
Train ML Algo
Predict Kategorie
Training des Classifiers (in diesem Fall mit Spacy / Python)
https://spacy.io/
Content
Kategorie
mapping
Content Audit
Analyze Data
Train ML Algo
Predict Kategorie
Für jede Unterseite / Inhalt die Kategorie bestimmen lassen
Content
Kategorie
mapping
Content Audit
Analyze Data
Train ML Algo
Predict Kategorie
Content
Kategorie
mapping
Content Audit
Analyze Data
Train ML Algo
Predict Kategorie
Weitere Ausbaumöglichkeiten
- Sichtbarkeitsdaten der Landing-Page URLs anreichern
- Prognostizierter Traffic
- CPC
- Durchschnittliche Position
- etc.
- Analyse nur einzelner Bereiche (z.B. Blog, Produkte,
FAQ etc.)
Beispiel: Neue Inhalte
Ziel
Neuen Inhalt für ein Thema erstellen das alle relevanten
Themengebiete bedient
Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Inhalte der Top X (20) rankenden Webseiten zu einem
Begriff (Einblatt)
Daten aufbereiten
Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Inhalte der Top X (20) rankenden Webseiten zu einem
Begriff (Einblatt)
Daten aufbereiten
Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Inhalte der Top X (20) rankenden Webseiten zu einem
Begriff (Einblatt)
Daten aufbereiten
Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Daten aufbereiten
Inhalte in Absätze runterbrechen (meist behandelt ein
Absatz ein Thema)
Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Daten aufbereiten
Data
ML: Clustern in
Topics
Analyze Data
Neue Inhalte
Daten aufbereiten
Visualisiert mit pyLDAvis
Giftstoff,
reizung
Überwintern
Vermehren
Giessen
aronstabgewachs,
aracea
Kolumbien,
Venezuela,
Peru
Luftfeuchtigkeit
Blütenblatt,
Blattform
Schädlinge
Aquarium
Keine Website Struktur?
427 Seiten à 20 Nachrichten = ~ 10.000 Unterseiten hinter einer Paginierung
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
Inhalte extrahieren, Boilerplate entfernen
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Aufbereitung /
Auswertung
Sinnvolle Strukturen schaffen
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Sinnvolle Strukturen schaffen
Content
Clustering via
ML
Manuell: Namen
und Struktur für
Cluster vergeben
ML: Cluster für
jedem Inhalt /
URL zuweisen
Struktur und
Inhaltszuweisunge
n vorhanden
Internet Persönlichkeiten
Sinnvolle Strukturen schaffen
Welche Keywords optimieren?
Aus tausenden Keywords die auswählen, auf die man als nächstes optimiert oder
für die man Inhalte erstellt.
Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
● je Keyword + eigene Position // Wettbewerber Position
○ Suchvolumen des Keywords
○ Position bei dem Keyword
○ Adwords Daten: CPC, Wettbewerb
○ Keyword Intent
○ Gefundene Zielseite:
■ Keyword im Title
■ Keyword im Inhalt
■ Keyword in Description
■ % WDF*IDF Worte des Keywords im Title
■ LDA Score des Textes zum Keyword
■ No. found Domain-Links
■ No. Found links zur URL
■ No. Found links zur URL with Keyword im Linktext
■ Internal-Link Strength
■ ...
Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
1 1
Überschreiben der Daten die wir optimieren können
Vorhersage der Daten für dieses “optimierte” keyword
Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
Daten
Model lernt
Vorhersage nach
Optimierung
Welche Keywords optimieren
Und wie kann ich das für mich nutzen?
Zeit Geld
Online Kurse
udacity.com
udemy.com
Hilfe bei konkreten
Aufgabenstellungen
codementor.io
Ausschreiben /
Freelancer:
upwork.com
Data Scientist
Einstellen
ML Plattformen
bigml.com
monkeylearn.com
Fragen?
Folien, Code?
In den nächsten Wochen über den Labs Newsletter:
http://labs.searchviu.com
Vielen Dank!
Get in Contact
michael@searchviu.com
https://www.xing.com/profile/Michael_Weber60
https://www.linkedin.com/in/weber-michael/

Enhanced SEO with Machine Learning