Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite
Ist die Webseite suchmaschinenoptimiert?
Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite
Sebastian Sünkler
16. Internationalen Symposiums für Informationswissenschaft (ISI 2021) March 8-11, 2021, Online
https://www.youtube.com/watch?v=LG1y27FIcps
Sünkler, S.; Lewandowski, D.(2021). Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite In: T. Schmidt, C. Wolff (Hrsg.): Information between Data and Knowledge. Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021), Regensburg, Germany, 8th—10th March 2021. Glückstadt: Verlag Werner Hülsbusch, pp. 299—306.
https://www.doi.org/10.5283/epub.44949
Ähnlich wie Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite
Pixel Rank - die bessere Metrik für dein Ranking?Johanna Maier
Ähnlich wie Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite (20)
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite
1. Sebastian Sünkler und Dirk Lewandowski
Hochschule für Angewandte Wissenschaften (HAW) Hamburg
9. März 2021
Präsentation im Rahmen des 16. Internationalen Symposiums für
Informationswissenschaft (ISI 2021)
IST DIE WEBSEITE
SUCHMASCHINENOPTIMIERT?
VORSTELLUNG EINES ONLINE-TOOLS ZUR ANALYSE DER
WAHRSCHEINLICHKEIT DER SUCHMASCHINENOPTIMIERUNG
AUF EINER WEBSEITE
2. Department Information
Sebastian Sünkler
Dirk Lewandowski
INHALT
Folie 1
1. Einleitung
2. Identifikation von SEO auf einer Webseite
- Halbautomatische Analysemethoden zur Bewertung der SEO-Wahrscheinlichkeit
- Abrufen der URL und Speichern der Metadaten und des HTML-Codes
- Identifizierung von SEO-Plugins und Analytics Tools und Kategorisierung der URL
- Analyse der SEO-Indikatoren
- Bewertung der SEO-Wahrscheinlichkeit
3. Technische Umsetzung des Tools
- Software-Architektur
- Ablauf in der Software
4. Live-Demonstration
5. Fazit und weiteres Vorgehen
6. Quellen
4. Department Information
Sebastian Sünkler
Dirk Lewandowski
1. EINLEITUNG
Folie 3
Relevanz von Suchmaschinen für Inhaltsanbieter
• Suchmaschinen sind der wichtigste Zugang zu Inhalten im Web
• Inhaltsanbieter brauchen Top Positionen in Suchmaschinen, insbesondere von Google
• Google ist klarer Marktführer (87% in den USA und 93% in Europa) (Statcounter 2020a, Statcounter 2020b)
Suchmaschinenmarketing
• SEA (Search Engine Advertisement)
• SEO (Search Engine Optimization)
Forschungsfragen
• Wie viel Einfluss hat SEO auf die „Manipulierung“ der Ergebnislisten in Suchmaschinen?
• Wie lässt sich die Wahrscheinlichkeit von Suchmaschinenoptimierung ermitteln?
6. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
HALBAUTOMATISCHE ANALYSEMETHODEN ZUR BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT
Folie 5
7. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
ABRUFEN DER URL UND SPEICHERN DER METADATEN UND DES HTML-CODES
Folie 6
Speichern der Metadaten
• Identifikation der Hauptdomain
https://isi2021.net/index.php/programme/ https://isi2021.net
• Analyse der robots.txt auf Hinweise für Suchmaschinenoptimierung
• Einfache Berechnung und Speicherung der Ladegeschwindigkeit mit Selenium WebDriver
Speichern des HTML Codes
• Scraping der URL mit Selenium WebDriver und Mozilla Firefox
• Umkodierung von HTML-Tags für die Speicherung in einer Datenbank
• Extraktion von internen und externen Links im Quelltext
• Extraktion und Speicherung von HTML-Kommentaren
8. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
IDENTIFIZIERUNG VON SEO-PLUGINS UND ANALYTICS TOOLS UND KATEGORISIERUNG DER URL
Folie 7
SEO-Plugins und Analytics Tools
• Abgleich des HTML-Codes mit den Listen mit SEO-Plugins und Analytics Tools
SEO-Plugin: Yoast SEO Plugin
HTML-Code: <!--This site is optimized with the Yoast SEO plugin v12.4 - https://yoast.com/wordpress /plugins/seo/-->
https://yoast.com/wordpress/plugins/seo/
Suchmuster: "*yoast seo*
Kategorisierung der URL
Kategorie Anzahl der Domains
Kunden von SEO-Agenturen 1.004
Nachrichtenangebote 1.203
Webseiten mit Werbung 325
Online-Shops 178
Unternehmensseiten 72
Nicht optimierte Seiten 1
URL URL
Prüfung, ob Domain in einer der Listen
9. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
ANALYSE DER SEO-INDIKATOREN
Folie 8
Auswahl von technischen Indikatoren
• Auswertung von Fachliteratur zu SEO (Schultheiß & Lewandowski, 2021; Enge, 2015 & Erlhofer, 2019)
• Befragung von SEO-Experten (Schultheiß & Lewandowski, 2021)
Erfasste Indikatoren
Indikator Beschreibung und Prüfung Beispiel
Microdata Nutzung von Microdata-Formaten auf einer Webseite. JSON-LD
Online-Werbung Nutzung von Advertisement-Diensten auf einer Webseite. Google Ads
HTTPS Verwendung des Hypertext Transfer Protocol Secure.
SEO in robots.txt Hinweise zur Konfiguration von Suchmaschinencrawlern crawl-delay
Sitemap Verwendung einer Sitemap auf der Seite für eine bessere Navigation.
Viewport Definition eines Viewports für eine responsive Darstellung der Webseite.
Nofollow-Links Prüfung, ob Nofollow-Links gesetzt wurden. <a href =“example.com“ rel=“nofollow“>
Canonical-Links Prüfung, ob Canonical-Links gesetzt wurden. <a href =“example.com“ rel=“canonical“>
Description Tags Überprüfung, ob eine Description auf der Seite vorhanden ist. <meta name="description" content="example" />
Title Tags Überprüfung, ob das Tag für den Titel der Seite gesetzt ist. <title>example title</title>
10. Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT
Folie 9
Klasse Regeln
Höchstwahrscheinlich
optimiert
SEO-Plugin ODER Agenturkunde ODER Nachrichtenangebot
ODER Werbeanzeigen ODER Microdata für SEO
Wahrscheinlich
optimiert
NICHT höchstwahrscheinlich optimiert UND
(Online Shop ODER Unternehmensseite ODER Analytics Tool ODER https ODER SEO
in robots.txt ODER Sitemap vorhanden ODER Viewport definiert ODER Nofollow-Links
ODER Canonical-Links ODER Ladegeschwindigkeit < 3s)
Wahrscheinlich
nicht optimiert
NICHT höchstwahrscheinlich optimiert UND NICHT wahrscheinlich optimiert UND
(NICHT Description ODER NICHT Title ODER NICHT Open Graph)
Höchstwahrscheinlich
nicht optimiert
Nicht optimierte Domain
Entwicklung der Klassifikation
• Analyse von Fachliteratur und Abstimmung mit Experten
• Bildung von vier Klassen anhand der Wahrscheinlichkeit von SEO
13. Department Information
Sebastian Sünkler
Dirk Lewandowski
3. TECHNISCHE UMSETZUNG DES TOOLS
ABLAUF IN DER SOFTWARE
Folie 12
1. Tool öffnen: http://5.189.155.20:5000/
2. Eingabe der URL, die getestet werden soll
3. Auslesen der Metadaten zu der URL
4. Scraping der URL, um den HTML-Quelltext zu speichern
5. Scraping von zwei weiteren Unterseiten, um den Title-Tag zu erfassen
6. Abgleich der URL mit den Kategorien
7. Überprüfung des HTML-Codes auf technische Indikatoren
8. Durchführung der regelbasierten Klassifikation
9. Speichern der Ergebnisse als Report in einer CSV-Datei
10.Optionaler Download des Reports
17. Department Information
Sebastian Sünkler
Dirk Lewandowski
5. FAZIT UND WEITERES VORGEHEN
Folie 16
• Tool für die Demonstration unseres Software-Frameworks zur Identifizierung von
Suchmaschinenoptimierung auf einer Webseite.
• Überprüfung unserer Regeln und Prozesse für die Identifikation von SEO.
• Echtzeitanalyse für die Identifizierung der Suchmaschinenoptimierung auf einer Webseite.
• Entwicklung und praktische Anwendung einer ersten Methodik zur Ermittlung der SEO-
Wahrscheinlichkeit in Suchergebnissen.
• Grenzen bei der Klassifikation, da bisher nur regelbasiert.
• Erweiterung der Klassifikation durch externe SEO-Signale wie die Anzahl der Backlinks auf
einer Website und durch die Anwendung von Machine-Learning-Algorithmen.
19. Department Information
Sebastian Sünkler
Dirk Lewandowski
6. QUELLEN
Literatur der Folien
Enge, E., Spencer, S., Stricchiola, J. (2015). The Art of SEO: Mastering Search Engine Optimization. O’Reilly, Sebastopol, CA
Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch. Rheinwerk Verlag, Bonn
Schultheiß, S., Lewandowski, D.: Expert interviews with stakeholder groups in the context of commercial search engines within the SEO Effect project.
(2021). https://osf.io/y3d6t/
StatCounter (2020a). StatCounter: Search Engine Market Share United States Of America | StatCounter Global Stats.
StatCounter (2020b). StatCounter: Search Engine Market Share Europe | StatCounter Global Stats.
Forschungsdaten
https://osf.io/rvx54/
Folie 18