SlideShare ist ein Scribd-Unternehmen logo
1 von 20
Sebastian Sünkler und Dirk Lewandowski
Hochschule für Angewandte Wissenschaften (HAW) Hamburg
9. März 2021
Präsentation im Rahmen des 16. Internationalen Symposiums für
Informationswissenschaft (ISI 2021)
IST DIE WEBSEITE
SUCHMASCHINENOPTIMIERT?
VORSTELLUNG EINES ONLINE-TOOLS ZUR ANALYSE DER
WAHRSCHEINLICHKEIT DER SUCHMASCHINENOPTIMIERUNG
AUF EINER WEBSEITE
Department Information
Sebastian Sünkler
Dirk Lewandowski
INHALT
Folie 1
1. Einleitung
2. Identifikation von SEO auf einer Webseite
- Halbautomatische Analysemethoden zur Bewertung der SEO-Wahrscheinlichkeit
- Abrufen der URL und Speichern der Metadaten und des HTML-Codes
- Identifizierung von SEO-Plugins und Analytics Tools und Kategorisierung der URL
- Analyse der SEO-Indikatoren
- Bewertung der SEO-Wahrscheinlichkeit
3. Technische Umsetzung des Tools
- Software-Architektur
- Ablauf in der Software
4. Live-Demonstration
5. Fazit und weiteres Vorgehen
6. Quellen
1 EINLEITUNG
Department Information
Sebastian Sünkler
Dirk Lewandowski
1. EINLEITUNG
Folie 3
Relevanz von Suchmaschinen für Inhaltsanbieter
• Suchmaschinen sind der wichtigste Zugang zu Inhalten im Web
• Inhaltsanbieter brauchen Top Positionen in Suchmaschinen, insbesondere von Google
• Google ist klarer Marktführer (87% in den USA und 93% in Europa) (Statcounter 2020a, Statcounter 2020b)
Suchmaschinenmarketing
• SEA (Search Engine Advertisement)
• SEO (Search Engine Optimization)
Forschungsfragen
• Wie viel Einfluss hat SEO auf die „Manipulierung“ der Ergebnislisten in Suchmaschinen?
• Wie lässt sich die Wahrscheinlichkeit von Suchmaschinenoptimierung ermitteln?
2 IDENTIFIKATION VON SEO AUF EINER WEBSEITE
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
HALBAUTOMATISCHE ANALYSEMETHODEN ZUR BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT
Folie 5
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
ABRUFEN DER URL UND SPEICHERN DER METADATEN UND DES HTML-CODES
Folie 6
Speichern der Metadaten
• Identifikation der Hauptdomain
https://isi2021.net/index.php/programme/  https://isi2021.net
• Analyse der robots.txt auf Hinweise für Suchmaschinenoptimierung
• Einfache Berechnung und Speicherung der Ladegeschwindigkeit mit Selenium WebDriver
Speichern des HTML Codes
• Scraping der URL mit Selenium WebDriver und Mozilla Firefox
• Umkodierung von HTML-Tags für die Speicherung in einer Datenbank
• Extraktion von internen und externen Links im Quelltext
• Extraktion und Speicherung von HTML-Kommentaren
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
IDENTIFIZIERUNG VON SEO-PLUGINS UND ANALYTICS TOOLS UND KATEGORISIERUNG DER URL
Folie 7
SEO-Plugins und Analytics Tools
• Abgleich des HTML-Codes mit den Listen mit SEO-Plugins und Analytics Tools
SEO-Plugin: Yoast SEO Plugin
HTML-Code: <!--This site is optimized with the Yoast SEO plugin v12.4 - https://yoast.com/wordpress /plugins/seo/-->
https://yoast.com/wordpress/plugins/seo/
Suchmuster: "*yoast seo*
Kategorisierung der URL
Kategorie Anzahl der Domains
Kunden von SEO-Agenturen 1.004
Nachrichtenangebote 1.203
Webseiten mit Werbung 325
Online-Shops 178
Unternehmensseiten 72
Nicht optimierte Seiten 1
URL URL
Prüfung, ob Domain in einer der Listen
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
ANALYSE DER SEO-INDIKATOREN
Folie 8
Auswahl von technischen Indikatoren
• Auswertung von Fachliteratur zu SEO (Schultheiß & Lewandowski, 2021; Enge, 2015 & Erlhofer, 2019)
• Befragung von SEO-Experten (Schultheiß & Lewandowski, 2021)
Erfasste Indikatoren
Indikator Beschreibung und Prüfung Beispiel
Microdata Nutzung von Microdata-Formaten auf einer Webseite. JSON-LD
Online-Werbung Nutzung von Advertisement-Diensten auf einer Webseite. Google Ads
HTTPS Verwendung des Hypertext Transfer Protocol Secure.
SEO in robots.txt Hinweise zur Konfiguration von Suchmaschinencrawlern crawl-delay
Sitemap Verwendung einer Sitemap auf der Seite für eine bessere Navigation.
Viewport Definition eines Viewports für eine responsive Darstellung der Webseite.
Nofollow-Links Prüfung, ob Nofollow-Links gesetzt wurden. <a href =“example.com“ rel=“nofollow“>
Canonical-Links Prüfung, ob Canonical-Links gesetzt wurden. <a href =“example.com“ rel=“canonical“>
Description Tags Überprüfung, ob eine Description auf der Seite vorhanden ist. <meta name="description" content="example" />
Title Tags Überprüfung, ob das Tag für den Titel der Seite gesetzt ist. <title>example title</title>
Department Information
Sebastian Sünkler
Dirk Lewandowski
2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE
BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT
Folie 9
Klasse Regeln
Höchstwahrscheinlich
optimiert
SEO-Plugin ODER Agenturkunde ODER Nachrichtenangebot
ODER Werbeanzeigen ODER Microdata für SEO
Wahrscheinlich
optimiert
NICHT höchstwahrscheinlich optimiert UND
(Online Shop ODER Unternehmensseite ODER Analytics Tool ODER https ODER SEO
in robots.txt ODER Sitemap vorhanden ODER Viewport definiert ODER Nofollow-Links
ODER Canonical-Links ODER Ladegeschwindigkeit < 3s)
Wahrscheinlich
nicht optimiert
NICHT höchstwahrscheinlich optimiert UND NICHT wahrscheinlich optimiert UND
(NICHT Description ODER NICHT Title ODER NICHT Open Graph)
Höchstwahrscheinlich
nicht optimiert
Nicht optimierte Domain
Entwicklung der Klassifikation
• Analyse von Fachliteratur und Abstimmung mit Experten
• Bildung von vier Klassen anhand der Wahrscheinlichkeit von SEO
3 TECHNISCHE UMSETZUNG DES TOOLS
Department Information
Sebastian Sünkler
Dirk Lewandowski
3. TECHNISCHE UMSETZUNG DES TOOLS
SOFTWARE-ARCHITEKTUR
Folie 11
Department Information
Sebastian Sünkler
Dirk Lewandowski
3. TECHNISCHE UMSETZUNG DES TOOLS
ABLAUF IN DER SOFTWARE
Folie 12
1. Tool öffnen: http://5.189.155.20:5000/
2. Eingabe der URL, die getestet werden soll
3. Auslesen der Metadaten zu der URL
4. Scraping der URL, um den HTML-Quelltext zu speichern
5. Scraping von zwei weiteren Unterseiten, um den Title-Tag zu erfassen
6. Abgleich der URL mit den Kategorien
7. Überprüfung des HTML-Codes auf technische Indikatoren
8. Durchführung der regelbasierten Klassifikation
9. Speichern der Ergebnisse als Report in einer CSV-Datei
10.Optionaler Download des Reports
4 LIVE-DEMONSTRATION
Department Information
Sebastian Sünkler
Dirk Lewandowski
4. LIVE-DEMONSTRATION
Folie 14
http://5.189.155.20:5000/
5 FAZIT UND WEITERES VORGEHEN
Department Information
Sebastian Sünkler
Dirk Lewandowski
5. FAZIT UND WEITERES VORGEHEN
Folie 16
• Tool für die Demonstration unseres Software-Frameworks zur Identifizierung von
Suchmaschinenoptimierung auf einer Webseite.
• Überprüfung unserer Regeln und Prozesse für die Identifikation von SEO.
• Echtzeitanalyse für die Identifizierung der Suchmaschinenoptimierung auf einer Webseite.
• Entwicklung und praktische Anwendung einer ersten Methodik zur Ermittlung der SEO-
Wahrscheinlichkeit in Suchergebnissen.
• Grenzen bei der Klassifikation, da bisher nur regelbasiert.
• Erweiterung der Klassifikation durch externe SEO-Signale wie die Anzahl der Backlinks auf
einer Website und durch die Anwendung von Machine-Learning-Algorithmen.
6 QUELLEN
Department Information
Sebastian Sünkler
Dirk Lewandowski
6. QUELLEN
Literatur der Folien
Enge, E., Spencer, S., Stricchiola, J. (2015). The Art of SEO: Mastering Search Engine Optimization. O’Reilly, Sebastopol, CA
Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch. Rheinwerk Verlag, Bonn
Schultheiß, S., Lewandowski, D.: Expert interviews with stakeholder groups in the context of commercial search engines within the SEO Effect project.
(2021). https://osf.io/y3d6t/
StatCounter (2020a). StatCounter: Search Engine Market Share United States Of America | StatCounter Global Stats.
StatCounter (2020b). StatCounter: Search Engine Market Share Europe | StatCounter Global Stats.
Forschungsdaten
https://osf.io/rvx54/
Folie 18
VIELEN DANK FÜR IHRE
AUFMERKSAMKEIT!

Weitere ähnliche Inhalte

Ähnlich wie Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite

SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)John Muñoz
 
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...Artur Kosch
 
SeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEOSeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEOget traction GmbH
 
Step-by-Step: Guide zur SEO-OnPage Optimierung Ihrer Website
Step-by-Step: Guide zur SEO-OnPage Optimierung Ihrer WebsiteStep-by-Step: Guide zur SEO-OnPage Optimierung Ihrer Website
Step-by-Step: Guide zur SEO-OnPage Optimierung Ihrer Websitesemrush_webinars
 
TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...
TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...
TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...TourismFastForward
 
Mein Betrieb im Internet: So findet mich der Gast
Mein Betrieb im Internet: So findet mich der GastMein Betrieb im Internet: So findet mich der Gast
Mein Betrieb im Internet: So findet mich der GastChristina Steinkellner
 
Seo Campixx 2015 - Technical SEO for Beginners
Seo Campixx 2015 - Technical SEO for BeginnersSeo Campixx 2015 - Technical SEO for Beginners
Seo Campixx 2015 - Technical SEO for BeginnersJan Berens
 
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Stefan Seifarth
 
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...Artur Kosch
 
SEMrush Übersicht von allen Tools Stand 03.2019
SEMrush Übersicht von allen Tools  Stand 03.2019SEMrush Übersicht von allen Tools  Stand 03.2019
SEMrush Übersicht von allen Tools Stand 03.2019Evgeni Sereda
 
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...Artur Kosch
 
Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...
Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...
Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...Carpathia AG
 
Website Relaunch like a SEO Pro
Website Relaunch like a SEO ProWebsite Relaunch like a SEO Pro
Website Relaunch like a SEO ProBjörn Darko
 
Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016
Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016
Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016Mario Träger
 
Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016
Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016
Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016André Scharf
 
SEO-Workshop - by Heiko Stammel
SEO-Workshop - by Heiko StammelSEO-Workshop - by Heiko Stammel
SEO-Workshop - by Heiko StammelBlogfamilia
 
Content Audit | Campixx 2015 | Manuel Stürkat & Gustav Kemter
Content Audit | Campixx 2015 | Manuel Stürkat & Gustav KemterContent Audit | Campixx 2015 | Manuel Stürkat & Gustav Kemter
Content Audit | Campixx 2015 | Manuel Stürkat & Gustav KemterManuel Stürkat
 
SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016AGOM_Online_Marketing
 
Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?Johanna Maier
 

Ähnlich wie Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite (20)

SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)SEO A/B Testing by John Munoz (Digital Loop)
SEO A/B Testing by John Munoz (Digital Loop)
 
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
 
SeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEOSeoDay 2017: Mikroprozesse im SEO
SeoDay 2017: Mikroprozesse im SEO
 
Step-by-Step: Guide zur SEO-OnPage Optimierung Ihrer Website
Step-by-Step: Guide zur SEO-OnPage Optimierung Ihrer WebsiteStep-by-Step: Guide zur SEO-OnPage Optimierung Ihrer Website
Step-by-Step: Guide zur SEO-OnPage Optimierung Ihrer Website
 
Beratungsangebot SEO für Websites
Beratungsangebot SEO für WebsitesBeratungsangebot SEO für Websites
Beratungsangebot SEO für Websites
 
TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...
TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...
TFF2015, Christoph Hoffinger, reachout Online Marketing, "Mit schema.org zu R...
 
Mein Betrieb im Internet: So findet mich der Gast
Mein Betrieb im Internet: So findet mich der GastMein Betrieb im Internet: So findet mich der Gast
Mein Betrieb im Internet: So findet mich der Gast
 
Seo Campixx 2015 - Technical SEO for Beginners
Seo Campixx 2015 - Technical SEO for BeginnersSeo Campixx 2015 - Technical SEO for Beginners
Seo Campixx 2015 - Technical SEO for Beginners
 
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
 
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
 
SEMrush Übersicht von allen Tools Stand 03.2019
SEMrush Übersicht von allen Tools  Stand 03.2019SEMrush Übersicht von allen Tools  Stand 03.2019
SEMrush Übersicht von allen Tools Stand 03.2019
 
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
JavaScript SEO - Crawling, Indexierung und Auditing von JavaScript-Websites -...
 
Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...
Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...
Lukas Stuber, Angelink: E-Shop-Performance steigern mit Suchmaschinen und Web...
 
Website Relaunch like a SEO Pro
Website Relaunch like a SEO ProWebsite Relaunch like a SEO Pro
Website Relaunch like a SEO Pro
 
Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016
Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016
Online Shop SEO Audits mit Screaming Frog & URL Profiler | SEO Campixx 2016
 
Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016
Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016
Warum SEO (auch) Deine Aufgabe ist - WebTechCon 2016
 
SEO-Workshop - by Heiko Stammel
SEO-Workshop - by Heiko StammelSEO-Workshop - by Heiko Stammel
SEO-Workshop - by Heiko Stammel
 
Content Audit | Campixx 2015 | Manuel Stürkat & Gustav Kemter
Content Audit | Campixx 2015 | Manuel Stürkat & Gustav KemterContent Audit | Campixx 2015 | Manuel Stürkat & Gustav Kemter
Content Audit | Campixx 2015 | Manuel Stürkat & Gustav Kemter
 
SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016SEO-Controlling mit Google Analytics koks.digital 2016
SEO-Controlling mit Google Analytics koks.digital 2016
 
Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?Pixel Rank - die bessere Metrik für dein Ranking?
Pixel Rank - die bessere Metrik für dein Ranking?
 

Mehr von Hamburg University of Applied Sciences (HAW)

Mehr von Hamburg University of Applied Sciences (HAW) (11)

Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit SprachsucheEntwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
Entwicklungen und Anwendungsbereiche von digitalen Assistenten mit Sprachsuche
 
Die Relevanz von sprachgesteuerter Suche für den Onlinehandel
Die Relevanz von sprachgesteuerter Suche für den OnlinehandelDie Relevanz von sprachgesteuerter Suche für den Onlinehandel
Die Relevanz von sprachgesteuerter Suche für den Onlinehandel
 
The influence of search engine optimization on Google's results: A multi-dime...
The influence of search engine optimization on Google's results: A multi-dime...The influence of search engine optimization on Google's results: A multi-dime...
The influence of search engine optimization on Google's results: A multi-dime...
 
Ok Google... The end of search as we know it
Ok Google... The end of search as we know itOk Google... The end of search as we know it
Ok Google... The end of search as we know it
 
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
THE END OF SEARCH AS WE KNOW IT Sprachsuche und Personal Assistants als neuer...
 
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
WEBSEARCH: THE NEXT GENERATION Entwicklungen in der Websuche durch die Verbre...
 
World Usability Day Hamburg 2015: Workshop Voice Search
World Usability Day Hamburg 2015: Workshop Voice SearchWorld Usability Day Hamburg 2015: Workshop Voice Search
World Usability Day Hamburg 2015: Workshop Voice Search
 
Lebensmittelkontrolle 2.0: Das AAPVL Projekt
Lebensmittelkontrolle 2.0: Das AAPVL ProjektLebensmittelkontrolle 2.0: Das AAPVL Projekt
Lebensmittelkontrolle 2.0: Das AAPVL Projekt
 
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
Relevance Assessment Tool - Ein Werkzeug zum Design von Retrievaltests sowie ...
 
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
Die Verbreitung von Sprachsteuerung und Personal Assistants auf Smartphones u...
 
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
Workshop Trends und Entwicklungen in der Websuche und deren Relevanz für Bibl...
 

Ist die Webseite suchmaschinenoptimiert? Vorstellung eines Online-Tools zur Analyse der Wahrscheinlichkeit der Suchmaschinenoptimierung auf einer Webseite

  • 1. Sebastian Sünkler und Dirk Lewandowski Hochschule für Angewandte Wissenschaften (HAW) Hamburg 9. März 2021 Präsentation im Rahmen des 16. Internationalen Symposiums für Informationswissenschaft (ISI 2021) IST DIE WEBSEITE SUCHMASCHINENOPTIMIERT? VORSTELLUNG EINES ONLINE-TOOLS ZUR ANALYSE DER WAHRSCHEINLICHKEIT DER SUCHMASCHINENOPTIMIERUNG AUF EINER WEBSEITE
  • 2. Department Information Sebastian Sünkler Dirk Lewandowski INHALT Folie 1 1. Einleitung 2. Identifikation von SEO auf einer Webseite - Halbautomatische Analysemethoden zur Bewertung der SEO-Wahrscheinlichkeit - Abrufen der URL und Speichern der Metadaten und des HTML-Codes - Identifizierung von SEO-Plugins und Analytics Tools und Kategorisierung der URL - Analyse der SEO-Indikatoren - Bewertung der SEO-Wahrscheinlichkeit 3. Technische Umsetzung des Tools - Software-Architektur - Ablauf in der Software 4. Live-Demonstration 5. Fazit und weiteres Vorgehen 6. Quellen
  • 4. Department Information Sebastian Sünkler Dirk Lewandowski 1. EINLEITUNG Folie 3 Relevanz von Suchmaschinen für Inhaltsanbieter • Suchmaschinen sind der wichtigste Zugang zu Inhalten im Web • Inhaltsanbieter brauchen Top Positionen in Suchmaschinen, insbesondere von Google • Google ist klarer Marktführer (87% in den USA und 93% in Europa) (Statcounter 2020a, Statcounter 2020b) Suchmaschinenmarketing • SEA (Search Engine Advertisement) • SEO (Search Engine Optimization) Forschungsfragen • Wie viel Einfluss hat SEO auf die „Manipulierung“ der Ergebnislisten in Suchmaschinen? • Wie lässt sich die Wahrscheinlichkeit von Suchmaschinenoptimierung ermitteln?
  • 5. 2 IDENTIFIKATION VON SEO AUF EINER WEBSEITE
  • 6. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE HALBAUTOMATISCHE ANALYSEMETHODEN ZUR BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT Folie 5
  • 7. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE ABRUFEN DER URL UND SPEICHERN DER METADATEN UND DES HTML-CODES Folie 6 Speichern der Metadaten • Identifikation der Hauptdomain https://isi2021.net/index.php/programme/  https://isi2021.net • Analyse der robots.txt auf Hinweise für Suchmaschinenoptimierung • Einfache Berechnung und Speicherung der Ladegeschwindigkeit mit Selenium WebDriver Speichern des HTML Codes • Scraping der URL mit Selenium WebDriver und Mozilla Firefox • Umkodierung von HTML-Tags für die Speicherung in einer Datenbank • Extraktion von internen und externen Links im Quelltext • Extraktion und Speicherung von HTML-Kommentaren
  • 8. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE IDENTIFIZIERUNG VON SEO-PLUGINS UND ANALYTICS TOOLS UND KATEGORISIERUNG DER URL Folie 7 SEO-Plugins und Analytics Tools • Abgleich des HTML-Codes mit den Listen mit SEO-Plugins und Analytics Tools SEO-Plugin: Yoast SEO Plugin HTML-Code: <!--This site is optimized with the Yoast SEO plugin v12.4 - https://yoast.com/wordpress /plugins/seo/--> https://yoast.com/wordpress/plugins/seo/ Suchmuster: "*yoast seo* Kategorisierung der URL Kategorie Anzahl der Domains Kunden von SEO-Agenturen 1.004 Nachrichtenangebote 1.203 Webseiten mit Werbung 325 Online-Shops 178 Unternehmensseiten 72 Nicht optimierte Seiten 1 URL URL Prüfung, ob Domain in einer der Listen
  • 9. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE ANALYSE DER SEO-INDIKATOREN Folie 8 Auswahl von technischen Indikatoren • Auswertung von Fachliteratur zu SEO (Schultheiß & Lewandowski, 2021; Enge, 2015 & Erlhofer, 2019) • Befragung von SEO-Experten (Schultheiß & Lewandowski, 2021) Erfasste Indikatoren Indikator Beschreibung und Prüfung Beispiel Microdata Nutzung von Microdata-Formaten auf einer Webseite. JSON-LD Online-Werbung Nutzung von Advertisement-Diensten auf einer Webseite. Google Ads HTTPS Verwendung des Hypertext Transfer Protocol Secure. SEO in robots.txt Hinweise zur Konfiguration von Suchmaschinencrawlern crawl-delay Sitemap Verwendung einer Sitemap auf der Seite für eine bessere Navigation. Viewport Definition eines Viewports für eine responsive Darstellung der Webseite. Nofollow-Links Prüfung, ob Nofollow-Links gesetzt wurden. <a href =“example.com“ rel=“nofollow“> Canonical-Links Prüfung, ob Canonical-Links gesetzt wurden. <a href =“example.com“ rel=“canonical“> Description Tags Überprüfung, ob eine Description auf der Seite vorhanden ist. <meta name="description" content="example" /> Title Tags Überprüfung, ob das Tag für den Titel der Seite gesetzt ist. <title>example title</title>
  • 10. Department Information Sebastian Sünkler Dirk Lewandowski 2. IDENTIFIKATION VON SEO AUF EINER WEBSEITE BEWERTUNG DER SEO-WAHRSCHEINLICHKEIT Folie 9 Klasse Regeln Höchstwahrscheinlich optimiert SEO-Plugin ODER Agenturkunde ODER Nachrichtenangebot ODER Werbeanzeigen ODER Microdata für SEO Wahrscheinlich optimiert NICHT höchstwahrscheinlich optimiert UND (Online Shop ODER Unternehmensseite ODER Analytics Tool ODER https ODER SEO in robots.txt ODER Sitemap vorhanden ODER Viewport definiert ODER Nofollow-Links ODER Canonical-Links ODER Ladegeschwindigkeit < 3s) Wahrscheinlich nicht optimiert NICHT höchstwahrscheinlich optimiert UND NICHT wahrscheinlich optimiert UND (NICHT Description ODER NICHT Title ODER NICHT Open Graph) Höchstwahrscheinlich nicht optimiert Nicht optimierte Domain Entwicklung der Klassifikation • Analyse von Fachliteratur und Abstimmung mit Experten • Bildung von vier Klassen anhand der Wahrscheinlichkeit von SEO
  • 12. Department Information Sebastian Sünkler Dirk Lewandowski 3. TECHNISCHE UMSETZUNG DES TOOLS SOFTWARE-ARCHITEKTUR Folie 11
  • 13. Department Information Sebastian Sünkler Dirk Lewandowski 3. TECHNISCHE UMSETZUNG DES TOOLS ABLAUF IN DER SOFTWARE Folie 12 1. Tool öffnen: http://5.189.155.20:5000/ 2. Eingabe der URL, die getestet werden soll 3. Auslesen der Metadaten zu der URL 4. Scraping der URL, um den HTML-Quelltext zu speichern 5. Scraping von zwei weiteren Unterseiten, um den Title-Tag zu erfassen 6. Abgleich der URL mit den Kategorien 7. Überprüfung des HTML-Codes auf technische Indikatoren 8. Durchführung der regelbasierten Klassifikation 9. Speichern der Ergebnisse als Report in einer CSV-Datei 10.Optionaler Download des Reports
  • 15. Department Information Sebastian Sünkler Dirk Lewandowski 4. LIVE-DEMONSTRATION Folie 14 http://5.189.155.20:5000/
  • 16. 5 FAZIT UND WEITERES VORGEHEN
  • 17. Department Information Sebastian Sünkler Dirk Lewandowski 5. FAZIT UND WEITERES VORGEHEN Folie 16 • Tool für die Demonstration unseres Software-Frameworks zur Identifizierung von Suchmaschinenoptimierung auf einer Webseite. • Überprüfung unserer Regeln und Prozesse für die Identifikation von SEO. • Echtzeitanalyse für die Identifizierung der Suchmaschinenoptimierung auf einer Webseite. • Entwicklung und praktische Anwendung einer ersten Methodik zur Ermittlung der SEO- Wahrscheinlichkeit in Suchergebnissen. • Grenzen bei der Klassifikation, da bisher nur regelbasiert. • Erweiterung der Klassifikation durch externe SEO-Signale wie die Anzahl der Backlinks auf einer Website und durch die Anwendung von Machine-Learning-Algorithmen.
  • 19. Department Information Sebastian Sünkler Dirk Lewandowski 6. QUELLEN Literatur der Folien Enge, E., Spencer, S., Stricchiola, J. (2015). The Art of SEO: Mastering Search Engine Optimization. O’Reilly, Sebastopol, CA Erlhofer, S. (2019). Suchmaschinen-Optimierung: Das umfassende Handbuch. Rheinwerk Verlag, Bonn Schultheiß, S., Lewandowski, D.: Expert interviews with stakeholder groups in the context of commercial search engines within the SEO Effect project. (2021). https://osf.io/y3d6t/ StatCounter (2020a). StatCounter: Search Engine Market Share United States Of America | StatCounter Global Stats. StatCounter (2020b). StatCounter: Search Engine Market Share Europe | StatCounter Global Stats. Forschungsdaten https://osf.io/rvx54/ Folie 18
  • 20. VIELEN DANK FÜR IHRE AUFMERKSAMKEIT!