Wir haben uns ganz konkret der Frage gewidmet, was das Crawl-Budget eigentlich ist und wie dieses ausgewertet werden kann.
Johannes Giesche und Eduard Protzel von der Online-Marketing-Agentur Trust Agents aus Berlin auf der SEO Campixx 2018
PageSpeed Extreme für das große Speed Update 2021SEARCH ONE
Googles Page Experience Update steht vor der Tür. Im kommenden Jahr wird die Ladezeit zum Rankingfaktor und damit zum Optimierungsgegenstand für Suchmaschinenoptimierer. Kai Spriestersbach zeigt in seinem Vortrag einige fortgeschrittene Methoden, mit denen er, über die bekannten Basics hinaus, die Ladezeit moderner Webseiten effektiv verbessert.
Mehr und mehr entscheidet sich die Performance von Webanwendungen nicht mehr auf dem Server, sondern im Browser des Users. Die Session zeigt auf, warum nicht nur PHP-Performance eine Rolle spielt, sondern was wirklich zu einer schnellen Website beiträgt und welche Hilfsmittel man in der PHP-Welt zur Verfügung hat.
Presentation at IPC 2010 in Berlin, Germany. Frank Kleine and me talked about how to accelerate page speed in general with a detailed look at PHP solutions.
PageSpeed Extreme für das große Speed Update 2021SEARCH ONE
Googles Page Experience Update steht vor der Tür. Im kommenden Jahr wird die Ladezeit zum Rankingfaktor und damit zum Optimierungsgegenstand für Suchmaschinenoptimierer. Kai Spriestersbach zeigt in seinem Vortrag einige fortgeschrittene Methoden, mit denen er, über die bekannten Basics hinaus, die Ladezeit moderner Webseiten effektiv verbessert.
Mehr und mehr entscheidet sich die Performance von Webanwendungen nicht mehr auf dem Server, sondern im Browser des Users. Die Session zeigt auf, warum nicht nur PHP-Performance eine Rolle spielt, sondern was wirklich zu einer schnellen Website beiträgt und welche Hilfsmittel man in der PHP-Welt zur Verfügung hat.
Presentation at IPC 2010 in Berlin, Germany. Frank Kleine and me talked about how to accelerate page speed in general with a detailed look at PHP solutions.
Warum ist die Performance mit für den Erfolg von Webprojekten entscheidend?
Welche Auswirkungen kann eine zusätzliche Sekunde Ladezeit in Bezug auf die Webseiten-Hits und den Umsatz haben? Und vor allem: wie können wir Entwickler die Performance deutlich verbessern? Und zwar ohne neue Hardware anzuschaffen.
Eine Einführung in die Web Performance Optimierung (SEITENBAU Developer Convention 2011 - 24.09.2011)
- Wie betrachtet ein Nutzer eine Webseite?
- Wie kann man die Performance messen?
- Welche Optimierungsmöglichkeiten gibt es?
- Client-seitige Optimierungen
- Server-seitige Optimierungen
- Automatisierung der Optimierungen
- Blick in die Zukunft (u.A.: Google SPDY)
Informationsarchitektur & Verlinkung - SMX München 2014Bastian Grimm
10 DOs & DON‘Ts zu den Themen Informationsarchitektur & interne Verlinkung, inkl. Priorisierung, Indexierungssteuerung & Verwendung von On-Page Tools wie bspw. DeepCrawl, etc.
HTTPs Migration How To - SMX München 2017Bastian Grimm
Meine Präsentation der SMX 2017 in München (Tag 2) rund um das Thema "HTTPs Site Migration" inkl. ausführlicher Checkliste, diversen Tools für Monitoring, Testing, etc. sowie vielem mehr!
Es wird endlich Zeit die eigene Webseite aufzuräumen! Dominik erzählt euch, wie ihr am besten vorgeht.
Dominik Wojcik der Geschäftsführer der Online-Marketing-Agentur Trust Agents aus Berlin auf der SEOkomm 2016.
Data Scraping with Excel - Campixx 2013 - Maik SchmidtMaik Schmidt
Auf meiner Campixx Session habe ich gezeigt, wie man mit Hilfe von Excel und X-Path Daten aus dem Web scrapen kann. u.a. wurden gescraped: Standard KPIs, Malware Checker, Index Checker, Google SERPs, Google Suggest
Meine Präsentation der #SEOkomm2014 in Salzburg zum Thema Performance Optimierung. Neben diversen Zahlen sprechen wir über das Critical Path Rendering, Strategien zur Web-Request Optimierung, (WordPress-) Caching und vieles mehr!
Wie baut Google seine SERPs auch, was wird getrackt und wie landet man gezielt in einem A/B-Test der Google? Diesen und andere Dinge werden in diesem Vortrag auf den Grund gegangen. Ein bunter Strauß an Learnings bei der Analyse der Google SERPs.
45 minütige Präsentation von der SEOkomm 2013 in Salzburg zum Thema Linkrisiko- bzw. Linkqualitätsmanagement inkl. Linkanalyse, Linkremoval, Google Disavow Tool, Reconsideration Requests, etc.
Im Kontext von APIs kommt derzeit keiner an REST (Representational State Transfer) vorbei. REST gilt als leichtgewichtige, skalierbare und schnell erlernbare Alternative zu SOAP, die sich die vorhandene Infrastruktur des WWW zunutze macht. In der Praxis hat aber auch REST seine Schwächen. So ist gutes API-Design häufig eine Herausforderung. Für mobile Anwendungen ist REST zu starr und geht nicht effizient genug mit Bandbreite um.
Im Vortrag werden Stärken und Schwächen von REST aufgezeigt und mit GraphQL eine Alternative speziell für den mobilen Kontext vorgestellt.
Präsentation zum Trust Agents (part of Dept) Meetup am 30.10.18 in Berlin. Das Thema lautet "Einstieg ins Data-Driven Marketing" und es werden drei Schwerpunkte - Reporting, Analyse, Personalisierung - behandelt.
Warum ist die Performance mit für den Erfolg von Webprojekten entscheidend?
Welche Auswirkungen kann eine zusätzliche Sekunde Ladezeit in Bezug auf die Webseiten-Hits und den Umsatz haben? Und vor allem: wie können wir Entwickler die Performance deutlich verbessern? Und zwar ohne neue Hardware anzuschaffen.
Eine Einführung in die Web Performance Optimierung (SEITENBAU Developer Convention 2011 - 24.09.2011)
- Wie betrachtet ein Nutzer eine Webseite?
- Wie kann man die Performance messen?
- Welche Optimierungsmöglichkeiten gibt es?
- Client-seitige Optimierungen
- Server-seitige Optimierungen
- Automatisierung der Optimierungen
- Blick in die Zukunft (u.A.: Google SPDY)
Informationsarchitektur & Verlinkung - SMX München 2014Bastian Grimm
10 DOs & DON‘Ts zu den Themen Informationsarchitektur & interne Verlinkung, inkl. Priorisierung, Indexierungssteuerung & Verwendung von On-Page Tools wie bspw. DeepCrawl, etc.
HTTPs Migration How To - SMX München 2017Bastian Grimm
Meine Präsentation der SMX 2017 in München (Tag 2) rund um das Thema "HTTPs Site Migration" inkl. ausführlicher Checkliste, diversen Tools für Monitoring, Testing, etc. sowie vielem mehr!
Es wird endlich Zeit die eigene Webseite aufzuräumen! Dominik erzählt euch, wie ihr am besten vorgeht.
Dominik Wojcik der Geschäftsführer der Online-Marketing-Agentur Trust Agents aus Berlin auf der SEOkomm 2016.
Data Scraping with Excel - Campixx 2013 - Maik SchmidtMaik Schmidt
Auf meiner Campixx Session habe ich gezeigt, wie man mit Hilfe von Excel und X-Path Daten aus dem Web scrapen kann. u.a. wurden gescraped: Standard KPIs, Malware Checker, Index Checker, Google SERPs, Google Suggest
Meine Präsentation der #SEOkomm2014 in Salzburg zum Thema Performance Optimierung. Neben diversen Zahlen sprechen wir über das Critical Path Rendering, Strategien zur Web-Request Optimierung, (WordPress-) Caching und vieles mehr!
Wie baut Google seine SERPs auch, was wird getrackt und wie landet man gezielt in einem A/B-Test der Google? Diesen und andere Dinge werden in diesem Vortrag auf den Grund gegangen. Ein bunter Strauß an Learnings bei der Analyse der Google SERPs.
45 minütige Präsentation von der SEOkomm 2013 in Salzburg zum Thema Linkrisiko- bzw. Linkqualitätsmanagement inkl. Linkanalyse, Linkremoval, Google Disavow Tool, Reconsideration Requests, etc.
Im Kontext von APIs kommt derzeit keiner an REST (Representational State Transfer) vorbei. REST gilt als leichtgewichtige, skalierbare und schnell erlernbare Alternative zu SOAP, die sich die vorhandene Infrastruktur des WWW zunutze macht. In der Praxis hat aber auch REST seine Schwächen. So ist gutes API-Design häufig eine Herausforderung. Für mobile Anwendungen ist REST zu starr und geht nicht effizient genug mit Bandbreite um.
Im Vortrag werden Stärken und Schwächen von REST aufgezeigt und mit GraphQL eine Alternative speziell für den mobilen Kontext vorgestellt.
Ähnlich wie Crawling analysis to the fullest | J.Giesche & E.Protzel | SEOcampixx 2018 (20)
Präsentation zum Trust Agents (part of Dept) Meetup am 30.10.18 in Berlin. Das Thema lautet "Einstieg ins Data-Driven Marketing" und es werden drei Schwerpunkte - Reporting, Analyse, Personalisierung - behandelt.
Mit Mühe erstellter, spannender Content kommt bei dem Publikum nicht immer mit gleichem Erfolg an. Manchmal wird der Content gar nicht wahrgenommen und erreicht die angestrebte Zielgruppe nicht. Das kann an den fehlenden Marketingaktivitäten oder an der versteckten Positionierung des Contents-Pieces liegen. Wie können Sie die Sichtbarkeit Ihres Contents erhöhen und gleichzeitig die richtige Zielgruppe erreichen?
10 technische SEO Hacks, die du wahrscheinlich noch nicht kennst.
Vortrag des CEO Dominik Wojcik von der Berliner Online-Marketing-Agentur Trust Agents. Präsentiert auf der SEOkomm 2017.
Alles, was man über SEO abseits von Themen wie App-Indexing, AMP und Co wirklich wissen muss. Onpage & Offpage Optimierung einfach erklärt.
Vortrag des CEO Stephan Czysch von der Berliner Online-Marketing-Agentur Trust Agents. Präsentiert auf der Co-Reach 2017.
Welche Informationen liefert Google Webmastern über die Search Console? Wie kann man die Daten einfach über die API exportieren? Wie können Datenlimits im Frontend einfach umgangen werden? Warum stellt Google diese Daten zur Verfügung? Was sagt das über mögliche Rankingfaktoren aus?
Vortrag des CEO Stephan Czysch von der Berliner Online-Marketing-Agentur Trust Agents. Präsentiert auf der OMX 2015.
Was ist der Unterschied zwischen robots.txt und meta robots?
Was ist der Unterschied zwischen Crawling und Indexierung?
Welche Inhalte crawlt Google?
Wie kann das Crawling optimiert werden?
Vortrag von Stephan Czysch zum Thema Logfile-Analysen auf der SEO Campixx 2014.
In der auf der SEOkomm 2012 gehaltenen Präsentation gehen Benedikt Illner und Dominik Wojcik darauf ein, wie man SEO-Prozesse in einem Unternehmen etabliert, diese durch Tools unterstützt und somit den SEO-Erfolg maximiert.
4. WAS IST CRAWLING-BUDGET?
CRAWLING-BEDARF + =CRAWLING-FREQUENZ CRAWLING-BUDGET
https://webmaster-de.googleblog.com/2017/01/was-crawl-budget-fuer-googlebot-bedeutet.html
5. PROBLEME MIT DEM CRAWLING-BUDGET?
„WENN NEUE SEITEN TENDENZIELL AM TAG IHRER
VERÖFFENTLICHUNG GECRAWLT WERDEN, MUSS SICH DER
WEBMASTER NICHT UM DAS CRAWLING-BUDGET KÜMMERN.
AUSSERDEM WIRD EINE WEBSITE MIT WENIGER ALS EIN PAAR
TAUSEND URLS MEISTENS EFFIZIENT GECRAWLT.“
https://webmaster-de.googleblog.com/2017/01/was-crawl-budget-fuer-googlebot-bedeutet.html
6. CRAWLING-ANALYSEN
1 ABRUF WIE DURCH GOOGLE
2 GOOGLE CACHE ANSICHT
3 ROBOTS.TXT
4 SITEMAP-UNTERSUCHUNG
5 CRAWLING-FEHLER
6 SIMULIERTE CRAWLING-ANALYSEN
7 LOGFILE-ANALYSEN
ACCESSIBILITY
GSC-ANALYSE
TOOL-ANALYSE
7. GOOGLE CACHE ANSICHT / ABRUF WIE DURCH GOOGLE
• SICHERSTELLUNG ACCESSIBILITY
• GOOGLE CACHE ANSICHT
• „NUR-TEXT-VERSION“ BZW. „&STRIP=1“ ANHÄNGEN
• ABRUF WIE DURCH GOOGLE ÜBER DIE GOOGLE SEARCH
CONSOLE
8. GOOGLE SEARCH CONSOLE
• GOOGLE SEARCH CONSOLE BIETET VIELE INFORMATIONEN
• SITEMAPS
• ROBOTS.TXT TESTER
• CRAWLING-STATISTIKEN
• CRAWLING-FEHLER
11. SIMULIERTE CRAWLING-ANALYSEN VS. LOGFILE-ANALYSEN
• SIMULATION EINES CRAWLERS
• FINDET NUR INTERN VERLINKTE (HTML-
LINKS) RESSOURCEN
• CRAWLT ALLES IN GLEICHER PRIORITÄT
• CRAWLING-BUDGET ALLOKATION NICHT
ERSICHTLICH
SIMULIERTE CRAWLING-ANALYSEN LOGFILE-ANALYSEN
• „GENAUE“ BEWEGUNG DER CRAWLER
• DARSTELLUNG ALLER AUFGERUFENEN
RESSOURCEN
• UNTERSCHIEDLICHE CRAWL-PRIORITÄTEN
• CRAWLING-BUDGET ALLOKATION LEICHT
ERKENNBAR
12. LOGFILE-ANALYSE & MOBILE FIRST
„I THINK YOU WOULD PROBABLY RECOGNIZE IT IN THE LOG FILES.
IF YOU SEE, IF YOU LOOK NOW PROBABLY SOMETHING LIKE 80%
OF THE CRAWLING IS WITH THE GOOGLEBOT DESKTOP AND
MAYBE 20% IS WITH MOBILE WITH THE SMARTPHONE
GOOGLEBOT. AND PROBABLY THAT WILL SHIFT OVER AND THAT
MOST OF THE CRAWLING WILL BE DONE WITH THE SMARTPHONE
GOOGLEBOT AND LESS CRAWLING WITH THE DESKTOP
GOOGLEBOT. SO IF YOU LIKE REALLY WATCH OUT FOR YOUR LOG
FILES PROBABLY YOU CAN NOTICE THAT FAIRLY OBVIOUSLY.“
- JOHANNES MÜLLER -
13. AUFBEREITUNG LOGFILES
ANATOMIE EINER LOGFILEZEILE BEI ABRUF DURCH GOOGLE (OHNE REFERRER)
66.249.69.127 - - [16/NOV/2014:23:50:29 +0100] "GET /IMAGES/LOGO.JPG HTTP/1.1" 200 24532 "-"
"MOZILLA/5.0 (COMPATIBLE; GOOGLEBOT/2.1; +HTTP://WWW.GOOGLE.COM/BOT.HTML)“
• IP- ODER DNS-ADRESSE DES RECHNERS, DER DIE SEITE AUFGERUFEN HAT
• ZEITPUNKT DES ZUGRIFFS
• BEFEHL DER VOM SERVER VERLANGT WIRD (MEISTENS WIRD MIT DEM BEFEHL GET EINE DATEI
ANGEFORDERT)
• ANGEFORDERTE URL: DATEINAME UND -PFAD (IM BEISPIEL HANDELT ES SICH UM EINE
BILDDATEI)
• ART DES ÜBERTRAGUNGSPROTOKOLLS
• DIE ANTWORT DES SERVERS, HTTP-STATUSCODE (IM BEISPIEL 200: ÜBERTRAGUNG ERFOLGREICH)
• ÜBERTRAGENE BYTES
• BROWSER UND BETRIEBSSYSTEM DES NUTZERS, DER DIE SEITE AUFGERUFEN HAT / USERAGENT
14. AUFBEREITUNG LOGFILES
NOTWENDIGE SCHRITTE ZUR WEITEREN BEARBEITUNG VON LOGFILES
• LOGFILES BEINHALTEN ALLE ZUGRIFFE AUF EINEN SERVER
• ZUR AUSWERTUNG MÜSSEN ZUGRIFFE DURCH SUCHMASCHINEN VORAB
HERAUSGEFILTERT WERDEN
• ERFAHRUNGSGEMÄSS REICHT DIE VORAUSWAHL NACH DER IP-RANGE
66.249.*.* VOM GOOGLEBOT
15. AUFBEREITUNG LOGFILES
AUFBEREITUNG MITTELS WINDOWS CONSOLE
1. PER CD ZUM ENTSPRECHENDEN VERZEICHNIS NAVIGIEREN
2. OPTIONAL: DATEIEN ZUSAMMENFASSEN:
COPY *.[DATEITYP] [NEUE-DATEI.DATEITYP]
3. FINDSTR 66.249.* [DATEIBEZEICHNUNG.DATEITYP] > [NEUE-DATEI.DATEITYP]
16. AUFBEREITUNG LOGFILES
NOTWENDIGE SCHRITTE ZUR WEITEREN BEARBEITUNG IN EXCEL
• ZERLEGEN DER ABFRAGE IN EINZELNE TEILE ZUR VERARBEITUNG MITTELS PIVOT TABLE
• AUSGANGSBASIS SIND DIE NATÜRLICH VORHANDENEN INFORMATIONEN
ZUGRIFFSDATUM UND ZEIT
VOLLSTÄNDIGE ANFRAGE
STATUSCODE
GRÖSSE
USERAGENT
66.249.69.127 - - [16/NOV/2014:23:50:29 +0100] "GET /IMAGES/LOGO.JPG HTTP/1.1" 200 24532 "-"
"MOZILLA/5.0 (COMPATIBLE; GOOGLEBOT/2.1; +HTTP://WWW.GOOGLE.COM/BOT.HTML)“
17. AUFBEREITUNG LOGFILES
NOTWENDIGE SCHRITTE ZUR WEITEREN BEARBEITUNG IN EXCEL
.. DETAILLIERTE ZERLEGUNG IST EMPFEHLENSWERT:
URL OHNE PARAMETER
QUERY STRING
ANZAHL PARAMETER / ERSTER PARAMETER
TOP LEVEL ORDNER
PFAD
PFADTIEFE
…
.. EXTERNE DATEN:
CRAWL-DATEN
BACKLINK-DATEN
TRAFFIC-DATEN
18. AUFBEREITUNG LOGFILES
EXCELFORMELN CHEAT SHEET
URL STRING AUS ANFRAGE ZERLEGEN BESTEHEND AUS
GET /IMAGES/LOGO.JPG HTTP/1.1
FALLS HTTP/1.1 FEHLT MUSS "-13“ ENTFERNT WERDEN
=TEIL([ANFRAGE];5;LÄNGE()-13)
URL =["[DOMAIN]"]&[URLSTRING]
PFAD (SEOTOOLSFOREXCEL) =URLPROPERTY([URL]; "PATH")
PFADTIEFE (SEOTOOLSFOREXCEL) =URLPROPERTY([URL]; "DEPTH")
DATEITYP (SEOTOOLSFOREXCEL) =URLPROPERTY([URL);"FILE")
QUERY STRING =WENNFEHLER((TEIL([URLSTRING];FINDEN("?";[URLSTR
ING])+1;LÄNGE([URLSTRING])));"")
ERSTER PARAMETER =WENNFEHLER((LINKS([QUERYSTRING];FINDEN("=";
[QUERYSTRING];)-1));"")
ANZAHL PARAMETER =WENNFEHLER((LINKS([QUERYSTRING];FINDEN("=";
[QUERYSTRING])-1));"")
URL OHNE PARAMETER =WENNFEHLER((LINKS([URL];FINDEN("?";[URL])-1));D4)
TOPLEVEL ORDNER. FALLS DIE DATEI/RESSOURCE IM
ROOT LIEGT, WIRD „ROOTURL“ AUSGEGEBEN
=WENNFEHLER(LINKS([URLSTRING];FINDEN("/";M4;2));
"ROOTURL")
20. UNSERE 11 TOP-LEARNINGS
1. VORSICHT BEI URL FINGERPRINTING ( BILDER)
2. WAS „AUSSIEHT“ WIE EINE URL WIRD AUCH GECRAWLT!
3. VORSICHT BEI RESSOURCEN, DIE DEN SEITENINHALT NICHT VERÄNDERN!
4. NACH RELAUNCHES LOHNT SICH EINE LOGFILE-ANALYSE ERST RECHT
5. LADEZEITOPTIMIERUNG LOHNT SICH IMMER
6. AUCH NON-HTMLS BEACHTEN (X-ROBOTS-TAG)
21. UNSERE 11 TOP-LEARNINGS
7. 301-WEITERLEITUNGEN MÜSSEN NICHT IMMER DER RICHTIGE WEG
SEIN
8. QUALITY VS. QUANTITY
9. LÖSCHE UNNÖTIGEN BALLAST
10. SEI MUTIG MIT DER ROBOTS.TXT-DATEI
11. KEIN EINSATZ VON CANONICAL-TAG OHNE “NOINDEX,FOLLOW” IM
HTML-HEAD
22. ONPAGE-MONITORING-TOOL MIT GOOGLE TABELLEN
• MONITORING IST ALLES!!
• KOSTENFREIES SEO-MONITORING-TOOL:
• GOOGLE DRIVE TABELLE
• QUELLTEXT UND HTTP-HEADER VON BIS ZU
100 URLS
• ANWENDUNGSFÄLLE:
• ENTSPRICHT DER SEITENTITEL DEM
GEWÜNSCHTEN TEXT?
• ZEIGT DIE CANONICAL-URL WEITERHIN AUF
DIE GEWÜNSCHTE ADRESSE?
• IST DIE PAGINIERUNG VON DER
INDEXIERUNG AUSGESCHLOSSEN?
• USW.
https://www.trustagents.de/unternehmen/tools/onpage-monitoring-tool
23. ONPAGE-MONITORING-TOOL ALS SOFTWARE-LÖSUNG
• EINSATZ EINER SELBST PROGRAMMIERTEN SOFTWARE-LÖSUNG, UM VERÄNDERUNGEN BEI KUNDENPROJEKTEN
SCHNELL ZU ERKENNEN
WER MEHR WISSEN MÖCHTE ODER INTERESSE HAT, KONTAKTIERT UNS EINFACH ☺
24. UNSERE SEO STÄRKEN
SEO MONITORING
ALLES BLEIBT STETS IM BLICK, AUCH AUSSERGEWÖHNLICHE AKTIVITÄTEN
SEO REPORTING
KONTROLLE UND EFFEKTIVITÄT ÜBER ALLE SEO MASSNAHMEN
SEO ALERTING
SOFORTIGE ALAMINERUNG ÜBER KRITISCHE KENNZAHLEN