Diese Präsentation wurde erfolgreich gemeldet.

OnCrawl Webinar - Comment optimiser son budget de crawl ?

0

Teilen

Wird geladen in …3
×
1 von 27
1 von 27

OnCrawl Webinar - Comment optimiser son budget de crawl ?

0

Teilen

Herunterladen, um offline zu lesen

Présentation du concept de budget de crawl, des bonnes pratiques pour l'optimiser, d'erreurs à éviter. Des exemples pratiques viendront illustrer ce concept récemment validé par Google.

Présentation du concept de budget de crawl, des bonnes pratiques pour l'optimiser, d'erreurs à éviter. Des exemples pratiques viendront illustrer ce concept récemment validé par Google.

Weitere Verwandte Inhalte

Ähnliche Bücher

Kostenlos mit einer 14-tägigen Testversion von Scribd

Alle anzeigen

Ähnliche Hörbücher

Kostenlos mit einer 14-tägigen Testversion von Scribd

Alle anzeigen

OnCrawl Webinar - Comment optimiser son budget de crawl ?

  1. 1. Webinaire #oncrawlwebinar Comment optimiser son budget de crawl pour le SEO Par Erlé Alberton, Customer Success Manager
  2. 2. Webinar #oncrawlwebinar J’adore quand Google dépense un max de budget sur votre site ! ERLE ALBERTON CUSTOMER SUcCESS manager 10 ans de dev / 5 ans de SEO dont 2 ans en tant que responsable SEO des boutiques en ligne Orange et Sosh spécialiste schema.org seo monk ONCRAWL TRAinER customer climax
  3. 3. Webinar #oncrawlwebinar • Introduction • Budget de crawl Google • Constat et analyse d’OnCrawl • Optimisations points par points • Q&A Programme
  4. 4. Webinar #oncrawlwebinar Ce que dit Google sur le « Crawl Budget » Si vous observez que les nouvelles pages sont généralement explorées le jour même de leur publication, alors vous n'avez pas vraiment à vous préoccuper du budget d'exploration […] si un site dispose de moins de quelques milliers d'URL, il sera exploré correctement la plupart du temps […] nous ne disposons pas d'un terme unique pour décrire tout ce que ce terme semble signifier en externe https://webmasters.googleblog.com/2017/01/what-crawl-budget-means-for- googlebot.html
  5. 5. Webinar #oncrawlwebinar Ce que dit Google sur le « Crawl Budget » Google cherche la limite de budget à atteindre ! On constate que lorsque le temps de chargement explose, Google coupe son budget Google affecte un score d’importance à chaque page pour savoir s’il doit la crawler Une mauvaise architecture (système, response code, maillage), les contenus faibles et/ou dupliqués, les spider traps affectent le budget de crawl
  6. 6. Webinar #oncrawlwebinar Le Crawl de Google est un ensemble d’étapes simples qu’il opère de manière récursive pour chaque site Son objectif est de remplir son index de façon exhaustive et le plus précisément possible Chaque crawl est avant tout un dépilage d’une liste d’url à aller fetcher pour vérifier leur mise à jour Cette liste d’url est conçue à l’avance et doit être optimisée pour ne pas fetcher des documents de moindre importance Comment fonctionne le crawl de Google
  7. 7. Webinar #oncrawlwebinar OnCrawl Knowledge Base…
  8. 8. Webinar #oncrawlwebinar Constat : si Google optimise c’est qu’il y a un sujet Le budget de crawl dépend : De la capacité de votre site à répondre rapidement De la « sanity » du site – 40x, 50x, 30x De la richesse des contenus – sémantique et exhaustivité De la diversité des ancres De la popularité de vos pages – externe/interne De facteurs purement « optimisants » - simplifier le crawl
  9. 9. Webinar #oncrawlwebinar Les composants importants pour Google Page Importance Change managment & Freshness
  10. 10. Webinar #oncrawlwebinar Page Importance La notion de « Page Importance » n’est pas le Page Rank • Localisation de la page dans le site – a profondeur sur le taux de crawl • Page Rank : TF/CF de la page - Majestic • Le Page Rank interne – InRank OnCrawl • Type de document : PDF, HTML, TXT • L’inclusion dans le sitemap.xml • Le nb de liens internes • La qualité/l’importance des ancres • Contenu de qualité : nombre de mots, peu de near duplicate • L’importance de la page mère L’analyse croisée du crawl OnCrawl avec vos logs permet de suivre ces données en continu
  11. 11. Webinar #oncrawlwebinar Comment planifier les urls importantes à Crawler La notion de « Page Importance » au cœur des brevets des brevets • Localisation de la page dans le site – a profondeur sur le taux de crawl • Page Rank : TF/CF de la page • Le Page Rank interne – nb de liens interne et qualité des ancres • Type de document : PDF, HTML, TXT • L’inclusion dans le sitemap.xml • Freshness – taux de mise à jour • Contenu de qualité : nombre de mots, peu de « near duplicate » • L’importance de la page mère URL scheduling : Quelles pages Google a envie de visiter et à quelle fréquence ?
  12. 12. Webinar #oncrawlwebinar Budget de Crawl Google • 100% des sites déclarés dans GSC ont des données d’exploration • Suivre son « Crawl Behavior » grâce à l’analyse de ses logs permet de détecter rapidement une anomalie dans le comportement du bot • Un mauvais maillage interne - pagination, facette, pages orphelines, spider trap - peut empêcher Google d’explorer les bonnes pages Le budget de Crawl est en relation avec le ranking
  13. 13. Webinar #oncrawlwebinar Page Speed first Google test en permanence la capacité d’un site à répondre rapidement, la qualité de l’architecture et du code impact fortement le crédit accordé par Google A l’heure des révolutions mobile c’est un facteur essentiel à l’évaluation de la qualité d’un site : sa capacité à répondre rapidement – surtout pour les mobiles et l’index mobile first
  14. 14. Webinar #oncrawlwebinar Le tps de chargement C’est le premier facteur d’attribution de budget de crawl ! Serveur : éviter les redirections / autoriser la compression / améliorer les temps de réponse Front : serveur / exploiter la mise en cache navigateur / réduire la taille des ressources (optimiser les images, utiliser des CDN / afficher en priorité les contenus visibles (lazy loading) / supprimer les JS qui bloquent l’affichage / utiliser les scripts asynchrones Source : https://developers.google.com/speed/docs/insights/rules
  15. 15. Webinar #oncrawlwebinar Vérifier les « status code » renvoyés aux robots Google afin de s’assurer que le SI est propre Suivre leur évolution dans le temps permet de s’assurer que les mises à jour du code sont SEO Friendly Combien de budget, Google dépense-t-il sur mes ressources (css, img, js) Est-il envisageable d’optimiser ce budget (304, réduction du poids des ressources) Perte de qualité = perte d’amour = perte de budget
  16. 16. Webinar #oncrawlwebinar Plus un contenu est unique et riche plus le budget Une page importante a un contenu important : augmenter la taille des articles
  17. 17. Webinar #oncrawlwebinar Warning Canonical et Duplicate content La gestion des canonical peut devenir critique pour les sites avec des facettes, des liens externes avec queryString, la gestion du HTTPS Google dépensera 2x plus de budget lorsque deux pages similaires ne pointent pas vers la même URL canonique La gestion du contenu en « near duplicate » + les canonical devient un aspect important de l’optimisation du budget de crawl
  18. 18. Webinar #oncrawlwebinar Maillage interne et répartition du InRank Les pages qui génèrent des visites sont les pages les plus « hautes » dans l’architecture Plus les pages sont profondes, moins Google les visites !
  19. 19. Webinar #oncrawlwebinar Mes pages importantes sont elles bien placées ? Les pages importantes (ROI) sont forcément accessibles en quelques clicks depuis la home page
  20. 20. Webinar #oncrawlwebinar Google hit toutes les pages qu’il connait Comparer les pages : dans la structure vs crawlées vs actives • résoudre le problème des pages orphelines pour lesquelles Google dépense du budget inutilement • corriger l’architecture du site pour renvoyer des liens vers des pages Actives mais hors structure
  21. 21. Webinar #oncrawlwebinar Les erreurs à ne pas commettre • robots.txt en 404 !! • sitemap.xml & sitemap.html out of date • erreurs 50x / 40x / soft 404 • avoir chaines de redirections • canonicals errors • contenu dupliqué (footer) / near duplicate / HTTP vs HTTPS • temps de réponse trop long • poids des pages trop important • erreurs AMP • mauvais maillage interne + Rel=nofollow • utiliser le JS sans solution alternative https://support.google.com/webmasters/answer/35120?hl=fr
  22. 22. Webinar #oncrawlwebinar Conclusions Pour Optimiser son budget de crawl il faut : Connaitre ses pages importantes, connaitre les réactions de Google Améliorer ses temps de chargement Optimiser son maillage interne Corriger les pages orphelines Augmenter le volume de texte des pages importantes Mettre à jour au maximum les pages importantes – freshness Réduire les contenus faibles et dupliqués Optimiser les canonical, les images, le poids des ressources Eviter les chaines de redirection Suivre ses logs et réagir en fonction des anomalies
  23. 23. Webinar #oncrawlwebinar Conclusions Pour Optimiser son budget de crawl il faut suivre précisément le crawl de Google Connaitre ses pages importantes, connaitre les réactions de Google Améliorer ses temps de chargement Optimiser son maillage interne Corriger les pages orphelines Augmenter le volume de texte des pages importantes Mettre à jour au maximum les pages importantes – freshness Réduire les contenus faibles et dupliqués Optimiser les canonical, les images, le poids des ressources Eviter les chaines de redirection Suivre ses logs et réagir en fonction des anomalies
  24. 24. Webinar #oncrawlwebinar Conclusions Pour Optimiser son budget de crawl il faut bien gérer sa migration HTTPS (HTTP2)
  25. 25. Webinar #oncrawlwebinar
  26. 26. Webinar #oncrawlwebinar Des questions ?
  27. 27. MERCI ! Votre contact hello@oncrawl.com Follow us : @Oncrawl

×