Presentazione sul SEO fatta in ARMAH DIGITAL AGENCY, il giorno 20/01/2014.
Introduzione generica al SEO e linee guida specifiche a seguito del nuovo algoritmo Hummingbird
SEO (Search Engine Optimization) Indicizzazione nei motori di ricerca
Come fare SEO nel 2014
1. Come fare SEO nel 2014
RELEVANCE, INDEXING, CRAWLING AND… MORE RELEVANCE
A CURA DI MARIA CRISTINA
COZZOLINO
SOCIOLOGA
TECNOLOGA
2. (web)
INDEXING
Il web indexing è un processo che consiste nell’ assegnare
keywords o frasi a pagine web o interi siti tramite campi meta-
tag, in modo che le possano essere sottoposti al processo di IR di
un motore di ricerca. Questo può più o meno coinvolgere una
lista ristretta di keywords in un teasauro.
3. (ALGORITMO DI)
CRAWLING
Un Web crawler è un algoritmo che scannerizza sistematicamente il
web per effettuarne l’indicizzazione.
Ogni motore di ricerca ha il suo algoritmo di Crawling.
I Web crawlers possono copiare le pagine per poi indicizzarle in un
secondo tempo .
I Crawlers possono validare gli hyperlinks e il codice HTML e
essere anche usati per il web scraping.
4. (TOPIC AND CONTENT)
RELEVANCE
Il concetto di rilevanza di un sito web è mutuato direttamente
dalla linguistica.
Il Latent Semantic Indexing, controlla la presenza e la
densità dei termini rilevanti e la rilevanza semantica rispetto al
contesto.
L’attinenza di un documento ad una interrogazione (query) è
soggettiva e dipende da appartenenza ad un campo
semantico, puntualità, autorità e vicinanza agli obbiettivi
dell’utente ed al suo utilizzo dell’informazione
6. CERCARE IN RETE
Il linguaggio naturale è il focus dei motori di ricerca nel 2014
Facebook ha introdotto Facebook Graph Search (Unicorn), un
sistema in cui al momento della ricerca è visualizzato un unico
risultato d’insieme, basato sulla tue connessioni con le persone, i
posti e le cose , e su cosa è possibile vedere su Facebook.
Gli amici, gli interessi, e le altre connessioni incidono sull’ordine dei
risultati. Le scelte di privacy delle persone li influenzano
ulteriormente.
7. FACEBOOK GRAPH
Graph search supporta le ricerche per keyword.
Quando si comincia una ricerca (ex.John San Francisco or Photos Hawaii
friends) ci viene suggerito people, photos, Pages and apps che hanno a che
fare con le keywords.
The graph è un database che contiene informazioni sugli utenti, le pagine, e
altre cose che riguardano l’universo Facebook e le relazioni tra queste cose.
Ogni entità, o "nodo,"è identificata da un numero univoco chiamato
fbid (Facebook ID)— ha un set di attributi, o metadata, associatevi.
Le relazioni tra i nodi, chiamate "edges," contengono i loro metadati per
descrivere il tipo di relazioni tra loro.
9. SATORI GRAPH
- Links alle TED Talks quando si cerca “return the talks”
- Audio di discorsi famosi e inni nazionali
- Collegamenti ai corsi online di università e classifiche
- Spiegazioni concetti scientifici e snapshots di eventi storici
- Relazioni tra posti e persone
- Informazioni sugli animali
- Q&A in linguaggio naturale
- Modi veloci per scoprire e scaricare apps e software
11. NATURAL SEARCH
QUERIES
Il nuovo algoritmo di Google ,“Hummingbird”, mantiene i tradizionali criteri
di posizionamento come il PageRank, ponendo enfasi sulle natural search
queries.
Il sistema precedente dipendeva dalle searching queries-based
keywords: le keyword erano il focus maggiore mentre poco considerate
erano le cosiddette stop words.
HUMMINGBIRD- IL NUOVO ALGORITMO
12. Esempi di Form-Based Queries
Chi è?x (Dove x è un’entità di tipo “persona”)
Cos’è ?x (Dove x è un’entità di tipo “posto” o “cosa”)
Quando?x è accaduto? (Dove ?x è un’entità di tipo “evento”)
Where did ?x happen? (Dove x è di tipo“evento”)
Where is ?x (Dove x è un’entità di tipo “posto” o “cosa”)
HUMMINGBIRD- IL NUOVO ALGORITMO
NATURAL SEARCH QUERIES
13. Processo di IR su Form-Based Queries
- Analizza la grammatica della query
- Identifica le forme delle intenzioni degli utenti
- Identifica le entità coinvolte
- Attribuisce sinonimi
- Capisce cosa sta cercando l’utente(refined intent)
- Determina quali sono le entità per il retrival
- Determina quali sono le proprietà delle entità
- Definisce cosa mostrare all’utente in maniera
device essere attrattivo e coinvolgente per l’utente)
HUMMINGBIRD- IL NUOVO ALGORITMO
NATURAL SEARCH QUERIES
14. Essenzialmente, i webmaster non devono fare
nulla.
È qualcosa che noi abbiamo fatto per avere
maggiore comprensione delle queries e
portare più traffico on target sul tuo sito.
Quindi non devi apportare nessun
cambiamento al tuo sito.
- John Mueller,Google engennier
HUMMINGBIRD- IL NUOVO ALGORITMO
15. QUEL CHE NON DICE IL
SIG.JOHN MULLER
Hummingbird
16. Il nuovo algoritmo di Google “Hummingbird,” mantiene i
tradizionali criteri di posizionamento presenti in
algoritmi precedenti come il PageRank. La cosa che
cosa che “hummingbird rende differente è la sua enfasi
sulle natural search queries.
17. Quel che non dice il sig. John Muller
Caffeine, Panda &
Penguin
ALGORITMI PRECEDENTI
18. QUEL CHE NON DICE IL SIGNOR J.MUELLER-ALGORITMI PRECEDENTI
Il vecchio indice era strutturato su diversi livelli ed
ognuno di essi veniva aggiornato ad un ritmo differente
dagli altri. Con Caffeine invece, i contenuti presenti sul
Web vengono suddivisi in piccole porzioni che vengono
analizzate di continuo. Quando vengono scoperte nuove
pagine, esse vengono aggiunte direttamente all’indice, in
modo da renderle subito disponibili agli utenti.
Ogni secondo Caffeine analizza centinaia di migliaia di
pagine contemporaneamente e quotidianamente vengono
aggiunti centinaia di migliaia di Gb al suo database
19. Google Panda penalizza i siti con
scarso contenuto di qualità,
concentrati più a far soldi che a
produrre informazioni utili.
QUEL CHE NON DICE IL SIGNOR J.MUELLER-ALGORITMI PRECEDENTI
20. Google Penguin distrugge i link innaturali e
manipolativi (unnatural, manipulative inbound
link profiles) :
Provengono da siti di scarsa qualità, non sono
rilevanti per l’argomento o per la nicchia di
business, sono pagati, pieni di parole chiave e
con anchor text sovraottimizzato (exact-match
anchor text)
QUEL CHE NON DICE IL SIGNOR J.MUELLER-ALGORITMI PRECEDENTI
21. Google ha gradi di trust e distrust
che indirizzano il clawler.
In base a questi classifica i siti
come highly credible o spam site.
Si basano su Exact Match Domain
names
QUEL CHE NON DICE IL SIGNOR J.MUELLER-ALGORITMI PRECEDENTI
25. STRATEGIA SEO
NO alle tecniche di black-hat
NO alle attività di acquisto di link in massa, spamming in directory di bassa
qualità con I tuoi link, o pagare un interno per lasciare centinaia di
commenti su blog.
NO al link building manipolativo di pagine interne.
Non inserire link in contenuto irrilevante: fare Link-building semplicemente
inserendo link in contenuto irrilevante non serve a nulla, contributi di
contenuti ad alta qualità funzionano meglio nel lungo periodo.- Kelsey
Meyer, Contributor Weekly
GOOGLE DICE NO
26. NO Links a siti clonati e siti spam rompono la fiducia.( Google’s quality
guidelines – basic principles)
Non usare tecniche metriche datate come il PageRank [Pablo Palatnik,
ShadesDaddy.com]
È impossibile garantire un certo numero di link in una strategia a lungo
termine[ Andrew Saladino, Just Bath Vanities] Non c’è una maniera facile
e/o veloce per costruire link, ma solo una solida logica : costruire link
artificiali è un metodo delegittimato: [Danny Wong, Blank Label]
STRATEGIA SEO
GOOGLE DICE NO
27. Evitare trucchi per arrivare alti nelle SERP.
La domanda da farsi è, “Questo risponde al bisogno dei miei utenti?
Lo farei se non esistessero i motori di ricerca?”
Non partecipare in schemi di link precostituiti.
I dettagli dei nomi di dominio rivelano la trust
I nomi di dominio che sono stati registrati dalla stessa entità: se l’entità
ha siti spam viene declassata per la trust.
STRATEGIA SEO – GOOGLE DICE NO
RISPETTARE EMD
28. I link editoriali non si comprano, non si chiedono e non si scambiano.
I link editoriali sono quelli più performanti per il SEO. Loren Baker of Search
Engine Journal dice: “è la vecchia filosofia push/pull, se le persone linkano con
l’intenzione di premiare o citare il contenuto originale allora il sito avrà più trust.
Se invece si linka se stessi, pagando gli altri e promuovendo il proprio contenuto
su siti quali quelli di article distribution, questi link non aiuteranno molto”.
STRATEGIA SEO – GOOGLE DICE NO
RISPETTARE EMD
30. Domain Age Keyword appears in top level domain
Keyword as first word in demain Domain registration lenght
Keyword in subdomain name
Domain history
Exact match
Publis VS.private whois Penalized whois owner
D o m a i n
F a c t o r s
31. Keyword in title tag Title tag starts with keyword Keyword in description tag
Keyword appears in H1 tag Content lenght Keyword density
Latent semantic indexing keyword in content (LSI) Page loading speed via html
Duplicate content Rel-Canonican Page loading speed via Chrome Image optimization
Recency of content updates Magnitude of content updates
Historical updates page updates
Keyword prominence Keyword in H2, H3 tags
Keyword word order Outbound link quality
Outbound link theme Grammar and spelling
Syndicated content Helpful supplementary content Number of outbound link Multimedia
Number of internal link pointing to page Quality of internal link pointing to page
Broken links Reading level Affiliate links HTML errors / WC£ validation
Page host’s domain authority Page’s pageranks Url lenght Url path Human editors
Page category Wordpress tag Keyword in url Url string Reference and sources
Bullets and numbered lists Priority of page in sitemap
Too many outbound links Quantity of other keyword page rankes for Page age
User friendly layout Parked domains
P a g e L e v e l F a c
32. S i t e L e v e l
F a c t o r s
Content provides value e unique insight Contact use page
Domain trust/trustrank Site architecture
Site updates Number of pages
Precence of sitemap
Site uptime
Server of location
SSL certificate (ecommerce sites)
Termes of service and privacy pages
Duplicate content on-site Bradcrumb navigation
Mobile optimized Youtube Site usability User reviews/site
reputation Use of google analytics and google webmaster
tools User rewievs reputation/ site reputation
33. Linking domain age #Of linking root domain #Of links from separate c-class IPS #Of linking
pages Alt tag ( for image links) Links from .edu or .gov domains Pr of linking page Authority of
linking domain
Links from competitors Social shares of reffering page
Link to homepage domain that page sits on Guests post Nofollow link Diversity of link types
Contextual link
Sponsored link or other words around links
Excessive 301redirects to page
Backlink anchor text
Internal link anchor text Link title attribute
Country tld of referreding domain
Link location in content Link location on page Linking domain relevancy
Page level relevancy Test around link sentiment Keyword in title
Positive link velocity Negative link velocity Links from HUB pages Link from authority sites
Linked to as wikipedia source Co – occurences Braklink age Link from real sites VS.splogs
Natural link profile Reciprocal links
User generated content links Links from 301
Schema.org microformat Dmoz listed Number of outbound links on page Forum profile links
Word count of linking content
Quality of linking content Sitewide links
B r e a k l i n k
F a c t o r s
34. Organic click througt rate for a keyword
Organic CTR for all keywords
Bounce rate
Direct traffic
Repeat traffic
Blocked sites
Chrome bookmarks
Google toolbar data
Number of comments
Time on site
U s e r
i n t e r a c t i o n
35. Query deserves freshness Query deserves diversity
User browsing history User search history
Geo targeting Safe search
Google + circles
DMCA complaints
Domain diversity
Transactional searches
Local searches
Google new box
Big brand preference Shopping results
Image results Single site results for brands
S p e c i a l a l g o r i
r u l e s
36. Number of tweets Authority of twitter user accounts
Number of facebook likes Facebook share
Authority of facebook user accounts
Pinterest pint
Votes on social sharing sites
Number of google +1S
Authority of google + user account Verified google+authorship
S o c i a l s i g n s
37. Brand name anchor text
Branded searches
Site has facebook page and links
Site has twitter profile with followers
Official linkedin company page
Employees listed at linkedin
Legitimacy of social media account
Brand mentions on news sites
Co – citations
Number of RSS subscribes
Brick and mortar location with google + local listing
Website is tax payng business
B r a n d s i g n a l
38. Panda penality
Links to bad neighborhoods
Redirects
Popups or distracting ads
Site over optimization
Pege over optimazation
Ads above the fold
Hiding affilate links
Affiliate sites
Autogenerated content
Excess pagerank sculpting
IP address flagged as spam
Meta tag spamming
O n s i t e w e b s p a
f a c t o r
39. Unnatural influx of links Penguin penality
Link profile with high of low quality links
Linking domain relevancy
Unnatural links warning
Links from the same class C IP
Poison anchor text
Manual penality
Selling links
Google sandbox
Google dance disavow tool
O f f p a g e w e b s p
f a c t o r
40. Fase di ricerca – Contenuti – Esperienza del sito –
Motivazione e Conversione – Acquisto (in un secondo
Definire lo Unique Selling Point
Capire le metriche - Target di provenienza-
Geolocalizzazione - Dispositivi utilizzati - Potenziale di
contenuti -Aumento del refarrel e dei clienti abituali
Conoscere le parole chiave e i target dei competitor -Siti
che hanno link del mio concorrente- Target a cui si è
social media
STRATEGIA SEO
FASI
41. Fai una lista delle caratteristiche e i benefit unici del tuo
prodotto o servizio. Fai una ricerca su Google e compara le
tue caratteristiche e benefit con quelle dei tuoi concorrenti
benefit che ti contraddistinguono.
Quale specifico bisogno emozionale è soddisfatto dal tuo
prodotto o servizio? Pensa dalla prospettiva del cliente
Identifica aspetti del tuo prodotto o servizio che i tuoi
concorrenti non possono imitare. Evidenzia nella lista
qualsiasi cosa che non possa essere facilmente duplicato,
Crea frasi sul tuo prodotto unico che siano brevi, chiare e e
domanda «Qual è il valore per il cliente?» e STATE IT? . Sii
sicuro che sia facile da capire e da comunicare ai clienti.
STRATEGIA SEO – FASI
DETERMINARE USP
42. Le agenzie di marketing devono fare marketing robusto : quelli che
dicono di vendere servizi di link building dovrebbero essere usciti fuori di
mercato un paio di anni fa.[ Roger Bryan, ROI Marketing Department]
Non esistono soluzioni veloci e immediate. Il miglior modo per creare link
è in maniera organica (ad es. Commentando un articolo con il link al
proprio sito). Il contenuto è molto importante per il SEO e il link-building.
Una buona parte di contenuto è condiviso sui social media e
possibilmente richiamato da altri siti, che inseriscono organicamente link
di risposta al tuo sito. Bisogna avere relazioni strette e organiche con
blogger e siti di PR. [Andy Karuza, Brandbuddee]
STRATEGIA SEO
TO DO
43. Seguire gli stakeholder: i siti «influential» e che hanno autorità nella
nicchia del cliente per costruire link naturali e rilevanti. [Pablo Palatnik,
ShadesDaddy.com]
Il cliente deve partecipare alla strategia SEO e conoscerne le tattiche
prima di metterci soldi[Joe Apfelbaum, Ajax Union]
E’ importante avere una case history e comunicare il numero di clienti
attivi: Company Legitimacy.- Andrew Schrage, Money Crashers Personal
Finance
Il Contenuto di qualità è legato a fonti credibili per l’informazione [John
Hall, Influence & Co.]
STRATEGIA SEO
TO DO
44. Links dagli highly trusted editorial sites come yahoo, wikipedia,
nytimes.com, etc. e da :
Siti di associazioni di professionisti
Siti editoriali del tuo business
Blog rilevanti
Siti di brand conosciuti che sono rilevanti per l’argomento
Siti che vendono notizie (local newspaper/radio/tv)
SEO E LINK EDITORIALI
STRATEGIA SEO – TO DO
45. Markup semantico.
<title> <meta>, sono dei grandi strumenti per
ricerca (schema.org).
Pensa API. Procura informazioni aggiuntive che possano
essere usate in sistemi come Knowledge Graph. Se ha
strutturati ai motori di ricerca tramite data feed (o API),
informazioni sono coerenti con alter sul tuo sito, è un
favore.
User oriented Sii sicuro che il tuo sito rappresenti bene le
tue entità target.
Uso dei tag “rel = publisher / rel = author.” Per
aumentare la trust, la reputazione e la brand awareness.
Personalizzazioni e segnali impliciti per le comunità
target.
Form-Based (Natural)Queries
STRATEGIA SEO – TO
DO
46. Costruire il proprio dominio informativo – creare,
attraverso tecniche di Query Espansion, il tesauro di
collega semanticamente ai termini che vogliamo
vogliamo esprimere.
Utilizzo di sinonimi riconoscibili - Per alcune parole chiave
considerate rilevanti utilizzare anche i sinonimi
Utilizzo degli acronimi - Utilizzare gli acronimi,
verificando che siano riconosciuti da Big G.
Analisi coerenza semantica - Verificare la rilevanza
semantica con dei tool Online che generano un punteggio
termine da ottimizzare in funzione del testo della pagina
Il testo ovviamente non è la sola cosa da considerare per la
importante considerare altri elementi che nel tempo
importanza ossia: HTML5, Microdata, Linked Data e Rich
STRATEGIA SEO
SCRIVERE SEMANTIC SEO COMPLIANT
47. Flesch Reading Ease Test è un test per la leggibilità,
Il Flesch reading Easy Test non è diffuso in Italia, unico esempio Indice
Leggibilità Testo
La formula:
206.835 – 1.015 (totale parole/totale frasi) – 84.6 (totale sillabe/totale
sillabe/totale parole)
Ovvero:
Troppe parole in una frase = meno leggibile
Troppe sillabe in una parola = meno leggibile
Poche parole in una frase = più leggibile
Poche sillabe in una parola = più leggibile
STRATEGIA SEO
SEOVSLEGGIBILITA’
49. Sitografiah t t p : / / w w w . u n i r o m a 2 . i t / d i d a t t i c a / W m I R / d e p o s i t o / 1 0 1 _ i n t r o _ i r . p d f
h t t p : / / w w w . d a z e i n f o . c o m / 2 0 1 3 / 0 9 / 2 6 / g o o g l e - i n c - h u m m i n g b i r d - s e a r c h - a l g o r i t h m /
h t t p : / / w w w . s t u d i o s a m o . i t / s e o / b l a c k - h a t - s e o - i l - l a t o - o s c u r o - d e l - p o s i z i o n a m e n t o - s u i - m o t o r i - d i -
r i c e r c a / # L r e 9 l 2 Q C g G f Y 0 k D 0 . 9 9
O p e n F o r u m , S u s a n L . , S m a l l B u s i n e s s E x p e r t a n d B u s i n e s s C a t a l y s t , A L K A M A E , A p r i l 2 0 , 2 0 1 1
S i x T r u s t I n d i c a t o r s T h a t G o o g l e S n i f f s O u t - E x p l o i t O n l i n e D e m a n d
h t t p : / / w w w . c a p t u r e c o m m e r c e . c o m / b l o g / o r g a n i c - s e o / s i x - t r u s t - i n d i c a t o r s - t h a t - g o o g l e - s n i f f s -
o u t / # i x z z 2 r 9 1 W I S I Q
h t t p : / / w w w . s e a r c h e n g i n e j o u r n a l . c o m / r e a d a b i l i t y - v e r s u s - r o b o t - f l e s c h - r e a d i n g -
t e s t / 8 5 2 9 3 / # U T I K Y b j M i m 5 Y g 3 X E . 9 9
F o r b e s , R o b e r t H o f f , 2 6 / 0 9 / 2 0 1 3 , M e e t H u m m i n g b i r d : G o o g l e J u s t R e v a m p e d S e a r c h T o A n s w e r Y o u r L o n g
Q u e s t i o n s B e t t e r
1 2 Q u e s t i o n s t o A s k B e f o r e H i r i n g a n S E O E x p e r t , S c o t t G e r b e r O c t 2 2 , 2 0 1 3 , M a s h a b l e
B i n g ’ s K n o w l e d g e R e p o s i t o r y , S a t o r i , A d d s M o r e I n t e r a c t i v e C o n t e n t , D e c 1 2 , 2 0 1 3 a t 1 : 1 8 p m E T b y B a r r y
S c h w a r t z
h t t p : / / w w w . y o u t u b e . c o m / w a t c h ? v = V x 4 E T K N O p 1 o
h t t p : / / s e a r c h e n g i n e l a n d . c o m / g o o g l e - h u m m i n g b i r d - w h e n - e v o l u t i o n a r y - b e c o m e s - r e v o l u t i o n a r y - 1 7 3 7 4 0
h t t p : / / i n b o u n d . a n c h o r s t l . c o m / w p - c o n t e n t / u p l o a d s / 2 0 1 3 / 0 2 / g o o g l e - p a n d a - a l g o r i t h m - 2 0 1 1 . j p g
h t t p : / / 3 . b p . b l o g s p o t . c o m / - C u R r P 7 h k d M c / U a O P v g H v X I I / A A A A A A A A D E A / p 9 2 k m t d e r c w / s 6 4 0 / g o o g l e - p e n g u i n - 2 0 -
u p d a t e - - h o w - c a n - w e - g e t - s a f e - f r o m - t h i s . j p g
h t t p : / / b l o g . i n t e r a c t . i t / s e m a n t i c - s e o - p o s i z i o n a m e n t o /
h t t p : / / h o 9 o d 3 5 y v s 0 5 e j q n . z i p p y k i d . n e t d n a - c d n . c o m / w p - c o n t e n t / u p l o a d s / 2 0 1 3 / 0 5 / I n f o g r a p h i c - G o o g l e s - 2 0 0 -
R a n k i n g - F a c t o r s - 6 3 7 x 1 6 0 1 4 . j p g
h t t p : / / h o 9 o d 3 5 y v s 0 5 e j q n . z i p p y k i d . n e t d n a - c d n . c o m / w p - c o n t e n t / u p l o a d s / 2 0 1 3 / 1 0 / H o w - t o - T h r i l l - G o o g l e -
H u m m i n g b i r d . j p g
h t t p : / / s e o s t r a t e g y - l i b r o . c o m / w p - c o n t e n t / u p l o a d s / 2 0 1 3 / 0 4 / s e o - c h e c k l i s t - c o m p l e t e - g u i d e - i n f o g r a p h i c 1 . j p g
h t t p : / / s t a t i c . g o o g l e u s e r c o n t e n t . c o m / m e d i a / w w w . g o o g l e . c o m / i t / / i n t l / i t / w e b m a s t e r s / d o c s / s e a r c h -
e n g i n e - o p t i m i z a t i o n - s t a r t e r - g u i d e - i t . p d f
Editor's Notes
. Attraverso lo Stemming individua sinonimi e parole che rappresentano lo stesso termine o concetto, creando dei sottoinsiemi di termini correlati ad un argomento che lo definiscono ulteriormente. Incrociandoli con le ricerche degli utenti, individua così il documento pertinente per una keyword.
La attinenza di un documento ad una interrogazione (query) e’ soggettiva e dipende
da:
– appartenenza ad un campo semantico(soggetto)
– puntualità (essere recente ed al momento giusto)
– autorità (provenienza sicura)
– vicinanza agli obbiettivi dell’utente ed al suo utilizzo dell’informazione