O documento explica como as máquinas de busca na internet funcionam, desde seu surgimento até os dias atuais. Descreve a evolução das máquinas de busca, os tipos existentes, como o Google indexa e classifica conteúdo e técnicas de otimização para mecanismos de busca.
2. 1. Introdução
2. Conceito
3. Evolução
4. Tipos de Máquinas de Busca
5. Como funciona?
6. Google
7. Relevância
8. SEO
9. Meta tags
10. "Burlando" os resultados
11. Conclusão
12. Perguntas sobre o tema
13. Referências
Sumário
3. Com a quantidade de informação disponível hoje na
Web, seria muito difícil acharmos exatamente o conteúdo
que procuramos com facilidade.
Para nos auxiliar nessa tarefa, foram criadas as
máquinas de busca da web.
Nesta apresentação mostraremos o que são as
máquinas de busca, como evoluiram e como elas
funcionam.
Introdução
4. ● Ferramenta criada com objetivo de busca de
conteúdos armazenados na Web (World Wide Web),
dentro de uma rede corporativa ou de um computador
pessoal
● Permite que o utilizador solicite o conteúdo a partir de
um critério específico, geralmente palavras chaves, e
retorna com resultados relevantes a tal critério
Conceito
5. ● Surgiram no século XX,
● A primeira máquina de busca, chamada Archie, foi
criada para indexar arquivos na Internet
● Após o Archie e a criação da Web, vários surgiram:
○ Wanderer; Veronica; WebCrawler; AltaVista (muito
utilizado); Lycos; Yahoo (navegação por diretórios);
Google (PageRank); Bing
● Os primeiros motores de buscas as buscas eram feitas
por categorias
● Inicialmente, Os Webmasters enviavam as suas URLs
para as máquinas de busca
● Não eram possíveis buscar imagens, por exemplo
Evolução
6. Os principais são:
● Baseadas em Crawlers (ou "Spiders")
○ São totalmente automáticas
○ Não possuem hierarquia
○ Resultados específicos
● Diretórios
○ Possuem hierarquia
○ São analisados por pessoas, que organizam o
conteúdo por categorias
○ Resultados genéricos
Tipos de Máquinas de busca
7. Baseadas em Crawlers:
1. Varrem a web
2. Indexam o conteúdo
3. Classifica o conteúdo
4. Exibe os resultados
Como funcionam?
8. Varrendo a Web
● Spiders/Crawlers
● Caminham entre os links
● Armazenam as páginas
Como funcionam?
9. Indexação
● Catálogo de páginas
● Lê/Descompacta/Análisa
● Armazena as informações importantes
Como funcionam?
10. Classificação do conteúdo
● Faz a ordenação de todo o conteúdo indexado pela sua
relevância.
Como funcionam?
11. Exibição do resultados
● Lista para o usuário os resultados mais relevantes para
a busca feita.
● Exibe informações como título, breve descrição e link.
Como funcionam?
13. ● Criada em 1998, por Larry Page e Sergey Brin
● A maior ferramenta de busca atualmente
Características:
● Utiliza "spiders"
● Busca por imagem
● Correção ortográfica
● Google Instant
○ Resultados
● Qualidade dos resultados: relevância
○ Como calcular?
Google
15. Relevância
PageRank
● Criado por Sergey Brin e Larry Page
● Mede a importância da página através dos links que
apontam para ela e do quão importante esses links
são.
● Escala de 0 a 10.
18. Além do PageRank, o Google e as outras ferramentas de
busca analisam outras coisas, por exemplo:
● A quantidade que a palavra chave aparece na web
page
● O local que a keyword aparece: no título, no texto, na
URL
● O domínio de topo (TLD - Top Level Domain)
Relevância
19. Em 2011, Google fez uma grande mudança no seu
algoritmo, afetando cerca de 11,8%¹ das suas buscas. Essa
atualização ficou conhecida como Panda.
Devido a grande mudança nos resultados das buscas, a
Google fez um questionário com 23 perguntas para ajudar
os Webmasters no ranking dos seus sites
Segue algumas:
Relevância
¹ http://www.google.com/competition/howgooglesearchworks.
html
20. "5- A ortografia e o estilo do artigo estão corretos, ou
inúmeros erros persistem ? "
"21- O artigo é curto, sem substância, ou sem
especificações úteis? "
"18- Este é o tipo de página que você deseja marcar,
compartilhar com um amigo ou recomendar? "
4- Você chegaria a dar informações sobre o seu cartão de
crédito neste site?
Relevância
Fonte: http://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-revelado
21. Esforço do Webmaster para melhorar a
classificação do site no motor de busca.
Técnicas White Hat:
São considerados assim se estão de acordo com as
orientações dos Search Engines.
Técnicas Black Hat:
● Cloaking
● Texto escondido
SEO (Search Engine Optimization)
22. São códigos implementados dentro da página
para auxiliar máquinas de busca
● Devem ser criadas individualmente para cada página
● Ficam "escondidas" para quem navega através do
navegador. Só é possível visualizar vendo o código da
página
● Eram muito utilizados pelas ferramentas de busca para
auxiliar os robôs
Meta tags
23. Exemplos de Meta tags:
● Meta Description
○ Definição da página
● Meta Keywords
○ Palavras chaves para descrever a página
● Meta Robots
○ Comandos para os "spiders"
● Title
○ Não é uma Meta tag, mas é o mais importante
■ Exemplo:<title>Climatempo - Previsão do Tempo |
Meteorologia e Notícias em Tempo Real</title>
Meta tags
24. Lembrando que no PageRank a classificação dos
resultados é feita de acordo com o número de links
que apontam para a página.
Porém na web podem ser criadas páginas web
"falsas".
Google bombs
● Uma das mais famosa é a "Miserable Failure".
Spamdexing
● Usado para fins comerciais
"Burlando" os resultados
25. Sem os motores de busca seria muito dificil as
pesquisar por conteúdo na web. A invenção destes tornou
possivel encontrar um assunto específico diante desta
enorme quantidade de informação. Portanto podemos
dizer que estes são base para a Internet da forma que
conhecemos e nos habituamos a utilizar.
Conclusão
26. Beatriz Valadares Cendón (2001). Ferramentas de busca na Web - http:
//www.scielo.br/pdf/%0D/ci/v30n1/a06v30n1.pdf
Sergey Brin and Lawrence Page. The Anatomy of a Large-Scale Hypertextual
Web Search Engine, Stanford University, Stanford, CA, USA - http://infolab.
stanford.edu/~backrub/google.html
SEOmoz - The Begginers Guide to SEO - http://www.seomoz.org/beginners-
guide-to-seo
WordStream - History of Search - chttp://www.wordstream.
com/articles/internet-search-engines-history
Wikipedia - Web Search Engine - http://en.wikipedia.
org/wiki/Web_search_engine
How Stuff Work? - http://computer.howstuffworks.
com/internet/basics/search-engine.htm
Search Engine Watch - http://searchenginewatch.com/article/2065173/How-
Search-Engines-Work
Red Carpet Web - http://www.redcarpetweb.com/basics9.html
https://sites.google.com/site/historiasobreossitesdebusca/
Referências
27. Wikipedia - Bombardeio Google
http://en.wikipedia.org/wiki/Google_bomb
Wikipedia - SEO
http://en.wikipedia.org/wiki/Search_engine_optimization
Wikipedia - Camuflagem
http://en.wikipedia.org/wiki/Cloaking
Wikipedia - Spamdexing
http://en.wikipedia.org/wiki/Spamdexing
Searchengineland - What is SEO
http://searchengineland.com/guide/what-is-seo
http://www.seomarketing.com.br/meta-tags-google.php
http://pt.kioskea.net/faq/10244-o-algoritmo-do-google-panda-foi-revelado
http://www.youtube.com/watch?feature=player_embedded&v=mTBShTwCnD4
http://brasilmedia.com/Como-funciona-uma-Maquina-de-Busca.html#.USrUFzd57ng
http://www.seohoje.com/blog/como-funciona-o-algoritmo-de-busca-do-google/
http://evoluindonainformatica.wordpress.com/author/lanalbs/
http://support.google.com/webmasters/bin/answer.py?hl=en&answer=79812
http://www.google.com/competition/howgooglesearchworks.html
Referências