2. Fontes de Informação
l Há diversos 6pos de fontes de informação que podem ser úteis
para o Jornalismo de dados:
- Páginas web - webscrapping
- Qualquer site é uma fonte de informação em potencial para ser minerado
- Exemplos: Wikipedia, Mercado Livre, Google, TripAdvisor, Decolar, Booking, etc...
- Mecanismos de busca:
l Google, Yahoo, etc...
- Sites ins6tucionais:
l Portais de transparência, portais de dados abertos;
- Ins6tuições de pesquisa:
l IBGE, IPEA, IMB, etc...
- Mídias Sociais:
l Blogs, twi]er, facebook, etc...
- Bibliotecas Digitais:
l BDTDs, etc...
- Portais cien^ficos:
l Google Scholar, La]es, CNPq, CAPES, WebOfScience, Scielo, etc...
3. Páginas web
• Há muito conteúdo oriundo de páginas web que podemos ter o interesse de
coletar e analisar:
– Automa6zar a coleta de grande quan6dade de informação – tornando pra6camente inviável
coletar manualmente;
– Como os dados estão organizados;
– Encontrar tendências e padrões;
– Encontrar novidades;
– Aproveitar análises cole6vas para filtrar informação e qualificar resultados;
– Tomar decisões a par6r de flutuações dinâmicas nos padrões dos dados...
• Vejamos 3 exemplos de aplicações de coleta de dados de páginas web (essas
pesquisas seriam pra6camente impossíveis de serem feitas manualmente):
– Coletar automa6camente preços de um produto para avaliar tendências de oscilação ao longo
tempo e gerar séries históricas de comparação no Mercado Livre;
– Analisar o que internautas estão falando sobre um hotel, avaliando seus comentários e
levando essa informação em consideração para ações de gestão usando dados do TripAdvisor;
– Pesquisar sobre como filmes brasileiros são definidos e descritos na Wikipedia.
9. Mecanismos de busca
São ferramentas de busca genéricas, identificando os sites mais relevantes para um
tema de busca desejado.
A relevância é construída com base na citação dos sites por outros sites, ou seja,
quanto mais linkado um site for por outros mais próximo dos primeiros resultados
de busca ele se torna → filtro de relevância social
10. Mecanismos de busca
l Pontos posi6vos dos mecanismos de busca:
- Potente filtro de relevância social;
- Permitem pesquisar em diferentes mídias, tais como
imagens, vídeos, no^cias e blogs;
- Permitem rapidamente obter alguns resultados
relevantes e resolver a maior parte das questões.
l Pontos nega6vos dos mecanismos de busca:
- Temos tempo e disposição de navegar pelas 2 ou 3
primeiras páginas no máximo;
- A informação retorna de maneira desestruturada: é
dilcil coletar todos os sites e avaliar a massa de
dados em conjunto.
11. Mecanismos de busca
l Existem algumas ferramentas que ajudam a ter
um panorama geral do que tem sido pesquisado
nesses mecanismos:
- Google Trends
l h]p://www.google.com/trends/?hl=pt-BR_ALL
l ferramenta do google que permite sabermos o que tem sido pesquisado no
mundo;
l Permite também compararmos termos de busca para analisar a diferença de
interesse neles por parte dos usuários do google.
- Google Alerta
l h]ps://www.google.com.br/alerts
l Permite você criar no6ficações para receber um link toda vez que sua
expressão de interesse aparecer na web
l Google AdWords:
l h]ps://adwords.google.com/KeywordPlanner?hl=pt-br
l Permite comparar volumes de buscas por palavras-chave.
24. Ins6tuições de pesquisa
l IPEA – Ins6tuto de Pesquisa Econômica
Aplicada
- Dados macroeconômicos:
l Base de dados econômicos e financeiros man6da pelo Ipea incluindo séries esta^s6cas da economia brasileira e dos
aspectos que lhe são mais per6nentes na economia internacional. Os dados são atualizados e documentados de forma
sistemá6ca e apresentados na mesma unidade monetária. Recursos disponíveis permitem a manipulação matemá6ca e
a extração dos resultados em planilhas ou gráficos.
- Dados regionais:
l Base de dados demográficos, econômicos e geográficos para as regiões, estados e municípios brasileiros que se iniciam
no Censo Demográfico de 1872. A busca das séries esta^s6cas pode ser feita por "Palavras-chave" na sua descrição,
"Temas" ou assuntos de interesse, "Fontes" de publicação ou pelo "Nível geográfico" para o qual é possível agregar os
dados.
- Dados sociais:
l Base de dados e indicadores sociais abrangendo temas diversos, como nível de renda per capita, desigualdade na
distribuição de renda dos indivíduos e domicílios, desempenho educacional, condições de saúde e habitação, inserção no
mercado de trabalho, situação dos direitos humanos da população, entre outros.