SlideShare uma empresa Scribd logo
1 de 31
Métodos computacionais
avançados
PARA ENGENHARIA DE PRODUÇÃO
Prof. Davi das Chagas Neves
Prof. Helton Cristiano Gomes
AULA 09
Web Scraping com R
® Extraindo dados padronizados a partir de páginas
da internet: Web Scraping.
® Estudos de casos de Web Scraping utilizando
bibliotecas da linguagem R.
“Um artista ao olhar para uma rosa vê toda
a sua beleza estética, um cientista, além de
admirá-la, vê os dados que constituem toda
informação daquele universo.”
Richard Feynman, Físico Americano.
Web Scraping com R
Como funciona a internet?
Web Scraping com R Clientes
Servidor
Transferências
Solicitações
Comandos
Textos e Mídias
Conteúdo
HTML
Formato
CSS
Ação
JS
FRONT
END
Ação
PHP
BACK
END
▪ Python
▪ Pearl
▪ Ruby
▪ Linux
▪ Apache
▪ MySQL
Internet
HTTP
Web Scraping com R
Estruturas HTML Hyper Text Markup Language
Linguagem de marcação de hipertextos
Marcação
HTTP
Web Scraping com R
➢ O que é Web Scraping?
✓ Raspagem da WEB.
✓ Garimpando a internet.
✓ Coletando dados na rede.
Pergunta:
Como funciona um buscador de imagens?
Resposta:
Um algoritmo que coleta imagens utilizando
a etiqueta <img>.
Conclusão:
Assim como em uma pesquisa de preços, em
WEB Scraping foque nas etiquetas!
Traduções
Web Scraping com R
Estruturas HTML Etiquetas Relevantes:
TAG Estrutura HTML TAG Estrutura HTML
<script> Interatividade <tr>, <td>, <th> Tabelas
<ol>, <ul>, <li> Listas <form> Formulários
<dir>, <dt> Diretórios <title> Títulos
<menu> Menu para navegar <p> Parágrafos
<adress> Informações autorais <a> Links externos
<img> Imagens <style> Estilos CSS
<frame>, <iframe> Referências externas <input> Entrada de informação
Web Scraping com R
Estruturas CSS Folhas de Estilos em Cascata:
❑ Para importar a estrutura CSS utilize a TAG: <link>
Web Scraping com R
PARA ANALISAR O CÓDIGO
FONTE DE UMA PÁGINA, NO
CHROME, DIGITE:
Ctrl + U
Para outros
navegadores:
Web Scraping com R
Bibliotecas e Funções
Web Scraping com R
http://material.curso-r.com/scrape/
https://www.selenium.dev/
✓ As Bibliotecas
Web Scraping com R
✓ Mais Bibliotecas
❑ selectr – biblioteca leve e personalizável que converte estruturas JS em dados coletáveis.
❑ tydeverse – conjunto de pacotes em R especializados em ciências de dados.
❑ stringr – biblioteca especializada na manipulação de textos e caracteres.
❑ rebus – biblioteca para codificar textos prolixos (muito detalhados) em expressões regulares.
❑ dplyr – biblioteca elaborada para manipular textos considerando regras gramaticais.
❑ lubridate – biblioteca que contém funções especializadas em manipulação de datas.
❑ xts – conjunto de pacotes especializados no tratamento de séries de dados.
❑ infer – pacote especializado em inferência estatística a partir de expressões gramaticais.
❑ ggplot2 – pacote para plotar gráficos muito avançado.
Web Scraping com R
✓ Funções de rvest
1.read_html() – coleta o conteúdo HTML de um site.
2.html_nodes() – identifica wrappers (invólucro </>) HTML.
3.html_nodes(“.class”) – identifica uma classe de CSS.
4.html_nodes(“#id”) – identifica uma ID de CSS.
5.html_attrs() – identifica atributos, usado no debug.
6.html_table() – converte tabelas em data frames.
7.html_text() – retira as tags do HTML, extraindo apenas o texto.
Web Scraping com R
❖ Quer saber mais? Quer se aprofundar?
Web Scraping com R
Estudos de Casos
Web Scraping com R
Exemplo 1 ➢ Tabela do campeonato brasileiro 2019
1. Vá ao site:
2. Ctrl + U
3. Analise:
Web Scraping com R
➢ URL: https://www.cbf.com.br/futebol-brasileiro/competicoes/campeonato-brasileiro-serie-a/2019
Web Scraping com R
Web Scraping com R
Exemplo 2 ➢ Preços num site de compras
Selecione a estrutura e
clique com o botão direito.
Tablet
Galaxy
A8 SPen
2019
Web Scraping com R
Tablet A8 SPen
Ctrl + Shift + I
➢ Inspecione a estrutura HTML desejada, neste caso o título e o preço do produto.
Título
Web Scraping com R
Preço
Web Scraping com R
Ajuste a URL
Web Scraping com R
➢ Para casa: Repita este Web Scraping para uma página com muitos tablets.
No Magazine Luiza mesmo.
Web Scraping com R
Exemplo 3 ➢ Coletando dados no IMDB – Melhores Séries
Etapas
✓ Vá até o
site IMDB
✓ Clique no
Menu
✓ Selecione
Most Popular
TV Shows
✓ Sorteie por
IMDB Rating
Web Scraping com R
Instale
1
2
3
1) Ative o gadget, 2) Selecione o título e 3) Copie a estrutura HTML.
Web Scraping com R
✓ Resultado:
➢ Para casa: Troque “td” pelo termo copiado no slide passado.
Web Scraping com R
Exemplo 4 ➢ Cotações das Ações da Petrobrás
http://www.b3.com.br/
Web Scraping com R
A tabela não está no site primário, ela está em uma URL
secundária, conforme indicado neste código HTML
▪ http://www2.bmf.com.br/pages/portal/bmfbovespa/lumis/lum-ajustes-do-pregao-ptBR.asp
Web Scraping com R
Web Scraping com R
Web Scraping com
R
 Elabore um programa que coleta os
preços dos carros no site Webmotors.
 Elabore um programa que coleta os
dados do site da Amazon, para
smartphones.
 Descubra como extrair os dados dos
resultados dos nossos exemplos.
 Na próxima aula vamos conhecer
bancos de dados NoSQL.

Mais conteúdo relacionado

Semelhante a Web Scraping com R para Engenharia de Produção

Construindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon RedshiftConstruindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon RedshiftAmazon Web Services LATAM
 
Desenvolva rapidamente utilizando o framework Desenvolva rapidamente utiliz...
Desenvolva rapidamente
utilizando o framework
Desenvolva rapidamente utiliz...Desenvolva rapidamente
utilizando o framework
Desenvolva rapidamente utiliz...
Desenvolva rapidamente utilizando o framework Desenvolva rapidamente utiliz...Renato Shirakashi
 
Qcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.jsQcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.jsJorge Walendowsky
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Amazon Web Services
 
Apresentação Minas - Desenvolvendo Sites
Apresentação Minas - Desenvolvendo SitesApresentação Minas - Desenvolvendo Sites
Apresentação Minas - Desenvolvendo Sitesthiagolima
 
Montando sites com XHTML e CSS utilizando os padrões web
Montando sites com XHTML e CSS utilizando os padrões webMontando sites com XHTML e CSS utilizando os padrões web
Montando sites com XHTML e CSS utilizando os padrões webigorpimentel
 
Utilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentesUtilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentesChristiano Anderson
 
Palestra Desenvolvimento Ágil para Web com ROR UVA
Palestra Desenvolvimento Ágil para Web com ROR UVAPalestra Desenvolvimento Ágil para Web com ROR UVA
Palestra Desenvolvimento Ágil para Web com ROR UVAThiago Cifani
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaSidney Roberto
 
Desenvolvendo aplicativos web escaláveis
Desenvolvendo aplicativos web escaláveisDesenvolvendo aplicativos web escaláveis
Desenvolvendo aplicativos web escaláveisManuel Lemos
 
Secot banco de dados no sql de código aberto
Secot   banco de dados no sql de código abertoSecot   banco de dados no sql de código aberto
Secot banco de dados no sql de código abertoSuissa
 

Semelhante a Web Scraping com R para Engenharia de Produção (20)

Construindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon RedshiftConstruindo um Data Warehouse moderno com Amazon Redshift
Construindo um Data Warehouse moderno com Amazon Redshift
 
Hands On JavaScript
Hands On JavaScriptHands On JavaScript
Hands On JavaScript
 
Desenvolva rapidamente utilizando o framework Desenvolva rapidamente utiliz...
Desenvolva rapidamente
utilizando o framework
Desenvolva rapidamente utiliz...Desenvolva rapidamente
utilizando o framework
Desenvolva rapidamente utiliz...
Desenvolva rapidamente utilizando o framework Desenvolva rapidamente utiliz...
 
Curso HTML 5 - Aula Inicial
Curso HTML 5 - Aula InicialCurso HTML 5 - Aula Inicial
Curso HTML 5 - Aula Inicial
 
Qcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.jsQcon 2013 - Walmart Frontend Solution using Node.js
Qcon 2013 - Walmart Frontend Solution using Node.js
 
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
Aplicando uma Estratégia de Banco de Dados AWS Personalizada: Encontre o Banc...
 
Javascript aula 01 - visão geral
Javascript   aula 01 - visão geralJavascript   aula 01 - visão geral
Javascript aula 01 - visão geral
 
Slides .pptx.pdf
Slides .pptx.pdfSlides .pptx.pdf
Slides .pptx.pdf
 
Apresentação Minas - Desenvolvendo Sites
Apresentação Minas - Desenvolvendo SitesApresentação Minas - Desenvolvendo Sites
Apresentação Minas - Desenvolvendo Sites
 
Montando sites com XHTML e CSS utilizando os padrões web
Montando sites com XHTML e CSS utilizando os padrões webMontando sites com XHTML e CSS utilizando os padrões web
Montando sites com XHTML e CSS utilizando os padrões web
 
Curso de Desenvolvimento Web - Módulo 03 - JavaScript
Curso de Desenvolvimento Web - Módulo 03 - JavaScriptCurso de Desenvolvimento Web - Módulo 03 - JavaScript
Curso de Desenvolvimento Web - Módulo 03 - JavaScript
 
Utilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentesUtilizando NoSQL no desenvolvimento de soluções inteligentes
Utilizando NoSQL no desenvolvimento de soluções inteligentes
 
Palestra Desenvolvimento Ágil para Web com ROR UVA
Palestra Desenvolvimento Ágil para Web com ROR UVAPalestra Desenvolvimento Ágil para Web com ROR UVA
Palestra Desenvolvimento Ágil para Web com ROR UVA
 
Mini curso html5 slides
Mini curso html5   slidesMini curso html5   slides
Mini curso html5 slides
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciência
 
TechEd_OFC305
TechEd_OFC305TechEd_OFC305
TechEd_OFC305
 
Desenvolvendo aplicativos web escaláveis
Desenvolvendo aplicativos web escaláveisDesenvolvendo aplicativos web escaláveis
Desenvolvendo aplicativos web escaláveis
 
Asa cpbr4
Asa cpbr4Asa cpbr4
Asa cpbr4
 
Secot banco de dados no sql de código aberto
Secot   banco de dados no sql de código abertoSecot   banco de dados no sql de código aberto
Secot banco de dados no sql de código aberto
 
Web Scale Data Management
Web Scale Data ManagementWeb Scale Data Management
Web Scale Data Management
 

Mais de Davi Neves (19)

P566Aula10
P566Aula10P566Aula10
P566Aula10
 
P566Aula08
P566Aula08P566Aula08
P566Aula08
 
P566Aula07
P566Aula07P566Aula07
P566Aula07
 
P566Aula06
P566Aula06P566Aula06
P566Aula06
 
P566Aula05
P566Aula05P566Aula05
P566Aula05
 
P566Aula04
P566Aula04P566Aula04
P566Aula04
 
P566Aula03
P566Aula03P566Aula03
P566Aula03
 
P566Aula02
P566Aula02P566Aula02
P566Aula02
 
P566Aula01
P566Aula01P566Aula01
P566Aula01
 
P910Aula10
P910Aula10P910Aula10
P910Aula10
 
P910Aula09
P910Aula09P910Aula09
P910Aula09
 
P910Aula08
P910Aula08P910Aula08
P910Aula08
 
P910Aula07
P910Aula07P910Aula07
P910Aula07
 
P910Aula06
P910Aula06P910Aula06
P910Aula06
 
P910Aula05
P910Aula05P910Aula05
P910Aula05
 
P910Aula04
P910Aula04P910Aula04
P910Aula04
 
P910Aula03
P910Aula03P910Aula03
P910Aula03
 
P910Aula02
P910Aula02P910Aula02
P910Aula02
 
P910Aula01
P910Aula01P910Aula01
P910Aula01
 

Último

Aulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdf
Aulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdfAulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdf
Aulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdfMateusSerraRodrigues1
 
Resistencias dos materiais I - Tensao.pptx
Resistencias dos materiais I - Tensao.pptxResistencias dos materiais I - Tensao.pptx
Resistencias dos materiais I - Tensao.pptxjuliocameloUFC
 
LEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurançaLEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurançaGuilhermeLucio9
 
MODELO LAUDO AVALIAÇÃO MÁQUINAS EQUIPAM
MODELO LAUDO AVALIAÇÃO MÁQUINAS  EQUIPAMMODELO LAUDO AVALIAÇÃO MÁQUINAS  EQUIPAM
MODELO LAUDO AVALIAÇÃO MÁQUINAS EQUIPAMCassio Rodrigo
 
FISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animal
FISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animalFISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animal
FISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animalPauloHenrique154965
 
Eletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante TamandaréEletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante TamandaréGuilhermeLucio9
 
Estatística aplicada à experimentação animal
Estatística aplicada à experimentação animalEstatística aplicada à experimentação animal
Estatística aplicada à experimentação animalleandroladesenvolvim
 
Tecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade AnhangueraTecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade AnhangueraGuilhermeLucio9
 
PLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdf
PLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdfPLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdf
PLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdfAroldoMenezes1
 

Último (9)

Aulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdf
Aulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdfAulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdf
Aulas Práticas da Disciplina de Desenho Técnico Projetivo _ Passei Direto.pdf
 
Resistencias dos materiais I - Tensao.pptx
Resistencias dos materiais I - Tensao.pptxResistencias dos materiais I - Tensao.pptx
Resistencias dos materiais I - Tensao.pptx
 
LEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurançaLEAN SIX SIGMA - Garantia da qualidade e segurança
LEAN SIX SIGMA - Garantia da qualidade e segurança
 
MODELO LAUDO AVALIAÇÃO MÁQUINAS EQUIPAM
MODELO LAUDO AVALIAÇÃO MÁQUINAS  EQUIPAMMODELO LAUDO AVALIAÇÃO MÁQUINAS  EQUIPAM
MODELO LAUDO AVALIAÇÃO MÁQUINAS EQUIPAM
 
FISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animal
FISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animalFISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animal
FISIOLOGIA DA REPRODUÇÃO. matéria de fisiologia animal
 
Eletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante TamandaréEletricista instalador - Senai Almirante Tamandaré
Eletricista instalador - Senai Almirante Tamandaré
 
Estatística aplicada à experimentação animal
Estatística aplicada à experimentação animalEstatística aplicada à experimentação animal
Estatística aplicada à experimentação animal
 
Tecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade AnhangueraTecnólogo em Mecatrônica - Universidade Anhanguera
Tecnólogo em Mecatrônica - Universidade Anhanguera
 
PLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdf
PLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdfPLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdf
PLANO DE EMERGÊNCIA E COMBATE A INCENDIO.pdf
 

Web Scraping com R para Engenharia de Produção

  • 1. Métodos computacionais avançados PARA ENGENHARIA DE PRODUÇÃO Prof. Davi das Chagas Neves Prof. Helton Cristiano Gomes AULA 09
  • 2. Web Scraping com R ® Extraindo dados padronizados a partir de páginas da internet: Web Scraping. ® Estudos de casos de Web Scraping utilizando bibliotecas da linguagem R. “Um artista ao olhar para uma rosa vê toda a sua beleza estética, um cientista, além de admirá-la, vê os dados que constituem toda informação daquele universo.” Richard Feynman, Físico Americano.
  • 3. Web Scraping com R Como funciona a internet?
  • 4. Web Scraping com R Clientes Servidor Transferências Solicitações Comandos Textos e Mídias Conteúdo HTML Formato CSS Ação JS FRONT END Ação PHP BACK END ▪ Python ▪ Pearl ▪ Ruby ▪ Linux ▪ Apache ▪ MySQL Internet HTTP
  • 5. Web Scraping com R Estruturas HTML Hyper Text Markup Language Linguagem de marcação de hipertextos Marcação HTTP
  • 6. Web Scraping com R ➢ O que é Web Scraping? ✓ Raspagem da WEB. ✓ Garimpando a internet. ✓ Coletando dados na rede. Pergunta: Como funciona um buscador de imagens? Resposta: Um algoritmo que coleta imagens utilizando a etiqueta <img>. Conclusão: Assim como em uma pesquisa de preços, em WEB Scraping foque nas etiquetas! Traduções
  • 7. Web Scraping com R Estruturas HTML Etiquetas Relevantes: TAG Estrutura HTML TAG Estrutura HTML <script> Interatividade <tr>, <td>, <th> Tabelas <ol>, <ul>, <li> Listas <form> Formulários <dir>, <dt> Diretórios <title> Títulos <menu> Menu para navegar <p> Parágrafos <adress> Informações autorais <a> Links externos <img> Imagens <style> Estilos CSS <frame>, <iframe> Referências externas <input> Entrada de informação
  • 8. Web Scraping com R Estruturas CSS Folhas de Estilos em Cascata: ❑ Para importar a estrutura CSS utilize a TAG: <link>
  • 9. Web Scraping com R PARA ANALISAR O CÓDIGO FONTE DE UMA PÁGINA, NO CHROME, DIGITE: Ctrl + U Para outros navegadores:
  • 10. Web Scraping com R Bibliotecas e Funções
  • 11. Web Scraping com R http://material.curso-r.com/scrape/ https://www.selenium.dev/ ✓ As Bibliotecas
  • 12. Web Scraping com R ✓ Mais Bibliotecas ❑ selectr – biblioteca leve e personalizável que converte estruturas JS em dados coletáveis. ❑ tydeverse – conjunto de pacotes em R especializados em ciências de dados. ❑ stringr – biblioteca especializada na manipulação de textos e caracteres. ❑ rebus – biblioteca para codificar textos prolixos (muito detalhados) em expressões regulares. ❑ dplyr – biblioteca elaborada para manipular textos considerando regras gramaticais. ❑ lubridate – biblioteca que contém funções especializadas em manipulação de datas. ❑ xts – conjunto de pacotes especializados no tratamento de séries de dados. ❑ infer – pacote especializado em inferência estatística a partir de expressões gramaticais. ❑ ggplot2 – pacote para plotar gráficos muito avançado.
  • 13. Web Scraping com R ✓ Funções de rvest 1.read_html() – coleta o conteúdo HTML de um site. 2.html_nodes() – identifica wrappers (invólucro </>) HTML. 3.html_nodes(“.class”) – identifica uma classe de CSS. 4.html_nodes(“#id”) – identifica uma ID de CSS. 5.html_attrs() – identifica atributos, usado no debug. 6.html_table() – converte tabelas em data frames. 7.html_text() – retira as tags do HTML, extraindo apenas o texto.
  • 14. Web Scraping com R ❖ Quer saber mais? Quer se aprofundar?
  • 15. Web Scraping com R Estudos de Casos
  • 16. Web Scraping com R Exemplo 1 ➢ Tabela do campeonato brasileiro 2019 1. Vá ao site: 2. Ctrl + U 3. Analise:
  • 17. Web Scraping com R ➢ URL: https://www.cbf.com.br/futebol-brasileiro/competicoes/campeonato-brasileiro-serie-a/2019
  • 19. Web Scraping com R Exemplo 2 ➢ Preços num site de compras Selecione a estrutura e clique com o botão direito. Tablet Galaxy A8 SPen 2019
  • 20. Web Scraping com R Tablet A8 SPen Ctrl + Shift + I ➢ Inspecione a estrutura HTML desejada, neste caso o título e o preço do produto. Título
  • 21. Web Scraping com R Preço
  • 22. Web Scraping com R Ajuste a URL
  • 23. Web Scraping com R ➢ Para casa: Repita este Web Scraping para uma página com muitos tablets. No Magazine Luiza mesmo.
  • 24. Web Scraping com R Exemplo 3 ➢ Coletando dados no IMDB – Melhores Séries Etapas ✓ Vá até o site IMDB ✓ Clique no Menu ✓ Selecione Most Popular TV Shows ✓ Sorteie por IMDB Rating
  • 25. Web Scraping com R Instale 1 2 3 1) Ative o gadget, 2) Selecione o título e 3) Copie a estrutura HTML.
  • 26. Web Scraping com R ✓ Resultado: ➢ Para casa: Troque “td” pelo termo copiado no slide passado.
  • 27. Web Scraping com R Exemplo 4 ➢ Cotações das Ações da Petrobrás http://www.b3.com.br/
  • 28. Web Scraping com R A tabela não está no site primário, ela está em uma URL secundária, conforme indicado neste código HTML ▪ http://www2.bmf.com.br/pages/portal/bmfbovespa/lumis/lum-ajustes-do-pregao-ptBR.asp
  • 31. Web Scraping com R  Elabore um programa que coleta os preços dos carros no site Webmotors.  Elabore um programa que coleta os dados do site da Amazon, para smartphones.  Descubra como extrair os dados dos resultados dos nossos exemplos.  Na próxima aula vamos conhecer bancos de dados NoSQL.