SlideShare ist ein Scribd-Unternehmen logo
1 von 7
WEB SCRAPING WITH C#
Erick Wendel Gomes da Silva
Software Developer
O QUE É WEB SCRAPING ?
SÓ OS HACKERZÃO !!!!111
DE ACORDO COM O WIKIPEDIA:
É UMA TÉCNICA DE EXTRAÇÃO DE INFORMAÇÕES DE SITES A
PARTIR DE UM SOFTWARE DE COMPUTADOR.
COMO FUNCIONA ?
O SOFTWARE SE PASSA POR UM USUÁRIO COMUM, PARA OBTER
INFORMAÇÕES MALICIOSAS (OU NÃO) DE FORMA AUTOMATIZADA.
ANTES DE COMEÇAR, ALGUMAS VERDADES !!!
WEB SCRAPING É ILEGAL ?
DESDE QUE AS INFORMAÇÕES SEJAM PÚBLICAS, É TOTALMENTE
LEGAL !!
NÃO É EXCLUSIVO DA PLATAFORMA .NET
É UMA TÉCNICA ANTIGA, UTILIZADA POR DIVERSAS TECNOLOGIAS.
UMA TÉCNICA DE EXTRAÇÃO DE DADOS, MUITO CUIDADO!
DIFICULDADES
Dificilmente um site contém exatamente a mesma estrutura em tudo
(listas, tabelas, etc). Boa parte das vezes, precisamos de validações
para tratar excessões que possam ocorrer no caminho.
2
O desenvolvimento é realizado seguindo como base uma (ou várias)
páginas HTML, caso a estrutura do site mudar, você precisará refazer
todo o trabalho.
1
E CHEGA DE FALAR !!11
REFERENCIAS
WEB SITE (NADA DE WEB SCRAPING NELE EM !!)
http://erickwendel.com.br
CODIGO FONTE
http://bit.ly/WebScraping-Erick
HTML AGILITY PACK
https://htmlagilitypack.codeplex.com/
LINKEDIN
http://linkedin.com/in/erickwendel
EMAIL
erick.workspace@gmail.com
13/06/2015.
FIM !!111

Weitere ähnliche Inhalte

Andere mochten auch

Redes I - Conceitos e Tecnologias
Redes I - Conceitos e TecnologiasRedes I - Conceitos e Tecnologias
Redes I - Conceitos e TecnologiasMarcelo Charan
 
Scraping for fun and glory
Scraping for fun and gloryScraping for fun and glory
Scraping for fun and gloryitalomaia
 
Criar um sistema com asp net
Criar um sistema com asp netCriar um sistema com asp net
Criar um sistema com asp netAnderson Wernek
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaSidney Roberto
 
Redes 1 - Sockets em C#
Redes 1 - Sockets em C#Redes 1 - Sockets em C#
Redes 1 - Sockets em C#Marcelo Charan
 
Matematica discreta uma introducao edward r scheinerman
Matematica discreta uma introducao   edward r scheinermanMatematica discreta uma introducao   edward r scheinerman
Matematica discreta uma introducao edward r scheinermanArtur Câncio
 
Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...
Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...
Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...Daniel Makiyama
 
Desenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonDesenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonRoselma Mendes
 
Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...
Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...
Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...Daniel Makiyama
 
Extraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonExtraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonPedro Valente
 
Estruturas de Dados em C#
Estruturas de Dados em C#Estruturas de Dados em C#
Estruturas de Dados em C#Marcelo Charan
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Marcel Caraciolo
 

Andere mochten auch (17)

Redes I - Conceitos e Tecnologias
Redes I - Conceitos e TecnologiasRedes I - Conceitos e Tecnologias
Redes I - Conceitos e Tecnologias
 
Scraping by examples
Scraping by examplesScraping by examples
Scraping by examples
 
Scraping for fun and glory
Scraping for fun and gloryScraping for fun and glory
Scraping for fun and glory
 
Estrutura de dados 2
Estrutura de dados 2Estrutura de dados 2
Estrutura de dados 2
 
Estrutura de dados
Estrutura de dadosEstrutura de dados
Estrutura de dados
 
Web scraping
Web scrapingWeb scraping
Web scraping
 
Criar um sistema com asp net
Criar um sistema com asp netCriar um sistema com asp net
Criar um sistema com asp net
 
Web Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciênciaWeb Scraping: aplicações nos negócios e na ciência
Web Scraping: aplicações nos negócios e na ciência
 
Redes 1 - Sockets em C#
Redes 1 - Sockets em C#Redes 1 - Sockets em C#
Redes 1 - Sockets em C#
 
Matematica discreta uma introducao edward r scheinerman
Matematica discreta uma introducao   edward r scheinermanMatematica discreta uma introducao   edward r scheinerman
Matematica discreta uma introducao edward r scheinerman
 
Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...
Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...
Aprendendo Na Prática: Aplicativos Web com HTML5, Angular.js, Twitter Bootstr...
 
Desenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com PythonDesenvolvendo web crawler/scraper com Python
Desenvolvendo web crawler/scraper com Python
 
Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...
Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...
Aprendendo Na Prática: Aplicativos Web Com Asp.Net MVC em C# e Entity Framewo...
 
Extraindo dados públicos na marra com Python
Extraindo dados públicos na marra com PythonExtraindo dados públicos na marra com Python
Extraindo dados públicos na marra com Python
 
Estruturas de Dados em C#
Estruturas de Dados em C#Estruturas de Dados em C#
Estruturas de Dados em C#
 
Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3Oficina Python: Hackeando a Web com Python 3
Oficina Python: Hackeando a Web com Python 3
 
Web scraping com python
Web scraping com pythonWeb scraping com python
Web scraping com python
 

Ähnlich wie Mini Curso - WebScraping com C# - Erick Wendel

Apresentação Webmarketing
Apresentação WebmarketingApresentação Webmarketing
Apresentação WebmarketingPaulo Gomes
 
Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )
Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )
Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )Rafael Biriba
 
Teste de Segurança: Vulnerabilidade de Aplicações Web
Teste de Segurança: Vulnerabilidade de Aplicações WebTeste de Segurança: Vulnerabilidade de Aplicações Web
Teste de Segurança: Vulnerabilidade de Aplicações WebMarcio Roberto de Souza Godoi
 
10 problemas seguranca_ecommerce
10 problemas seguranca_ecommerce10 problemas seguranca_ecommerce
10 problemas seguranca_ecommerceSite Blindado S.A.
 
Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.
Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.
Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.TI Safe
 
Internet, intranet, extranet
Internet, intranet, extranetInternet, intranet, extranet
Internet, intranet, extranetPricila Yessayan
 
Capítulo 07 - Segurança em sistemas de informação
Capítulo 07 - Segurança em sistemas de informaçãoCapítulo 07 - Segurança em sistemas de informação
Capítulo 07 - Segurança em sistemas de informaçãoEverton Souza
 
Palestra Evolução e Perigos da Internet
Palestra Evolução e Perigos da InternetPalestra Evolução e Perigos da Internet
Palestra Evolução e Perigos da InternetFabrício Basto
 
Hackers Pensando
Hackers PensandoHackers Pensando
Hackers Pensandorenanturrm
 
Tchelinux: Go Web!
Tchelinux:  Go Web!Tchelinux:  Go Web!
Tchelinux: Go Web!Lucas L.
 
Aprendendo a programar <3
Aprendendo a programar <3Aprendendo a programar <3
Aprendendo a programar <3Romário santos
 
O que é a seguranca e os dispositivos que
O que é a seguranca e os dispositivos  queO que é a seguranca e os dispositivos  que
O que é a seguranca e os dispositivos queGuilhermeVolpini3
 
Como webscraping pode ajudar no Marketing?
Como webscraping pode ajudar no Marketing?Como webscraping pode ajudar no Marketing?
Como webscraping pode ajudar no Marketing?Thiago Rocha
 

Ähnlich wie Mini Curso - WebScraping com C# - Erick Wendel (20)

Apresentação Webmarketing
Apresentação WebmarketingApresentação Webmarketing
Apresentação Webmarketing
 
Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )
Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )
Faculdade: Trabalho sobre Seguranca Digital ( Versão em Slides )
 
Teste de Segurança: Vulnerabilidade de Aplicações Web
Teste de Segurança: Vulnerabilidade de Aplicações WebTeste de Segurança: Vulnerabilidade de Aplicações Web
Teste de Segurança: Vulnerabilidade de Aplicações Web
 
10 problemas seguranca_ecommerce
10 problemas seguranca_ecommerce10 problemas seguranca_ecommerce
10 problemas seguranca_ecommerce
 
Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.
Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.
Palestra - Visão geral da norma ANSI/ISA 99, Status da Norma e Tendências.
 
Internet, intranet, extranet
Internet, intranet, extranetInternet, intranet, extranet
Internet, intranet, extranet
 
Como funcionam as ameaças da internet e o cybercrime
Como funcionam as ameaças da internet e o cybercrimeComo funcionam as ameaças da internet e o cybercrime
Como funcionam as ameaças da internet e o cybercrime
 
Capítulo 07 - Segurança em sistemas de informação
Capítulo 07 - Segurança em sistemas de informaçãoCapítulo 07 - Segurança em sistemas de informação
Capítulo 07 - Segurança em sistemas de informação
 
Estrutura da Internet
Estrutura da InternetEstrutura da Internet
Estrutura da Internet
 
Javier Flavio
Javier FlavioJavier Flavio
Javier Flavio
 
Palestra Evolução e Perigos da Internet
Palestra Evolução e Perigos da InternetPalestra Evolução e Perigos da Internet
Palestra Evolução e Perigos da Internet
 
Hackers Pensando
Hackers PensandoHackers Pensando
Hackers Pensando
 
Unidade5 footprint
Unidade5 footprintUnidade5 footprint
Unidade5 footprint
 
Palestra fatec
Palestra fatecPalestra fatec
Palestra fatec
 
Tchelinux: Go Web!
Tchelinux:  Go Web!Tchelinux:  Go Web!
Tchelinux: Go Web!
 
Aprendendo a programar <3
Aprendendo a programar <3Aprendendo a programar <3
Aprendendo a programar <3
 
O que é a seguranca e os dispositivos que
O que é a seguranca e os dispositivos  queO que é a seguranca e os dispositivos  que
O que é a seguranca e os dispositivos que
 
Como webscraping pode ajudar no Marketing?
Como webscraping pode ajudar no Marketing?Como webscraping pode ajudar no Marketing?
Como webscraping pode ajudar no Marketing?
 
Internet
InternetInternet
Internet
 
Usando vitual box parte 1
Usando vitual box   parte 1Usando vitual box   parte 1
Usando vitual box parte 1
 

Mehr von Erick Wendel

WTF are serverless apps ?
WTF are serverless apps ? WTF are serverless apps ?
WTF are serverless apps ? Erick Wendel
 
Managing the flow of asynchronous operations in Node.js - SFNode
Managing the flow of asynchronous operations in Node.js - SFNodeManaging the flow of asynchronous operations in Node.js - SFNode
Managing the flow of asynchronous operations in Node.js - SFNodeErick Wendel
 
Node.js, Observables e RxJs - Programação reativa no Backend! - FCTech
Node.js, Observables e RxJs - Programação reativa no Backend! - FCTechNode.js, Observables e RxJs - Programação reativa no Backend! - FCTech
Node.js, Observables e RxJs - Programação reativa no Backend! - FCTechErick Wendel
 
Usando Javascript para reconhecer pessoas - Hack Town 2018
Usando Javascript para reconhecer pessoas - Hack Town 2018Usando Javascript para reconhecer pessoas - Hack Town 2018
Usando Javascript para reconhecer pessoas - Hack Town 2018Erick Wendel
 
Scaling your apps with Kubernetes and Docker - TheConf 2018
Scaling your apps with Kubernetes and Docker - TheConf 2018Scaling your apps with Kubernetes and Docker - TheConf 2018
Scaling your apps with Kubernetes and Docker - TheConf 2018Erick Wendel
 
Palestra sobre Google Adwords
Palestra sobre Google AdwordsPalestra sobre Google Adwords
Palestra sobre Google AdwordsErick Wendel
 

Mehr von Erick Wendel (6)

WTF are serverless apps ?
WTF are serverless apps ? WTF are serverless apps ?
WTF are serverless apps ?
 
Managing the flow of asynchronous operations in Node.js - SFNode
Managing the flow of asynchronous operations in Node.js - SFNodeManaging the flow of asynchronous operations in Node.js - SFNode
Managing the flow of asynchronous operations in Node.js - SFNode
 
Node.js, Observables e RxJs - Programação reativa no Backend! - FCTech
Node.js, Observables e RxJs - Programação reativa no Backend! - FCTechNode.js, Observables e RxJs - Programação reativa no Backend! - FCTech
Node.js, Observables e RxJs - Programação reativa no Backend! - FCTech
 
Usando Javascript para reconhecer pessoas - Hack Town 2018
Usando Javascript para reconhecer pessoas - Hack Town 2018Usando Javascript para reconhecer pessoas - Hack Town 2018
Usando Javascript para reconhecer pessoas - Hack Town 2018
 
Scaling your apps with Kubernetes and Docker - TheConf 2018
Scaling your apps with Kubernetes and Docker - TheConf 2018Scaling your apps with Kubernetes and Docker - TheConf 2018
Scaling your apps with Kubernetes and Docker - TheConf 2018
 
Palestra sobre Google Adwords
Palestra sobre Google AdwordsPalestra sobre Google Adwords
Palestra sobre Google Adwords
 

Mini Curso - WebScraping com C# - Erick Wendel

  • 1. WEB SCRAPING WITH C# Erick Wendel Gomes da Silva Software Developer
  • 2. O QUE É WEB SCRAPING ? SÓ OS HACKERZÃO !!!!111 DE ACORDO COM O WIKIPEDIA: É UMA TÉCNICA DE EXTRAÇÃO DE INFORMAÇÕES DE SITES A PARTIR DE UM SOFTWARE DE COMPUTADOR. COMO FUNCIONA ? O SOFTWARE SE PASSA POR UM USUÁRIO COMUM, PARA OBTER INFORMAÇÕES MALICIOSAS (OU NÃO) DE FORMA AUTOMATIZADA.
  • 3. ANTES DE COMEÇAR, ALGUMAS VERDADES !!! WEB SCRAPING É ILEGAL ? DESDE QUE AS INFORMAÇÕES SEJAM PÚBLICAS, É TOTALMENTE LEGAL !! NÃO É EXCLUSIVO DA PLATAFORMA .NET É UMA TÉCNICA ANTIGA, UTILIZADA POR DIVERSAS TECNOLOGIAS. UMA TÉCNICA DE EXTRAÇÃO DE DADOS, MUITO CUIDADO!
  • 4. DIFICULDADES Dificilmente um site contém exatamente a mesma estrutura em tudo (listas, tabelas, etc). Boa parte das vezes, precisamos de validações para tratar excessões que possam ocorrer no caminho. 2 O desenvolvimento é realizado seguindo como base uma (ou várias) páginas HTML, caso a estrutura do site mudar, você precisará refazer todo o trabalho. 1
  • 5. E CHEGA DE FALAR !!11
  • 6. REFERENCIAS WEB SITE (NADA DE WEB SCRAPING NELE EM !!) http://erickwendel.com.br CODIGO FONTE http://bit.ly/WebScraping-Erick HTML AGILITY PACK https://htmlagilitypack.codeplex.com/ LINKEDIN http://linkedin.com/in/erickwendel EMAIL erick.workspace@gmail.com 13/06/2015.