7. PyLadies por PyLadies
“Somos um grupo internacional de mentoria com foco em ajudar
mais mulheres a tornarem-se participantes ativas e líderes na
comunidade open-source Python.”
“PyLadies também tem o intuito de proporcionar uma rede de
suporte amigável para mulheres e uma ponte para o universo
Python. Qualquer pessoa interessada em Python é encorajada a
participar”
Fonte: http://www.pyladies.com/
14. Raspagem de Dados...
“... (do inglês, Data scraping) é uma técnica computacional na qual um programa extrai
dados de saída legível somente para humanos, proveniente de um serviço ou aplicativo.”
Fonte: https://pt.wikipedia.org/wiki/Screen_scraping
“Screen scraping usually refers to a legitimate technique used to translate screen data
from one application to another. It is sometimes confused with content scraping, which is
the use of manual or automatic means to harvest content from a website without the
approval of the website owner.”
Fonte: https://www.techopedia.com/definition/16597/screen-scraping
15. Web Scraping...
“... (web harvesting or web data extraction) is data scraping used for extracting data
from websites. Web scraping software may access the World Wide Web directly using the
Hypertext Transfer Protocol, or through a web browser. While web scraping can be done
manually by a software user, the term typically refers to automated processes
implemented using a bot or web crawler. It is a form of copying, in which specific data is
gathered and copied from the web, typically into a central local database or spreadsheet,
for later retrieval or analysis.”
Fonte: https://en.wikipedia.org/wiki/Web_scraping
17. Técnicas para coleta de dados não estruturados
Dados não estruturados:
misturados com a
apresentação. Ex.: HTML
18. Técnicas para coleta de dados não estruturados
'''
Web Scrapping: arquivo básico para leitura de uma página do endereço definido
na URL definida
'''
from urllib.request import urlopen
response = urlopen('http://www.bbc.com/mundo')
resultado = response.read().decode('utf-8')
# gravar o resultado em um arquivo
open('resultado_html.html', 'w', encoding='utf-8').write(resultado)
30. Educação Dados Abertos BR
with open('escolas.csv', 'w', newline='') as csvfile:
fieldnames = ['anoCenso','cod','nome','codCidade','cidade','estado','regiao',
'situacaoFuncionamento','situacaoFuncionamentoTxt',
'dependenciaAdministrativa','dependenciaAdministrativaTxt','idebAF',
'idebAI','enemMediaGeral']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
writer.writeheader()
for escola in escolas:
writer.writerow(escola)