SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Downloaden Sie, um offline zu lesen
INTRODUÇÃO 
Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
O QUE É CIÊNCIA DOS 
DADOS?
Ciência da 
Computação 
! 
! 
Matemática 
e Estatística 
! 
! 
Ciência 
dos 
Dados 
! 
! 
! 
Domínio de 
Aplicação 
Finanças 
Economia 
Engenharia 
Direito 
Medicina 
Ciências 
Sociais 
Ciências
O QUE É CIÊNCIA DOS 
DADOS? 
Alto Baixo 
Coletar, 
transformar e 
armazenar 
dados 
Mágica 01: 
gerar 
informação 
Mágica 02: 
apresentar a 
informação 
Mágica 03: 
gerar 
conhecimento 
Massageamento de Números (máquina) 
Intrepretação (humano) 
Baixo Alto
O QUE É CIÊNCIA DOS 
DADOS? 
Computação Comunicação / 
Coletar, 
transformar e 
armazenar 
dados 
Mágica 01: 
gerar 
informação 
Mágica 02: 
apresentar a 
informação 
Mágica 03: 
gerar 
conhecimento 
Visualização 
Matemática / 
Estatística 
Conhecimento 
sobre o domínio
CIÊNCIA DA COMPUTAÇÃO 
VS CIÊNCIA DOS DADOS 
Ciência da 
Computação 
Entrada X 
Função F 
Saída Y = F(X) 
Ciência dos Dados 
Entrada X 
Saída Y 
Modelar f tal que 
Y = f(X) + ɛ
USANDO UM MODELO 
Entradas e 
Saídas 
Algoritmo de 
treinamento 
Modelo 
Novas 
entradas 
Saídas 
estimadas
“Ciência dos Dados é a ciência que estuda formas de 
extrair conhecimento generalizável a partir de dados.” 
–Vasant Dhar 
Leitura recomendada: 
! 
Data Science and Prediction, Communications of the ACM, Vol. 56 No. 12, Pages 64-73
E ONDE ESTÁ A CIÊNCIA 
NISSO?
“Qualquer área que se auto-denomina Ciência não 
pode ser Ciência.” 
–Autor desconhecido 
Leitura recomendada: 
! 
Is computer science science?, Communications of the ACM Vol. 48 No. 4, Pages 27-31 
Where is the Science in Computer Science?, Communications of the ACM, Vol. 55 No. 10, Page 5 
The Science in Computer Science, Communications of the ACM, Vol. 56 No. 5, Pages 35-38
UTILIZAR APRENDIZAGEM DE 
MÁQUINA NÃO É CIÊNCIA!
PERSEGUIR CORRELAÇÕES 
NÃO É CIÊNCIA!
CIÊNCIA É EXPLORAR E 
EXPLICAR O DESCONHECIDO! 
• No caso da Ciência dos Dados, isso significa 
aprender a fazer as perguntas corretas e a extrair 
dos dados as respostas adequadas para tais 
perguntas.
O QUE VEREMOS NESTE 
CURSO 
• Fundamentação teórica (Tipos de dados e como os dados 
são geralmente agrupados) 
• Técnicas para coleta de dados (Formulários, projeto de 
experimentos e dados públicos) 
• Técnicas para análise de dados (Sumarização estatística, 
correlação, regressão linear e agrupamento) 
• Princípios de visualização de dados
O QUE NÃO VEREMOS NESTE 
CURSO 
• Técnicas avançadas de aprendizagem de máquina 
• Técnicas avançadas de análise e modelagem 
estatística
FORMA DE AVALIAÇÃO 
• Desenvolvimento de um projeto (grupos de até 2 alunos) 
completo de análise e visualização de dados 
• 3 etapas: 
• Plano de pesquisa e planejamento de releases (35%) 
• Entrega da 1a release (25%) 
• Entrega da 2a release (40%)
TODOS OS PROJETOS 
DEVERÃO 
• Oferecer uma interface web 
• Realizar a coleta, limpeza e análise dos dados de 
forma (semi-)automática 
• Exibir de forma interativa e geo-referenciada os 
resultados obtidos 
• Considerar a evolução temporal dos resultados
FONTES DE DADOS 
• Só poderão ser utilizadas fontes de dados listadas 
no site da disciplina 
• Os alunos podem sugerir novas fontes de dados
REFERÊNCIAS 
• DATA + DESIGN: A simple introduction to preparing 
and visualizing information. Trina Chiasson et al, 2014. 
• Core Concepts in Data Analysis: Summarization, 
Correlation and Visualization. Boris Mirkin, 2011 
• The Art of Computer Systems Performance Analysis: 
Techniques for Experimental Design, Measurement, 
Simulation, and Modeling. R. Jain, 1991.

Weitere ähnliche Inhalte

Was ist angesagt?

Sistema de Informação na Empresa
Sistema de Informação na EmpresaSistema de Informação na Empresa
Sistema de Informação na Empresa
Adeildo Telles
 
Pesquisa Qualitativa: Uma Introdução. Profa. Rilva
Pesquisa Qualitativa: Uma Introdução. Profa. RilvaPesquisa Qualitativa: Uma Introdução. Profa. Rilva
Pesquisa Qualitativa: Uma Introdução. Profa. Rilva
Rilva Lopes de Sousa Muñoz
 
Conceitos de Sistemas de Informação
Conceitos de Sistemas de InformaçãoConceitos de Sistemas de Informação
Conceitos de Sistemas de Informação
luanrjesus
 

Was ist angesagt? (20)

Dados, Informação e Conhecimento
Dados, Informação e ConhecimentoDados, Informação e Conhecimento
Dados, Informação e Conhecimento
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dados
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dados
 
Segurança da informação
Segurança da informaçãoSegurança da informação
Segurança da informação
 
Aula - Sistemas de Informação Gerencial
Aula - Sistemas de Informação GerencialAula - Sistemas de Informação Gerencial
Aula - Sistemas de Informação Gerencial
 
Lista de exercicios de sig (respondida) 1bimestre 2013
Lista de exercicios de sig (respondida) 1bimestre 2013Lista de exercicios de sig (respondida) 1bimestre 2013
Lista de exercicios de sig (respondida) 1bimestre 2013
 
SISTEMAS DE INFORMAÇÕES GERENCIAIS
SISTEMAS DE INFORMAÇÕES GERENCIAISSISTEMAS DE INFORMAÇÕES GERENCIAIS
SISTEMAS DE INFORMAÇÕES GERENCIAIS
 
Evolução dos sistemas de informação
Evolução dos sistemas de informaçãoEvolução dos sistemas de informação
Evolução dos sistemas de informação
 
Projeto de pesquisa
Projeto de pesquisaProjeto de pesquisa
Projeto de pesquisa
 
5- Modelo entidade Relacionamento - Cardinalidade - Profª Cristiane Fidelix
5- Modelo entidade Relacionamento - Cardinalidade - Profª Cristiane Fidelix5- Modelo entidade Relacionamento - Cardinalidade - Profª Cristiane Fidelix
5- Modelo entidade Relacionamento - Cardinalidade - Profª Cristiane Fidelix
 
Sistema de informação gerencial
Sistema de informação gerencialSistema de informação gerencial
Sistema de informação gerencial
 
Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...
Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...
Sistemas de Informação 2 - Aula04 - Sistemas de informação nas organizações p...
 
Aula 02 - Sistemas, Dados, Informação
Aula 02 - Sistemas, Dados, InformaçãoAula 02 - Sistemas, Dados, Informação
Aula 02 - Sistemas, Dados, Informação
 
Sistema de Informação na Empresa
Sistema de Informação na EmpresaSistema de Informação na Empresa
Sistema de Informação na Empresa
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Aula - Sistemas de Informação
Aula - Sistemas de InformaçãoAula - Sistemas de Informação
Aula - Sistemas de Informação
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Pesquisa Qualitativa: Uma Introdução. Profa. Rilva
Pesquisa Qualitativa: Uma Introdução. Profa. RilvaPesquisa Qualitativa: Uma Introdução. Profa. Rilva
Pesquisa Qualitativa: Uma Introdução. Profa. Rilva
 
Apresentação metodologia da pesquisa
Apresentação   metodologia da pesquisaApresentação   metodologia da pesquisa
Apresentação metodologia da pesquisa
 
Conceitos de Sistemas de Informação
Conceitos de Sistemas de InformaçãoConceitos de Sistemas de Informação
Conceitos de Sistemas de Informação
 

Andere mochten auch

Andere mochten auch (20)

As 10 maiores tendências em business intelligence para 2014
As 10 maiores tendências em business intelligence para 2014As 10 maiores tendências em business intelligence para 2014
As 10 maiores tendências em business intelligence para 2014
 
Dashboards maneiros: Performance
Dashboards maneiros: PerformanceDashboards maneiros: Performance
Dashboards maneiros: Performance
 
Business intelligence com QlikView
Business intelligence com QlikViewBusiness intelligence com QlikView
Business intelligence com QlikView
 
Open Source Business Intelligence
Open Source Business IntelligenceOpen Source Business Intelligence
Open Source Business Intelligence
 
Treinamento Hadoop - dia2
Treinamento Hadoop - dia2Treinamento Hadoop - dia2
Treinamento Hadoop - dia2
 
Trabalho BI Qlikview
Trabalho BI QlikviewTrabalho BI Qlikview
Trabalho BI Qlikview
 
Qmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_PabloQmeeting Conceitos_qlik_sense_Pablo
Qmeeting Conceitos_qlik_sense_Pablo
 
R, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business IntelligenceR, Python, Twitter e Tableau para Business Intelligence
R, Python, Twitter e Tableau para Business Intelligence
 
Qlikview com Google Maps
Qlikview com Google MapsQlikview com Google Maps
Qlikview com Google Maps
 
Tableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativasTableau Drive, Uma nova metodologia para implantações corporativas
Tableau Drive, Uma nova metodologia para implantações corporativas
 
Apresentação SpagoBI
Apresentação SpagoBIApresentação SpagoBI
Apresentação SpagoBI
 
Visual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentasVisual Analytics 101 - Princípios, práticas e ferramentas
Visual Analytics 101 - Princípios, práticas e ferramentas
 
Por que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BIPor que o Microsoft Power BI? Um breve overview sobre BI
Por que o Microsoft Power BI? Um breve overview sobre BI
 
QMeeting / SP - Um Evento de Bi e QlikView para poucos.
QMeeting / SP - Um Evento de Bi e QlikView para poucos. QMeeting / SP - Um Evento de Bi e QlikView para poucos.
QMeeting / SP - Um Evento de Bi e QlikView para poucos.
 
Vixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data AnalyticsVixteam IDEA 9 Data Analytics
Vixteam IDEA 9 Data Analytics
 
Qmeeting SP - Design para Business Intelligence
Qmeeting SP - Design para Business IntelligenceQmeeting SP - Design para Business Intelligence
Qmeeting SP - Design para Business Intelligence
 
QlikBrand
QlikBrandQlikBrand
QlikBrand
 
Brasil, Open Source e o Mundo dos Negócios
Brasil, Open Source e o Mundo dos NegóciosBrasil, Open Source e o Mundo dos Negócios
Brasil, Open Source e o Mundo dos Negócios
 
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner SomativaCaso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 

Ähnlich wie Introdução à Análise de Dados - Aula 01

Aprendizado de Máquina
Aprendizado de MáquinaAprendizado de Máquina
Aprendizado de Máquina
butest
 
Teoria Geral dos Sistemas TGS
Teoria Geral dos Sistemas TGSTeoria Geral dos Sistemas TGS
Teoria Geral dos Sistemas TGS
Luciana Roncarati
 
Aula 7 - Repetição enquanto - exemplos
Aula 7 - Repetição enquanto - exemplosAula 7 - Repetição enquanto - exemplos
Aula 7 - Repetição enquanto - exemplos
Pacc UAB
 

Ähnlich wie Introdução à Análise de Dados - Aula 01 (20)

Engenharia do Conhecimento e Inteligência Artificial - Aula 1/3
Engenharia do Conhecimento e Inteligência Artificial - Aula 1/3Engenharia do Conhecimento e Inteligência Artificial - Aula 1/3
Engenharia do Conhecimento e Inteligência Artificial - Aula 1/3
 
Data Science For Dummies From a Dummy
Data Science For Dummies From a DummyData Science For Dummies From a Dummy
Data Science For Dummies From a Dummy
 
Design da Informação e Visualização de dados
Design da Informação e Visualização de dadosDesign da Informação e Visualização de dados
Design da Informação e Visualização de dados
 
Overview of Data Science e Machine Learning
Overview of Data Science e Machine Learning Overview of Data Science e Machine Learning
Overview of Data Science e Machine Learning
 
EMENTA TI - Ciências Contábeis 2010
EMENTA TI - Ciências Contábeis 2010EMENTA TI - Ciências Contábeis 2010
EMENTA TI - Ciências Contábeis 2010
 
A carreira de cientista de dados para a saúde digital
A carreira de cientista de dados para a saúde digitalA carreira de cientista de dados para a saúde digital
A carreira de cientista de dados para a saúde digital
 
Aprendizado de Máquina
Aprendizado de MáquinaAprendizado de Máquina
Aprendizado de Máquina
 
Introdução a ciência de dados com aplicações em dados educacionais
Introdução a ciência de dados com aplicações em dados educacionaisIntrodução a ciência de dados com aplicações em dados educacionais
Introdução a ciência de dados com aplicações em dados educacionais
 
Direito 1º Período - Marcos Rodrigues Saúde - Informática Aplicada ao Direito...
Direito 1º Período - Marcos Rodrigues Saúde - Informática Aplicada ao Direito...Direito 1º Período - Marcos Rodrigues Saúde - Informática Aplicada ao Direito...
Direito 1º Período - Marcos Rodrigues Saúde - Informática Aplicada ao Direito...
 
Teoria Geral dos Sistemas TGS
Teoria Geral dos Sistemas TGSTeoria Geral dos Sistemas TGS
Teoria Geral dos Sistemas TGS
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Ihc2016.2 aula 0 apresentação da disciplina de IHC
Ihc2016.2 aula 0 apresentação da disciplina de IHCIhc2016.2 aula 0 apresentação da disciplina de IHC
Ihc2016.2 aula 0 apresentação da disciplina de IHC
 
Infovis tutorial
Infovis tutorialInfovis tutorial
Infovis tutorial
 
Big data e data science
Big data e data scienceBig data e data science
Big data e data science
 
aula_met_tec02.pptx
aula_met_tec02.pptxaula_met_tec02.pptx
aula_met_tec02.pptx
 
Aula 7 - Repetição enquanto - exemplos
Aula 7 - Repetição enquanto - exemplosAula 7 - Repetição enquanto - exemplos
Aula 7 - Repetição enquanto - exemplos
 
Introduction to Data Science in IoT Projects.
Introduction to Data Science in IoT Projects.Introduction to Data Science in IoT Projects.
Introduction to Data Science in IoT Projects.
 
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
A Engenharia do Conhecimento e as novas possibilidades de descoberta e dissem...
 
The Data Science Workflow
The Data Science WorkflowThe Data Science Workflow
The Data Science Workflow
 
Desafios da Ciência Digital e Sistemas de Informação para a Pós-Graduação
Desafios da Ciência Digital e Sistemas de Informação para a Pós-GraduaçãoDesafios da Ciência Digital e Sistemas de Informação para a Pós-Graduação
Desafios da Ciência Digital e Sistemas de Informação para a Pós-Graduação
 

Mehr von Alexandre Duarte

Mehr von Alexandre Duarte (20)

Projeto de Experimentos
Projeto de ExperimentosProjeto de Experimentos
Projeto de Experimentos
 
Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de Experimentos
 
Causalidade e Abdução
Causalidade e AbduçãoCausalidade e Abdução
Causalidade e Abdução
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!
 
Atividades Científica
Atividades CientíficaAtividades Científica
Atividades Científica
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como Ciência
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: Introdução
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPB
 
Agrupamento com K-Means
Agrupamento com K-MeansAgrupamento com K-Means
Agrupamento com K-Means
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis Nominais
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2D
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1D
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de Dados
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de Experimentos
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de Surveys
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de Dados
 

Kürzlich hochgeladen

Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptx
TailsonSantos1
 
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxResponde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
AntonioVieira539017
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
sh5kpmr7w7
 
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
PatriciaCaetano18
 

Kürzlich hochgeladen (20)

Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
 
Os editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptxOs editoriais, reportagens e entrevistas.pptx
Os editoriais, reportagens e entrevistas.pptx
 
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxResponde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
M0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptxM0 Atendimento – Definição, Importância .pptx
M0 Atendimento – Definição, Importância .pptx
 
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
Introdução às Funções 9º ano: Diagrama de flexas, Valor numérico de uma funçã...
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.
 
Texto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.pptTexto dramático com Estrutura e exemplos.ppt
Texto dramático com Estrutura e exemplos.ppt
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
 
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
 
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2Estudar, para quê?  Ciência, para quê? Parte 1 e Parte 2
Estudar, para quê? Ciência, para quê? Parte 1 e Parte 2
 
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
 
Pesquisa Ação René Barbier Livro acadêmico
Pesquisa Ação René Barbier Livro  acadêmicoPesquisa Ação René Barbier Livro  acadêmico
Pesquisa Ação René Barbier Livro acadêmico
 
Produção de Texto - 5º ano - CRÔNICA.pptx
Produção de Texto - 5º ano - CRÔNICA.pptxProdução de Texto - 5º ano - CRÔNICA.pptx
Produção de Texto - 5º ano - CRÔNICA.pptx
 
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia TecnologiaPROJETO DE EXTENSÃO I - Radiologia Tecnologia
PROJETO DE EXTENSÃO I - Radiologia Tecnologia
 
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdfRecomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
Recomposiçao em matematica 1 ano 2024 - ESTUDANTE 1ª série.pdf
 
Educação Financeira - Cartão de crédito665933.pptx
Educação Financeira - Cartão de crédito665933.pptxEducação Financeira - Cartão de crédito665933.pptx
Educação Financeira - Cartão de crédito665933.pptx
 
Cartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptxCartão de crédito e fatura do cartão.pptx
Cartão de crédito e fatura do cartão.pptx
 
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIAPROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
PROJETO DE EXTENSÃO I - AGRONOMIA.pdf AGRONOMIAAGRONOMIA
 
aula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.pptaula de bioquímica bioquímica dos carboidratos.ppt
aula de bioquímica bioquímica dos carboidratos.ppt
 

Introdução à Análise de Dados - Aula 01

  • 1. INTRODUÇÃO Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
  • 2. O QUE É CIÊNCIA DOS DADOS?
  • 3. Ciência da Computação ! ! Matemática e Estatística ! ! Ciência dos Dados ! ! ! Domínio de Aplicação Finanças Economia Engenharia Direito Medicina Ciências Sociais Ciências
  • 4. O QUE É CIÊNCIA DOS DADOS? Alto Baixo Coletar, transformar e armazenar dados Mágica 01: gerar informação Mágica 02: apresentar a informação Mágica 03: gerar conhecimento Massageamento de Números (máquina) Intrepretação (humano) Baixo Alto
  • 5. O QUE É CIÊNCIA DOS DADOS? Computação Comunicação / Coletar, transformar e armazenar dados Mágica 01: gerar informação Mágica 02: apresentar a informação Mágica 03: gerar conhecimento Visualização Matemática / Estatística Conhecimento sobre o domínio
  • 6. CIÊNCIA DA COMPUTAÇÃO VS CIÊNCIA DOS DADOS Ciência da Computação Entrada X Função F Saída Y = F(X) Ciência dos Dados Entrada X Saída Y Modelar f tal que Y = f(X) + ɛ
  • 7. USANDO UM MODELO Entradas e Saídas Algoritmo de treinamento Modelo Novas entradas Saídas estimadas
  • 8. “Ciência dos Dados é a ciência que estuda formas de extrair conhecimento generalizável a partir de dados.” –Vasant Dhar Leitura recomendada: ! Data Science and Prediction, Communications of the ACM, Vol. 56 No. 12, Pages 64-73
  • 9. E ONDE ESTÁ A CIÊNCIA NISSO?
  • 10. “Qualquer área que se auto-denomina Ciência não pode ser Ciência.” –Autor desconhecido Leitura recomendada: ! Is computer science science?, Communications of the ACM Vol. 48 No. 4, Pages 27-31 Where is the Science in Computer Science?, Communications of the ACM, Vol. 55 No. 10, Page 5 The Science in Computer Science, Communications of the ACM, Vol. 56 No. 5, Pages 35-38
  • 11. UTILIZAR APRENDIZAGEM DE MÁQUINA NÃO É CIÊNCIA!
  • 13. CIÊNCIA É EXPLORAR E EXPLICAR O DESCONHECIDO! • No caso da Ciência dos Dados, isso significa aprender a fazer as perguntas corretas e a extrair dos dados as respostas adequadas para tais perguntas.
  • 14. O QUE VEREMOS NESTE CURSO • Fundamentação teórica (Tipos de dados e como os dados são geralmente agrupados) • Técnicas para coleta de dados (Formulários, projeto de experimentos e dados públicos) • Técnicas para análise de dados (Sumarização estatística, correlação, regressão linear e agrupamento) • Princípios de visualização de dados
  • 15. O QUE NÃO VEREMOS NESTE CURSO • Técnicas avançadas de aprendizagem de máquina • Técnicas avançadas de análise e modelagem estatística
  • 16. FORMA DE AVALIAÇÃO • Desenvolvimento de um projeto (grupos de até 2 alunos) completo de análise e visualização de dados • 3 etapas: • Plano de pesquisa e planejamento de releases (35%) • Entrega da 1a release (25%) • Entrega da 2a release (40%)
  • 17. TODOS OS PROJETOS DEVERÃO • Oferecer uma interface web • Realizar a coleta, limpeza e análise dos dados de forma (semi-)automática • Exibir de forma interativa e geo-referenciada os resultados obtidos • Considerar a evolução temporal dos resultados
  • 18. FONTES DE DADOS • Só poderão ser utilizadas fontes de dados listadas no site da disciplina • Os alunos podem sugerir novas fontes de dados
  • 19. REFERÊNCIAS • DATA + DESIGN: A simple introduction to preparing and visualizing information. Trina Chiasson et al, 2014. • Core Concepts in Data Analysis: Summarization, Correlation and Visualization. Boris Mirkin, 2011 • The Art of Computer Systems Performance Analysis: Techniques for Experimental Design, Measurement, Simulation, and Modeling. R. Jain, 1991.