SlideShare ist ein Scribd-Unternehmen logo
1 von 7
A informática deu-nos a capacidade de ter acesso a grandes volumes de dados. Insondáveis quantidades de dados são captados diariamente de forma sistemática, com segundas, terceiras e quartas intenções.
O fato de termos tão grandiosas bases de dados armazenadas em diversos servidores ao redor do mundo, permitiu-nos ficar livres de pilhas e mais pilhas de livros e volumes enciclopédicos.  Além desse aspecto físico, trouxe-nos o benefício do acesso a inúmeras ferramentas de Busca, estendendo a nossa compreensão da sua utilização, bem como ampliando suas aplicabilidades com o seu respectivo amadurecimento.
Data Mining - É a prospecção de dados ou a mineração de dados. É o processo de explorar grandes volumes de dados à procura de padrões consistentes. Estas podem ser regras de associação ou mesmo seqüências temporais. Ao detectar tais relacionamentos sistemáticos entre variáveis, detectamos também novos subconjuntos de dados. O Data Mining é uma das recentes novidades da Ciência da Computação, a qual certamente veio para ficar. Não existe forma mais nobre de utilizar esses vastos repositórios de dados do que  descobrir se há algum conhecimento escondido neles, através da busca por padrões.
Etapas da Mineração de Dados Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc.) consistem de uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc.). Disto nascem os repositórios organizados (Data Marts e Data Warehouses).
É a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa e freqüentemente usando visualização gráfica, um analista refina e conduz o processo até que os padrões apareçam. Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado.
Encontrar padrões requer que os dados brutos sejam sistematicamente "simplificados" de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico. Faz-se isso porque não parece haver muito conhecimento a extrair de eventos isolados. Uma loja de sua rede que tenha vendido a um cliente uma quantidade impressionante de um determinado produto em uma única data pode apenas significar que esse cliente em particular procurava grande quantidade desse produto naquele exato momento. Mas isso provavelmente não indica nenhuma tendência de mercado.

Weitere ähnliche Inhalte

Ähnlich wie Data Mining

Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
Talita Lima
 
Desenhar o conceito de data warehouse numa biblioteca da universidade
Desenhar o conceito de data warehouse numa biblioteca da universidadeDesenhar o conceito de data warehouse numa biblioteca da universidade
Desenhar o conceito de data warehouse numa biblioteca da universidade
Aristidis Jesus
 
Capitulo 04 sofisticados sistemas para buscar informações
Capitulo 04  sofisticados sistemas para buscar informaçõesCapitulo 04  sofisticados sistemas para buscar informações
Capitulo 04 sofisticados sistemas para buscar informações
Luciano Morato
 

Ähnlich wie Data Mining (20)

Dataminig
DataminigDataminig
Dataminig
 
Data mining
Data miningData mining
Data mining
 
Exploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olapExploracao datawarehouse mineracao_de_dados_ou_olap
Exploracao datawarehouse mineracao_de_dados_ou_olap
 
Data warehousing
Data warehousingData warehousing
Data warehousing
 
Wperformance 2015 (2)
Wperformance   2015 (2)Wperformance   2015 (2)
Wperformance 2015 (2)
 
Aula 02.1 FSI - Terminologia da Informática e Sistemas de Informação - os ele...
Aula 02.1 FSI - Terminologia da Informática e Sistemas de Informação - os ele...Aula 02.1 FSI - Terminologia da Informática e Sistemas de Informação - os ele...
Aula 02.1 FSI - Terminologia da Informática e Sistemas de Informação - os ele...
 
Aula 02.1 - Terminologia da informática e sistemas de informação- os elemento...
Aula 02.1 - Terminologia da informática e sistemas de informação- os elemento...Aula 02.1 - Terminologia da informática e sistemas de informação- os elemento...
Aula 02.1 - Terminologia da informática e sistemas de informação- os elemento...
 
Aula Data Mining
Aula Data MiningAula Data Mining
Aula Data Mining
 
Weka pentaho day2014-fidelis
Weka pentaho day2014-fidelisWeka pentaho day2014-fidelis
Weka pentaho day2014-fidelis
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
Data mining
Data miningData mining
Data mining
 
Inteligencia de negócios
Inteligencia de negóciosInteligencia de negócios
Inteligencia de negócios
 
Gestão de Dados de Pesquisa e o Papel dos Bibliotecários
Gestão de Dados de Pesquisa e o Papel dos BibliotecáriosGestão de Dados de Pesquisa e o Papel dos Bibliotecários
Gestão de Dados de Pesquisa e o Papel dos Bibliotecários
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
Data mining
Data miningData mining
Data mining
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Desenhar o conceito de data warehouse numa biblioteca da universidade
Desenhar o conceito de data warehouse numa biblioteca da universidadeDesenhar o conceito de data warehouse numa biblioteca da universidade
Desenhar o conceito de data warehouse numa biblioteca da universidade
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
 
GICAula3.ppt
GICAula3.pptGICAula3.ppt
GICAula3.ppt
 
Capitulo 04 sofisticados sistemas para buscar informações
Capitulo 04  sofisticados sistemas para buscar informaçõesCapitulo 04  sofisticados sistemas para buscar informações
Capitulo 04 sofisticados sistemas para buscar informações
 

Mehr von André Luiz Bernardes

Mehr von André Luiz Bernardes (20)

22.11.23 - 2022 - Top 20 Principais Vacinas com base na Receita Total.pdf
22.11.23 - 2022 - Top 20 Principais Vacinas com base na Receita Total.pdf22.11.23 - 2022 - Top 20 Principais Vacinas com base na Receita Total.pdf
22.11.23 - 2022 - Top 20 Principais Vacinas com base na Receita Total.pdf
 
22.11.23 - 2022 - Top 20 Principais Anticorpos Monoclonais com base na Receit...
22.11.23 - 2022 - Top 20 Principais Anticorpos Monoclonais com base na Receit...22.11.23 - 2022 - Top 20 Principais Anticorpos Monoclonais com base na Receit...
22.11.23 - 2022 - Top 20 Principais Anticorpos Monoclonais com base na Receit...
 
22.11.23 - 2022 - Top 20 Principais Países em Inovação em Saúde.pdf
22.11.23 - 2022 - Top 20 Principais Países em Inovação em Saúde.pdf22.11.23 - 2022 - Top 20 Principais Países em Inovação em Saúde.pdf
22.11.23 - 2022 - Top 20 Principais Países em Inovação em Saúde.pdf
 
22.11.23 - 2022 - Top 20 Principais Empresas Nutracêuticas com Base na Receit...
22.11.23 - 2022 - Top 20 Principais Empresas Nutracêuticas com Base na Receit...22.11.23 - 2022 - Top 20 Principais Empresas Nutracêuticas com Base na Receit...
22.11.23 - 2022 - Top 20 Principais Empresas Nutracêuticas com Base na Receit...
 
22.11.23 - 2022 - Top 20 Principais Inovadoras de Terapia Digital.pdf
22.11.23 - 2022 - Top 20 Principais Inovadoras de Terapia Digital.pdf22.11.23 - 2022 - Top 20 Principais Inovadoras de Terapia Digital.pdf
22.11.23 - 2022 - Top 20 Principais Inovadoras de Terapia Digital.pdf
 
22.11.23 - 2022 - Top 20 Principais que Gastam em Pesquisa e Desenvolvimento.pdf
22.11.23 - 2022 - Top 20 Principais que Gastam em Pesquisa e Desenvolvimento.pdf22.11.23 - 2022 - Top 20 Principais que Gastam em Pesquisa e Desenvolvimento.pdf
22.11.23 - 2022 - Top 20 Principais que Gastam em Pesquisa e Desenvolvimento.pdf
 
22.11.23 - 2022 - Top 20 Principais de Imunologia com base na Receita Total d...
22.11.23 - 2022 - Top 20 Principais de Imunologia com base na Receita Total d...22.11.23 - 2022 - Top 20 Principais de Imunologia com base na Receita Total d...
22.11.23 - 2022 - Top 20 Principais de Imunologia com base na Receita Total d...
 
22.11.23 - 2022 - Top 20 Principais Empresas Farmacêuticas de Genéricos com b...
22.11.23 - 2022 - Top 20 Principais Empresas Farmacêuticas de Genéricos com b...22.11.23 - 2022 - Top 20 Principais Empresas Farmacêuticas de Genéricos com b...
22.11.23 - 2022 - Top 20 Principais Empresas Farmacêuticas de Genéricos com b...
 
5 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
5 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...5 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
5 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
 
4 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
4 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...4 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
4 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
 
3 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
3 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...3 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
3 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
 
2 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
2 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...2 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
2 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
 
0 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
0 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...0 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
0 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
 
1 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
1 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...1 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
1 - Qual é a diferença entre Inteligência Artificial, Aprendizagem de Máquina...
 
O que é Deep Learning?
O que é Deep Learning?O que é Deep Learning?
O que é Deep Learning?
 
Roche - Top 10 Pharmaceutical Companies 2018
Roche - Top 10 Pharmaceutical Companies 2018Roche - Top 10 Pharmaceutical Companies 2018
Roche - Top 10 Pharmaceutical Companies 2018
 
Sanofi - Top 10 Pharmaceutical Companies 2018
Sanofi - Top 10 Pharmaceutical Companies 2018Sanofi - Top 10 Pharmaceutical Companies 2018
Sanofi - Top 10 Pharmaceutical Companies 2018
 
MSD | Merck - Top 10 Pharmaceutical Companies 2018
MSD | Merck - Top 10 Pharmaceutical Companies 2018MSD | Merck - Top 10 Pharmaceutical Companies 2018
MSD | Merck - Top 10 Pharmaceutical Companies 2018
 
Brazil sfe-company-novartis-top-10-pharmaceutical-companies-2018-andre-luiz-b...
Brazil sfe-company-novartis-top-10-pharmaceutical-companies-2018-andre-luiz-b...Brazil sfe-company-novartis-top-10-pharmaceutical-companies-2018-andre-luiz-b...
Brazil sfe-company-novartis-top-10-pharmaceutical-companies-2018-andre-luiz-b...
 
Gilead - Top 10 Pharmaceutical Companies 2018
Gilead - Top 10 Pharmaceutical Companies 2018Gilead - Top 10 Pharmaceutical Companies 2018
Gilead - Top 10 Pharmaceutical Companies 2018
 

Kürzlich hochgeladen

Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
Natalia Granato
 

Kürzlich hochgeladen (6)

ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
Assessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdfAssessement Boas Praticas em Kubernetes.pdf
Assessement Boas Praticas em Kubernetes.pdf
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 

Data Mining

  • 1.
  • 2. A informática deu-nos a capacidade de ter acesso a grandes volumes de dados. Insondáveis quantidades de dados são captados diariamente de forma sistemática, com segundas, terceiras e quartas intenções.
  • 3. O fato de termos tão grandiosas bases de dados armazenadas em diversos servidores ao redor do mundo, permitiu-nos ficar livres de pilhas e mais pilhas de livros e volumes enciclopédicos. Além desse aspecto físico, trouxe-nos o benefício do acesso a inúmeras ferramentas de Busca, estendendo a nossa compreensão da sua utilização, bem como ampliando suas aplicabilidades com o seu respectivo amadurecimento.
  • 4. Data Mining - É a prospecção de dados ou a mineração de dados. É o processo de explorar grandes volumes de dados à procura de padrões consistentes. Estas podem ser regras de associação ou mesmo seqüências temporais. Ao detectar tais relacionamentos sistemáticos entre variáveis, detectamos também novos subconjuntos de dados. O Data Mining é uma das recentes novidades da Ciência da Computação, a qual certamente veio para ficar. Não existe forma mais nobre de utilizar esses vastos repositórios de dados do que  descobrir se há algum conhecimento escondido neles, através da busca por padrões.
  • 5. Etapas da Mineração de Dados Os passos fundamentais de uma mineração bem sucedida a partir de fontes de dados (bancos de dados, relatórios, logs de acesso, transações, etc.) consistem de uma limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias, etc.). Disto nascem os repositórios organizados (Data Marts e Data Warehouses).
  • 6. É a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. Tipicamente, este processo não é o final da história: de forma interativa e freqüentemente usando visualização gráfica, um analista refina e conduz o processo até que os padrões apareçam. Observe que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado.
  • 7. Encontrar padrões requer que os dados brutos sejam sistematicamente "simplificados" de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico. Faz-se isso porque não parece haver muito conhecimento a extrair de eventos isolados. Uma loja de sua rede que tenha vendido a um cliente uma quantidade impressionante de um determinado produto em uma única data pode apenas significar que esse cliente em particular procurava grande quantidade desse produto naquele exato momento. Mas isso provavelmente não indica nenhuma tendência de mercado.