SlideShare ist ein Scribd-Unternehmen logo
1 von 16
Data Mining
Autores
Breno Fernandes
(Bren0_fernandes@hotmail.com)
Fabio Pereira
(fabioeletrotec@hotmail.com)

Natal, 14/10/2013

1
Universidade Federal do Rio Grande do Norte (UFRN)
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
Roteiro
•Introdução
•Desenvolvimento
•Conceito.
•Comparações.
•Benefícios.
•Limitações.
•Aplicações.

•Conclusão
•Referência

•Aspectos do projeto.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

2
Introdução
•Princípio: Possuir dados, não é o suficiente, é preciso saber
utilizá-los.
•Os sistemas computacionais iniciaram a era da informação – a
informação é composta por dados.
•A manipulação eficiente de dados, auxilia na tomada de
decisões mais rápidas.
•Na década de 80, surge o conceito de mineração de dados.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

3
Conceito
•O que é Data Mining?

•Em que se baseia?
•Por que se usar?

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

4
Conceito
• Utiliza as seguintes técnicas:
– Classificação.
– Regressão.
– Clustering.
– Regras de associação.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

5
Conceitos
• Classificação:
– Construção de um modelo de dados através de uma curva de
aprendizado e valores de atributos classificadores que
permitem determinar novas classes de dados.
Job
Engineer

Carpenter

Income
<30K

Bad

>50K

Good

Income
<40K

Bad

>90K

Good

Doctor

Income
>100K

<50K

Bad

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

Good

6
Conceitos

• Clustering
– Através dessa ferramenta podemos separar em dois grupos
todas os nossos dados, o primeiro grupo é composto daqueles
que são similares entre sim(alocamos no mesmo cluster) e os
que não são similares(alocados em outro cluster).

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

7
Conceitos

• Regressão
– Através de uma gama de dados podemos traçar uma função de
aprendizado que mapeia de forma os nosso dados.
– A partir desses dados podemos traçar a melhor curva que
representa essa função.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

8
Conceitos
• Regras de associação.
– Através da analise do nosso banco de dados encontra padrões
frequentes e correlações podemos definir regras que regem o
acesso aos dados presentes no nosso banco.
– Cria regras que descrevem como eventos diferentes ocorrem
dependentes do outro.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

9
Comparação entre modelos
• Sistema de gerenciamento de banco de dados – SGBD
- Tem como função organizar e manipular os dados.
- Utiliza apenas palavras chave para encontrar os dados desejados.
- Retorna todos os resultados possíveis.

• Data Warehouse
- Trata grandes volumes de dados.
- Normalmente aplicado a sistemas transacionais.
- Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos.

• Data Mining
- Trata grandes volumes de dados.
- Trabalha com bancos dinâmicos.
- Tem como função desconsiderar padrões específicos para conseguir criar
padrões genéricos.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

10
Benefícios
• Necessidade acessar informação da ordem de Peta.
• Permite atribuir informação a um conjunto de dados existente.
• Conjuntos de informações antigas podem ser utilizadas para gerar
novos dados.
• Através do Data Mining as empresas podem prestar serviços com
maior qualidade e direcionamento aos seus clientes.
• Não possui limitação de aplicação, partindo desde o mundo de
P&D até aplicações em mercado, industria e saúde.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

11
Limitações
• Necessita de parâmetros-guia adequados.
– Caso contrário, o processo se torna lento.

• Necessita de um banco de dados altamente confiável.
– Sem redundâncias

• Custo para implementação é relativamente alto.
– Devido ao custo das ferramentas utilizadas na mineração.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

12
Aplicações

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

13
Conclusão
• A quantidade de dados só tende a crescer com o surgimento de
novas tecnologias.

• Cada vez mais será necessário a presença de ferramentas
como o Data Mining.
• Em telecomunicações não será diferente visto a presença de
sistemas smarts, estes que exigem uma grande carga de
metadados.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

14
Bibliografia
• Camilo, Cássio O.; Silva, João C.; Mineração de dados:
conceitos, tarefas, métodos e ferramentas. UFG, 2009.
• Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do
conhecimento usando Data Mining. FGV,2007.
• Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração
de dados. PUC-Rio, 2002.
• Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um
guia prático. Ed. Campus.
• Navega, Sérgio. Princípios essenciais do data mining.
Infoimagem, 2002.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

15
Muito obrigado pela atenção 

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

16

Weitere ähnliche Inhalte

Andere mochten auch (11)

Terborgseweg-2-nov-2016 - kopie
Terborgseweg-2-nov-2016 - kopieTerborgseweg-2-nov-2016 - kopie
Terborgseweg-2-nov-2016 - kopie
 
Aula produção
Aula produçãoAula produção
Aula produção
 
SK asisten dosen
SK asisten dosenSK asisten dosen
SK asisten dosen
 
ISO 9001 ENG
ISO 9001 ENGISO 9001 ENG
ISO 9001 ENG
 
O que é o design parte 1
O que é o design  parte 1O que é o design  parte 1
O que é o design parte 1
 
Appetite Stimulants in Cancer Patients
Appetite Stimulants in Cancer PatientsAppetite Stimulants in Cancer Patients
Appetite Stimulants in Cancer Patients
 
cv
cvcv
cv
 
Arquivos nas nuvens
Arquivos nas nuvensArquivos nas nuvens
Arquivos nas nuvens
 
морозиво (1)
морозиво (1)морозиво (1)
морозиво (1)
 
Plan
PlanPlan
Plan
 
Mintzberg's Power School
Mintzberg's Power School Mintzberg's Power School
Mintzberg's Power School
 

Ähnlich wie Data Mining

1 noções básicas de transmissão e meios físicos de rede
1 noções básicas de transmissão e meios físicos de rede1 noções básicas de transmissão e meios físicos de rede
1 noções básicas de transmissão e meios físicos de redeEdmir Tavares de Arruda Junior
 
Apostila redes locais de computadores
Apostila redes locais de computadoresApostila redes locais de computadores
Apostila redes locais de computadoresfernandao777
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Aula01 - conceitos iniciais de infraestrura de redes
Aula01 -  conceitos iniciais de infraestrura de redesAula01 -  conceitos iniciais de infraestrura de redes
Aula01 - conceitos iniciais de infraestrura de redesCarlos Veiga
 
Apresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesApresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesBruno Lins Alves
 
Questões de Informática Comentadas para Concurso do INSS
Questões de Informática Comentadas para Concurso do INSSQuestões de Informática Comentadas para Concurso do INSS
Questões de Informática Comentadas para Concurso do INSSEstratégia Concursos
 
Informática – inf 1 unidade 1
Informática – inf 1 unidade 1Informática – inf 1 unidade 1
Informática – inf 1 unidade 1Rita Porfirio Cunha
 
Mini-curso: Grades e nuvens
Mini-curso: Grades e nuvensMini-curso: Grades e nuvens
Mini-curso: Grades e nuvensDeivid Martins
 
CONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECCONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECJúlio César Magro
 
Report - Network Design - CEFET / IFAL.
Report - Network Design - CEFET / IFAL.Report - Network Design - CEFET / IFAL.
Report - Network Design - CEFET / IFAL.Michel Alves
 
Aula01 conceitos iniciais de infraestrura de redes
Aula01   conceitos iniciais de infraestrura de redesAula01   conceitos iniciais de infraestrura de redes
Aula01 conceitos iniciais de infraestrura de redesCarlos Veiga
 
Apostila sistemas de conectividade
Apostila sistemas de conectividadeApostila sistemas de conectividade
Apostila sistemas de conectividadefernandao777
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosFrancisco Oliveira
 
SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5Ad Souza Jr
 
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, BrazilResearch Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, BrazilHeron Carvalho
 
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRio Info
 

Ähnlich wie Data Mining (20)

1 noções básicas de transmissão e meios físicos de rede
1 noções básicas de transmissão e meios físicos de rede1 noções básicas de transmissão e meios físicos de rede
1 noções básicas de transmissão e meios físicos de rede
 
Apresentação setel
Apresentação setelApresentação setel
Apresentação setel
 
Apostila redes locais de computadores
Apostila redes locais de computadoresApostila redes locais de computadores
Apostila redes locais de computadores
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
CHQAO - GTI Unid 02.pdf
CHQAO - GTI Unid 02.pdfCHQAO - GTI Unid 02.pdf
CHQAO - GTI Unid 02.pdf
 
Aula01 - conceitos iniciais de infraestrura de redes
Aula01 -  conceitos iniciais de infraestrura de redesAula01 -  conceitos iniciais de infraestrura de redes
Aula01 - conceitos iniciais de infraestrura de redes
 
Apresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesApresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e Telecomunicações
 
Questões de Informática Comentadas para Concurso do INSS
Questões de Informática Comentadas para Concurso do INSSQuestões de Informática Comentadas para Concurso do INSS
Questões de Informática Comentadas para Concurso do INSS
 
Informática – inf 1 unidade 1
Informática – inf 1 unidade 1Informática – inf 1 unidade 1
Informática – inf 1 unidade 1
 
Mini-curso: Grades e nuvens
Mini-curso: Grades e nuvensMini-curso: Grades e nuvens
Mini-curso: Grades e nuvens
 
CONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECCONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MEC
 
Report - Network Design - CEFET / IFAL.
Report - Network Design - CEFET / IFAL.Report - Network Design - CEFET / IFAL.
Report - Network Design - CEFET / IFAL.
 
Aula01 conceitos iniciais de infraestrura de redes
Aula01   conceitos iniciais de infraestrura de redesAula01   conceitos iniciais de infraestrura de redes
Aula01 conceitos iniciais de infraestrura de redes
 
Apostila sistemas de conectividade
Apostila sistemas de conectividadeApostila sistemas de conectividade
Apostila sistemas de conectividade
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5
 
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, BrazilResearch Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
 
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
 
Scratch - Ensinar a programar de forma divertida
Scratch - Ensinar a programar de forma divertidaScratch - Ensinar a programar de forma divertida
Scratch - Ensinar a programar de forma divertida
 
PETIC SEAD/SE 2.0
PETIC SEAD/SE 2.0PETIC SEAD/SE 2.0
PETIC SEAD/SE 2.0
 

Data Mining

  • 1. Data Mining Autores Breno Fernandes (Bren0_fernandes@hotmail.com) Fabio Pereira (fabioeletrotec@hotmail.com) Natal, 14/10/2013 1 Universidade Federal do Rio Grande do Norte (UFRN) Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
  • 3. Introdução •Princípio: Possuir dados, não é o suficiente, é preciso saber utilizá-los. •Os sistemas computacionais iniciaram a era da informação – a informação é composta por dados. •A manipulação eficiente de dados, auxilia na tomada de decisões mais rápidas. •Na década de 80, surge o conceito de mineração de dados. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 3
  • 4. Conceito •O que é Data Mining? •Em que se baseia? •Por que se usar? Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 4
  • 5. Conceito • Utiliza as seguintes técnicas: – Classificação. – Regressão. – Clustering. – Regras de associação. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 5
  • 6. Conceitos • Classificação: – Construção de um modelo de dados através de uma curva de aprendizado e valores de atributos classificadores que permitem determinar novas classes de dados. Job Engineer Carpenter Income <30K Bad >50K Good Income <40K Bad >90K Good Doctor Income >100K <50K Bad Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN Good 6
  • 7. Conceitos • Clustering – Através dessa ferramenta podemos separar em dois grupos todas os nossos dados, o primeiro grupo é composto daqueles que são similares entre sim(alocamos no mesmo cluster) e os que não são similares(alocados em outro cluster). Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 7
  • 8. Conceitos • Regressão – Através de uma gama de dados podemos traçar uma função de aprendizado que mapeia de forma os nosso dados. – A partir desses dados podemos traçar a melhor curva que representa essa função. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 8
  • 9. Conceitos • Regras de associação. – Através da analise do nosso banco de dados encontra padrões frequentes e correlações podemos definir regras que regem o acesso aos dados presentes no nosso banco. – Cria regras que descrevem como eventos diferentes ocorrem dependentes do outro. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 9
  • 10. Comparação entre modelos • Sistema de gerenciamento de banco de dados – SGBD - Tem como função organizar e manipular os dados. - Utiliza apenas palavras chave para encontrar os dados desejados. - Retorna todos os resultados possíveis. • Data Warehouse - Trata grandes volumes de dados. - Normalmente aplicado a sistemas transacionais. - Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos. • Data Mining - Trata grandes volumes de dados. - Trabalha com bancos dinâmicos. - Tem como função desconsiderar padrões específicos para conseguir criar padrões genéricos. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 10
  • 11. Benefícios • Necessidade acessar informação da ordem de Peta. • Permite atribuir informação a um conjunto de dados existente. • Conjuntos de informações antigas podem ser utilizadas para gerar novos dados. • Através do Data Mining as empresas podem prestar serviços com maior qualidade e direcionamento aos seus clientes. • Não possui limitação de aplicação, partindo desde o mundo de P&D até aplicações em mercado, industria e saúde. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 11
  • 12. Limitações • Necessita de parâmetros-guia adequados. – Caso contrário, o processo se torna lento. • Necessita de um banco de dados altamente confiável. – Sem redundâncias • Custo para implementação é relativamente alto. – Devido ao custo das ferramentas utilizadas na mineração. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 12
  • 13. Aplicações Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 13
  • 14. Conclusão • A quantidade de dados só tende a crescer com o surgimento de novas tecnologias. • Cada vez mais será necessário a presença de ferramentas como o Data Mining. • Em telecomunicações não será diferente visto a presença de sistemas smarts, estes que exigem uma grande carga de metadados. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 14
  • 15. Bibliografia • Camilo, Cássio O.; Silva, João C.; Mineração de dados: conceitos, tarefas, métodos e ferramentas. UFG, 2009. • Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do conhecimento usando Data Mining. FGV,2007. • Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração de dados. PUC-Rio, 2002. • Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um guia prático. Ed. Campus. • Navega, Sérgio. Princípios essenciais do data mining. Infoimagem, 2002. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 15
  • 16. Muito obrigado pela atenção  Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 16