1. Data Mining
Autores
Breno Fernandes
(Bren0_fernandes@hotmail.com)
Fabio Pereira
(fabioeletrotec@hotmail.com)
Natal, 14/10/2013
1
Universidade Federal do Rio Grande do Norte (UFRN)
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
3. Introdução
•Princípio: Possuir dados, não é o suficiente, é preciso saber
utilizá-los.
•Os sistemas computacionais iniciaram a era da informação – a
informação é composta por dados.
•A manipulação eficiente de dados, auxilia na tomada de
decisões mais rápidas.
•Na década de 80, surge o conceito de mineração de dados.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
3
4. Conceito
•O que é Data Mining?
•Em que se baseia?
•Por que se usar?
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
4
5. Conceito
• Utiliza as seguintes técnicas:
– Classificação.
– Regressão.
– Clustering.
– Regras de associação.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
5
6. Conceitos
• Classificação:
– Construção de um modelo de dados através de uma curva de
aprendizado e valores de atributos classificadores que
permitem determinar novas classes de dados.
Job
Engineer
Carpenter
Income
<30K
Bad
>50K
Good
Income
<40K
Bad
>90K
Good
Doctor
Income
>100K
<50K
Bad
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
Good
6
7. Conceitos
• Clustering
– Através dessa ferramenta podemos separar em dois grupos
todas os nossos dados, o primeiro grupo é composto daqueles
que são similares entre sim(alocamos no mesmo cluster) e os
que não são similares(alocados em outro cluster).
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
7
8. Conceitos
• Regressão
– Através de uma gama de dados podemos traçar uma função de
aprendizado que mapeia de forma os nosso dados.
– A partir desses dados podemos traçar a melhor curva que
representa essa função.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
8
9. Conceitos
• Regras de associação.
– Através da analise do nosso banco de dados encontra padrões
frequentes e correlações podemos definir regras que regem o
acesso aos dados presentes no nosso banco.
– Cria regras que descrevem como eventos diferentes ocorrem
dependentes do outro.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
9
10. Comparação entre modelos
• Sistema de gerenciamento de banco de dados – SGBD
- Tem como função organizar e manipular os dados.
- Utiliza apenas palavras chave para encontrar os dados desejados.
- Retorna todos os resultados possíveis.
• Data Warehouse
- Trata grandes volumes de dados.
- Normalmente aplicado a sistemas transacionais.
- Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos.
• Data Mining
- Trata grandes volumes de dados.
- Trabalha com bancos dinâmicos.
- Tem como função desconsiderar padrões específicos para conseguir criar
padrões genéricos.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
10
11. Benefícios
• Necessidade acessar informação da ordem de Peta.
• Permite atribuir informação a um conjunto de dados existente.
• Conjuntos de informações antigas podem ser utilizadas para gerar
novos dados.
• Através do Data Mining as empresas podem prestar serviços com
maior qualidade e direcionamento aos seus clientes.
• Não possui limitação de aplicação, partindo desde o mundo de
P&D até aplicações em mercado, industria e saúde.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
11
12. Limitações
• Necessita de parâmetros-guia adequados.
– Caso contrário, o processo se torna lento.
• Necessita de um banco de dados altamente confiável.
– Sem redundâncias
• Custo para implementação é relativamente alto.
– Devido ao custo das ferramentas utilizadas na mineração.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
12
14. Conclusão
• A quantidade de dados só tende a crescer com o surgimento de
novas tecnologias.
• Cada vez mais será necessário a presença de ferramentas
como o Data Mining.
• Em telecomunicações não será diferente visto a presença de
sistemas smarts, estes que exigem uma grande carga de
metadados.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
14
15. Bibliografia
• Camilo, Cássio O.; Silva, João C.; Mineração de dados:
conceitos, tarefas, métodos e ferramentas. UFG, 2009.
• Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do
conhecimento usando Data Mining. FGV,2007.
• Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração
de dados. PUC-Rio, 2002.
• Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um
guia prático. Ed. Campus.
• Navega, Sérgio. Princípios essenciais do data mining.
Infoimagem, 2002.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
15
16. Muito obrigado pela atenção
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
16