O documento discute as principais técnicas de mineração de dados, incluindo classificação, clusterização, associação e sequência. A classificação é usada para prever grupos de objetos, enquanto a clusterização agrupa objetos similares. Associações identificam relacionamentos entre itens e sequências determinam padrões temporais. O documento também discute os desafios da análise de dados, como a necessidade de dados limpos e a explicação de resultados.
1. 1.0 Mineração de
Dados
8.0 Análise de 2.0 Prospecção
Resultados do Conhecimento
7.0 Inteligência 3.0 Técnicas de
Competitiva Data Mining
6.0 Aplicações de
4.0 Data Mining
Data Mining
5.0 SGBD e Data
Mining
1
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 17/5/2012 13:24
2. 3.0 Técnicas de Data Mining
O que é Data mining:
- Data mining (mineração de dados), é o processo de
extração de conhecimento de grandes bases de
dados, convencionais ou não.
- Utiliza técnicas de inteligência artificial que procuram
relações de similaridade ou discordância entre dados.
- Seu objetivo é
encontrar, automaticamente, padrões, anomalias e regras
com o propósito de transformar dados, aparentemente
ocultos, em informações úteis para a tomada de decisão
e/ou avaliação de resultados.
2
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 17/5/2012 13:24
3. - Requer pré/pós-processamentos dos
dados, necessários para assegurar o melhor
aproveitamento da aplicação e a consistência dos
resultados.
Atividades de pré-processamento incluem a
seleção apropriada de subconjuntos de dados, por
razões de desempenho, assim como complexas
transformações de dados que servem de ponte
para o chamado “gap representacional”, separação
entre os dados e seu significado real.
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 3 17/5/2012 13:24
4. Atividades de Pós-processamento envolve a sub
seleção de resultados volumosos e a aplicação de
técnicas de visualização para auxiliar o entendimento.
tais como:
o Alta suscetibilidade a dados “sujos”: as ferramentas
de Data Mining não possuem “parâmetros”, ou
seja, recebe todos os dados. Sendo assim, torna-se
necessário tomar precauções para assegurar que os
dados analisados são “limpos”
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 4 17/5/2012 13:24
5. o Inabilidade para “explicar” resultados em termos
humanos: o volume e formato da informação
encontrada podem ser inúteis sem um
processamento adicional.
o “Gap” representacional: a maior parte das fontes de
dados das aplicações de Data Mining atuais está
armazenada em grandes sistemas relacionais, e
seus dados estão em geral normalizados, com os
atributos espalhados em múltiplas tabelas.
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 5 17/5/2012 13:24
6. Cada classe de aplicação em Data Mining tem como
base um conjunto de algoritmos que serão usados na
extração de relações relevantes dentro de uma massa
de dados.
A proposta da clusterização é basicamente
endereçada a problemas de segmentação. Essa
segmentação é realizada automaticamente por
algoritmos que identificam características em
comum e particionam o espaço n-dimensional
definido pelos atributos.
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 6 17/5/2012 13:24
7. Classificação é uma técnica que consiste na
aplicação de um conjunto de exemplos pré-
classificados para desenvolver um modelo capaz de
classificar uma população maior de registros.
Detecção de fraudes e aplicações de risco são
exemplos de casos em que estes tipos de
análise são bastante apropriados.
Algoritmos de classificação incluem árvores de
decisão ou redes neurais, e começam com um
treinamento a partir de transações-exemplo.
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 7 17/5/2012 13:24
8. Associações
As associações visam determinar relacionamentos
entre conjuntos de itens.
As sequências visam determinar padrões de
ordenação entre dados, tais como ordenação
temporais, ou ordenação de classificação.
A classificação de séries de tempo visa definir grupos
com séries de tempo similares, ou seja, mesmo
padrão de comportamento numa dada fatia de
tempo
Professor: Me. Jones Soares - Disciplina: Mineração de Dados 8 17/5/2012 13:24