SlideShare ist ein Scribd-Unternehmen logo
1 von 61
Downloaden Sie, um offline zu lesen
Sistema Imunológico Artificial para
Predição de Fraudes e Furtos de
Energia Elétrica
Dissertação de Mestrado
Mauricio Volkweis Astiazara
Prof. Dr. Dante Augusto Couto Barone
Orientador
Porto Alegre, junho de 2012
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Sistema Imunológico Artificial
Sistema Imunológico Natural
Possíveis Aplicações
RECONHECIMENTO DE PADRÕES
VIDA ARTIFICIAL
MÉTODOS DE BUSCA E OTIMIZAÇÃO
CONTROLE E NAVEGAÇÃO AUTÔNOMA
APRENDIZAGEM DE MÁQUINA
ALOCAÇÃO DE TAREFAS
SISTEMAS BASEADOS EM AGENTES
CLASSIFICAÇÃO
MINERAÇÃO DE DADOS
DETECÇÃO DE ANOMALIAS E FALHAS
Motivação
● SIA ainda não está tão difundido quanto
outras áreas;
● Muitos trabalhos utilizando toy problems;
● Qual a eficácia de um Sistema
Imunológico Artificial aplicado a um
problema real?
Motivação
● Como seria a sua modelagem e
adaptação ao problema de um domínio
específico?
● E como ficaria seu desempenho
comparado aos algoritmos mais
tradicionais?
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Fraudes e Furtos de Energia
Elétrica
Fraudes e Furtos de Energia
Elétrica
● Exemplos de perdas não técnicas:
● furtos de energia,
● erros de medição,
● erros no processo de faturamento,
● consumidores sem equipamento de medição
● etc.
● ANEEL apontou em 2007 que as perdas
não técnicas correspondem a 5 bilhões de
reais anuais no país.
Como funciona o Faturamento de
Energia Elétrica?
Como funciona o Faturamento de
Energia Elétrica?
Unidade
Consumidora
Rede Elétrica
Medidor
Fraude
Unidade
Consumidora
Rede Elétrica
Medidor
Fraude
Furto 1
Consumidor
Não Cadastrado
Rede Elétrica
Furto 2
Unidade
Consumidora
Rede Elétrica
Medidor
Como combater Fraudes e Furtos?
Como combater Fraudes e Furtos?
A Ideia
Utilizar um algoritmo de
Sistema Imunológico Artificial
para predizer consumidores
fraudadores baseados nos
seus dados.
A CEEE-D
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Conjunto de Dados
● Dados de consumidores reais de uma
cidade específica;
● Inicialmente a proporção era irreal e
alguns atributos não podiam ser usados;
● O conjunto final ficou com 19 atributos
incluindo o rótulo.
Conjunto de Dados
854
54
Conjunto de Dados
● tipo_cliente;
● classe;
● fases
● pessoa_fisica_juridica
● rotatividade_titularidade
● carga_declarada
● teve_corte
● possui_debito_automatico
● osc_consumo
● irregularidade_leitura01
● irregularidade_leitura03
● irregularidade_leitura04
● irregularidade_leitura09
● irregularidade_leitura25
● irregularidade_leitura26
● irregularidade_leitura43
● irregularidade_leitura44
● irregularidade_leitura50
● resultado
Projeto
Domínio do Problema
Sistema
Imunológico
Artificial
Representação
Métricas de Afinidade
Algoritmos Imunológicos
Solução
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Modelos
Modelos
Consumidor:
array de
atributos
Modelos
Detector:
array de
atributos
Consumidor:
array de
atributos
Modelos
Detector:
array de
atributos
Afinidade:
similaridade
(distância)
Consumidor:
array de
atributos
Algoritmo
Algoritmo
Gerar uma
população
randômica
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clones
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clones
Melhor indivíduo
tem afinidade >
limiar?
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clones
Melhor indivíduo
tem afinidade >
limiar?
NãoNão
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clones
Melhor indivíduo
tem afinidade >
limiar?
Adicioná-lo à lista
de células de
memória
SimSim
NãoNão
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clones
Melhor indivíduo
tem afinidade >
limiar?
Adicioná-lo à lista
de células de
memória
Substituir piores
indivíduos por
novos
randômicos
NãoNão
SimSim
Algoritmo
Gerar uma
população
randômica
Apresentar
antígeno à
população
Reproduzir os
melhores e realizar
mutação nos clones
Melhor indivíduo
tem afinidade >
limiar?
Adicioná-lo à lista
de células de
memória
Substituir piores
indivíduos por
novos
randômicos
NãoNão
Próximo
antígeno
SimSim
Utilização do Classificador
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Metodologia de Validação
● Objetivos:
● Avaliar se o SIA consegue predizer os
consumidores desonestos: Ganho em
Precisão;
● Avaliar a eficácia: Medida-F;
● Avaliar a eficácia em relação a outros
métodos: Comparação com outros
algoritmos.
Medida-F
0 20 40 60 80 100
0
20
40
60
80
100
Recall
Precisão
Metodologia de Validação
● Foram realizadas 10 Validações Cruzadas
Deixando Um de Fora;
● Foram calculados a Média, Desvio Padrão
e Intervalo de Confiança.
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Resultados Experimentais
Métrica Média Desvio
Padrão
Intervalo de
Confiança
(nível 95%)
Precisão 14,00% 0,86 [13,47%,
14,43%]
Recall 72,04% 4,32 [69,36%,
74,71%]
Medida-F 23,44% 1,41 [22,56%,
24,31%]
Resultados Experimentais
● A precisão randômica da amostra é
5,95%;
● O ganho em precisão do classificador
ficou em 2,35.
Comparação com Outros Algoritmos
# Algoritmo Precisão Recall Medida-F
1 Clonalg (SIA) 13,07% 71,93% 23,39%
2 Naive Bayes 10,6% 94,44% 19,07%
3 Voting feature
intervals
10,25% 90,74% 18,42%
4 KNN (K=1) 14,55% 14,81% 14,68%
5 RandomTree 10,64% 9,26% 9,9%
6 RandomForest 12,5% 3,7% 5,71%
Comparação com Outros Algoritmos
0 10 20 30 40 50 60 70 80 90 100
0
10
20
30
40
50
60
Recall
Precisão
SIASIA
Sumário
● Introdução
● Fraudes e Furtos de Energia Elétrica
● Modelo Proposto
● Metodologia de Validação
● Análise de Resultados
● Conclusões e Sugestões de Trabalhos
Futuros
Conclusões (1 de 2)
● Diferente de outros trabalhos, este utilizou
métrica que faz sentido no contexto do
negócio em vez da acurácia de maneira
simplista;
● O SIA conseguiu aprender o conceito de
consumidor desonesto;
● Em termos de medida-F, o SIA ficou em
primeiro lugar.
Conclusões (2 de 2)
● SIA deve ser considerado um candidato
em potencial para resolver problemas de
classificação;
● Os algoritmos de classificação utilizados
poderão produzir resultados melhores
com uma parametrização adequada.
Sugestões de Trabalhos Futuros
● Algoritmos de seleção de atributos;
● Explorar outras medidas de distância para
dados categóricos;
● Uso do histórico de consumo poderia ser
melhorado (série temporal);
● Simplificação da parametrização.
Continuidade do Trabalho na CEEE
● Primeiros resultados com dados reais
foram considerados pela CEEE muito
positivos;
● CEEE solicitou continuidade com mais
dados reais;
● Sugerimos palestra sobre a tarefa de
classificação, suas etapas e ferramentas
(ensinar a pescar).
Submissão de Artigo
International Conference on Enterprise
Information Systems (ICEIS) 2012:
Aceito.
FIM
Muito obrigado pela atenção.

Weitere ähnliche Inhalte

Ähnlich wie SIA Predição Fraudes Energia Elétrica

Calibração e validação de modelos
Calibração e validação de modelosCalibração e validação de modelos
Calibração e validação de modelosSebastian Krieger
 
Algoritmo de Previsão de Satisfação do Cliente
Algoritmo de Previsão de Satisfação do ClienteAlgoritmo de Previsão de Satisfação do Cliente
Algoritmo de Previsão de Satisfação do ClienteThe AES Corporation
 
Palestra Fundamentos de Testes - Tche linux POA
Palestra Fundamentos de Testes  - Tche linux POAPalestra Fundamentos de Testes  - Tche linux POA
Palestra Fundamentos de Testes - Tche linux POAAline Zanin
 
Aula introducao cep
Aula introducao cepAula introducao cep
Aula introducao cepnigr0 s
 
Apresentação de Falhas em Componentes
Apresentação de Falhas em ComponentesApresentação de Falhas em Componentes
Apresentação de Falhas em ComponentesLaís Camargo
 
Teste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeterTeste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeterJuliano Santos
 
Programa de Planos de Amostragem
Programa de Planos de AmostragemPrograma de Planos de Amostragem
Programa de Planos de AmostragemGrupo Treinar
 
Qualimetria e gestão de qualidade em TI por André Balparda
Qualimetria e gestão de qualidade em TI por André BalpardaQualimetria e gestão de qualidade em TI por André Balparda
Qualimetria e gestão de qualidade em TI por André BalpardaJoao Galdino Mello de Souza
 
Reusabilidade na Utilização de Frameworks Automatizados
Reusabilidade na Utilização de Frameworks Automatizados Reusabilidade na Utilização de Frameworks Automatizados
Reusabilidade na Utilização de Frameworks Automatizados Webcasts developerWorks Brasil
 
Gerenciamento da qualidade total 6sigma marcus vinicius carina
Gerenciamento da qualidade total 6sigma marcus vinicius carinaGerenciamento da qualidade total 6sigma marcus vinicius carina
Gerenciamento da qualidade total 6sigma marcus vinicius carinaMarcus Vinicius Carina
 

Ähnlich wie SIA Predição Fraudes Energia Elétrica (20)

Calibração e validação de modelos
Calibração e validação de modelosCalibração e validação de modelos
Calibração e validação de modelos
 
AES Eletropaulo_SAMP_Algoritmo
AES Eletropaulo_SAMP_AlgoritmoAES Eletropaulo_SAMP_Algoritmo
AES Eletropaulo_SAMP_Algoritmo
 
Algoritmo de Previsão de Satisfação do Cliente
Algoritmo de Previsão de Satisfação do ClienteAlgoritmo de Previsão de Satisfação do Cliente
Algoritmo de Previsão de Satisfação do Cliente
 
Curso DVR
Curso DVRCurso DVR
Curso DVR
 
Palestra Fundamentos de Testes - Tche linux POA
Palestra Fundamentos de Testes  - Tche linux POAPalestra Fundamentos de Testes  - Tche linux POA
Palestra Fundamentos de Testes - Tche linux POA
 
Aula introducao cep
Aula introducao cepAula introducao cep
Aula introducao cep
 
Mr8
Mr8Mr8
Mr8
 
Apresentação de Falhas em Componentes
Apresentação de Falhas em ComponentesApresentação de Falhas em Componentes
Apresentação de Falhas em Componentes
 
Teste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeterTeste de Desempenho, muito além do JMeter
Teste de Desempenho, muito além do JMeter
 
Programa de Planos de Amostragem
Programa de Planos de AmostragemPrograma de Planos de Amostragem
Programa de Planos de Amostragem
 
Validação de métodos analíticos
Validação de métodos analíticosValidação de métodos analíticos
Validação de métodos analíticos
 
Computacao
ComputacaoComputacao
Computacao
 
Qualimetria e gestão de qualidade em TI por André Balparda
Qualimetria e gestão de qualidade em TI por André BalpardaQualimetria e gestão de qualidade em TI por André Balparda
Qualimetria e gestão de qualidade em TI por André Balparda
 
Metrologia aula 01 02
Metrologia  aula 01   02Metrologia  aula 01   02
Metrologia aula 01 02
 
Desenvolvimento Custos Gerenciais
Desenvolvimento Custos GerenciaisDesenvolvimento Custos Gerenciais
Desenvolvimento Custos Gerenciais
 
seissigmatrad.pdf
seissigmatrad.pdfseissigmatrad.pdf
seissigmatrad.pdf
 
Gerenciamento quali total 6sigma
Gerenciamento quali total 6sigmaGerenciamento quali total 6sigma
Gerenciamento quali total 6sigma
 
Agiidade na Qualidade de Software -2011
Agiidade na Qualidade de Software -2011Agiidade na Qualidade de Software -2011
Agiidade na Qualidade de Software -2011
 
Reusabilidade na Utilização de Frameworks Automatizados
Reusabilidade na Utilização de Frameworks Automatizados Reusabilidade na Utilização de Frameworks Automatizados
Reusabilidade na Utilização de Frameworks Automatizados
 
Gerenciamento da qualidade total 6sigma marcus vinicius carina
Gerenciamento da qualidade total 6sigma marcus vinicius carinaGerenciamento da qualidade total 6sigma marcus vinicius carina
Gerenciamento da qualidade total 6sigma marcus vinicius carina
 

Mehr von Mauricio Volkweis Astiazara

Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...
Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...
Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...Mauricio Volkweis Astiazara
 
Comparação de Algoritmos Baseados em Q-Learning
Comparação de Algoritmos Baseados em Q-LearningComparação de Algoritmos Baseados em Q-Learning
Comparação de Algoritmos Baseados em Q-LearningMauricio Volkweis Astiazara
 
Sistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre SaúdeSistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre SaúdeMauricio Volkweis Astiazara
 
Sistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre SaúdeSistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre SaúdeMauricio Volkweis Astiazara
 
Ordenação de Dados por Distribuição de Chaves
Ordenação de Dados por Distribuição de ChavesOrdenação de Dados por Distribuição de Chaves
Ordenação de Dados por Distribuição de ChavesMauricio Volkweis Astiazara
 

Mehr von Mauricio Volkweis Astiazara (20)

Como Programar Melhor em Java
Como Programar Melhor em JavaComo Programar Melhor em Java
Como Programar Melhor em Java
 
Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...
Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...
Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia E...
 
Comparação de Algoritmos Baseados em Q-Learning
Comparação de Algoritmos Baseados em Q-LearningComparação de Algoritmos Baseados em Q-Learning
Comparação de Algoritmos Baseados em Q-Learning
 
Classificador de Documentos Naïve Bayes
Classificador de Documentos Naïve BayesClassificador de Documentos Naïve Bayes
Classificador de Documentos Naïve Bayes
 
Visão Computacional
Visão ComputacionalVisão Computacional
Visão Computacional
 
Sistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre SaúdeSistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre Saúde
 
Sistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre SaúdeSistema de Recomendação de Páginas sobre Saúde
Sistema de Recomendação de Páginas sobre Saúde
 
Processamento de Imagens
Processamento de ImagensProcessamento de Imagens
Processamento de Imagens
 
Percepção, Movimento e Ação
Percepção, Movimento e AçãoPercepção, Movimento e Ação
Percepção, Movimento e Ação
 
Memória e Aprendizagem
Memória e AprendizagemMemória e Aprendizagem
Memória e Aprendizagem
 
Gerência de Requisitos
Gerência de RequisitosGerência de Requisitos
Gerência de Requisitos
 
Testes de Sistema
Testes de SistemaTestes de Sistema
Testes de Sistema
 
Telefonia Móvel
Telefonia MóvelTelefonia Móvel
Telefonia Móvel
 
Telefonia Móvel
Telefonia MóvelTelefonia Móvel
Telefonia Móvel
 
Realidade Virtual
Realidade VirtualRealidade Virtual
Realidade Virtual
 
Protótipo de Simulador de Elevadores
Protótipo de Simulador de ElevadoresProtótipo de Simulador de Elevadores
Protótipo de Simulador de Elevadores
 
Protótipo de Simulador de Elevadores
Protótipo de Simulador de ElevadoresProtótipo de Simulador de Elevadores
Protótipo de Simulador de Elevadores
 
Planejamento de Informática
Planejamento de InformáticaPlanejamento de Informática
Planejamento de Informática
 
Planejamento de Informática
Planejamento de InformáticaPlanejamento de Informática
Planejamento de Informática
 
Ordenação de Dados por Distribuição de Chaves
Ordenação de Dados por Distribuição de ChavesOrdenação de Dados por Distribuição de Chaves
Ordenação de Dados por Distribuição de Chaves
 

SIA Predição Fraudes Energia Elétrica