SlideShare ist ein Scribd-Unternehmen logo
1 von 34
Downloaden Sie, um offline zu lesen
PREPARAÇÃO E LIMPEZA DE DADOS
Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
Dados desorganizados vão cruzar o seu caminho, seja
você um analista de dados super bem pago com um
bilhão de registros ou uma startup com uma única
pessoa e uma lista com 90 contatos.
–Anitta
“Prepara…”
PREPARAÇÃO
• É comum que os dados coletados não estejam inicialmente
prontos para uso	

• Há um conjunto comum de tarefas de preparação que precisam
ser executadas, principalmente com dados coletados por terceiros	

• Se você tiver sorte, conseguirá automatizar pelo menos parte
destas tarefas!	

• A maioria dos analistas detestam esta parte do trabalho mas
alguém precisa limpar os dados
ETAPAS DA PREPARAÇÃO DE
DADOS
• Separação	

• Conversão	

• Padronização
SEPARAÇÃO
• Separar os dados em campos que serão mais úteis
para sua análise
Dado que você precisa Dado disponível
C77000S GA3C77000S
W30000P GA1W30000P
D21250G DE1D21250G
SEPARAÇÃO
• Um exemplo um pouco mais complexo
Shopping Endereço Cidade Estado
Manaíra Shopping,Av. Flávio Ribeiro Coutinho,
805 Manaíra - João Pessoa - PB
Shopping Recife, R. PE. CARAPUCEIRO, 777,
BOAVIAGEM - RECIFE/PE
Shopping Midway,Av. BernardoVieira, 3775 -Tirol	

Natal-RN
SEPARAÇÃO
Nome
Pedro Campos
José João
Maria Silva
Luiz Santos
Zeca Oliveira
Marlene Maria
Nome Sobrenome
Pedro Campos
José João
Silva Maria
Luiz Santos
Zeca Oliveira
Marlene Maria
SEPARAÇÃO
Iniciais no meio Alexandre N. Duarte
Designação profissional Prof. Alexandre Duarte
Prefixos Dr. Alexandre Duarte
Sufixos Alexandre Duarte II
Sobrenome com hífen Alexandre Nóbrega-Duarte
Sobrenome primeiro Duarte,Alexandre Nóbrega
Primeiro nome duplo Alexandre Antônio Duarte
SEPARAÇÃO
Prefixo/Sufixos Prof. Alexandre Duarte, PhD
Outros campos incluídos
incorretamente
Alexandre Duarte UFPB João Pessoa
Primeiro nome ausente Nóbrega Duarte
Sobrenome ausente Alexandre
Tudo ausente
Não sei AA
Não é um nome de pessoa Universidade Federal da Paraíba
COMO PROCEDER?
• Suponha que precisamos separar os nomes para
podermos ordenar uma lista de 500 itens pelo
sobrenome
ANTES DE COMEÇAR
• Qual a importância de fazer essa separação? 	

• O que se perde mantendo o nome como um campo único?	

• Qual o resultado esperado?	

• Deve-se manter algum outro campo além do nome e sobrenome?	

• Vale a pena o esforço ?	

• E se alguém disser que corrige a lista para você por R$ 1000? E por R$ 100? 	

• Como lidar com entradas incorretas/incompletas?
COMO SEPARAR OS DADOS?
• É possível escrever um livro inteiro apenas sobre
isso!	

• Conhecimento de uma linguagem de
programação facilita bastante o trabalho
“Você deve sempre manter uma cópia dos dados
originais.”
PROCURE PELO CASO
COMUM
• Muitas vezes, a maior parte dos dados pode ser
separada de forma trivial 	

• Você pode perceber que dos 500 nomes, 200
possuem apenas o primeiro nome e o sobrenome 	

• Separe estes 200 e concentre-se nos 300
restantes
IDENTIFIQUE AS
SINGULARIDADES
• Dê uma olhada no conjunto de dados para
identificar entradas sem dados, nomes complicados,
nomes incompletos, dados que não representam
nomes e entradas com as quais você não sabe lidar. 	

• Digamos que este grupo é formado por 40 nomes	

• Reserve-os para mais tarde.
PROCURE POR
SIMILARIDADES
• Dos 260 nomes restantes, talvez 60 sejam mais complicados por
conta de designações profissionais. 	

• Apague ou separe manualmente de uma única vez essas 60
designações profissionais 	

• Adicione os que agora possuem apenas nome e sobrenome aos
200 que separamos no começo 	

• Os que ainda não estiverem no formato esperado (sobrenomes
duplos, etc) são classificados em grupos apropriados
ESFORÇO MANUAL
• Os 40 nomes estranhos podem acabar tendo que
ser tratados manualmente, com a redigitação
correta dos dados
CONVERSÃO
• Uma outra tarefa importante na fase de preparação é garantir
que todos os dados de um determinado campo sejam descritos
utilizando a mesma unidade e tipo de dados	

• Exemplo: considere uma base com dados biometricos de pessoas
de diferentes países. 	

• Pesos podem especificados em kilos ou libras	

• Alturas podem ser especificadas em centímetros ou polegadas
PADRONIZAÇÃO
• Talvez a etapa mais intensiva da preparação dos
dados seja a padronização, ou controle de
inconsistências	

• Valores diferentes para representar o mesmo
conceito	

• Geralmente requer preparação semi-automática
PADRONIZAÇÃO
Engenharia da Computação
Ciência da Computação
Ciências da Computação
Matemática
Engenharia de Computação
EC
CC
MAT
0 7.5 15 22.5 30
Engenharia da Computação
Ciência da Computação
Matemática
0 12.5 25 37.5 50
DIMINUINDO A DOR DE
CABEÇA
• A melhor solução é a prevenção	

• Se você está coletando os dados, faça o máximo
possível para minimizar a possibilidade de coletar
dados que demandem grande esforço na
preparação	

• Veremos mais sobre isso ainda hoje!
LIMPEZA
LIMPEZA DOS DADOS
• Após a preparação dos dados devemos procurar identificar
dados incorretos 	

• Números inconsistentes	

• Erros de digitação	

• Decidir se é possível corrigir os erros ou se os dados devem ser
ignorados	

• Atividade semi-automática
TESTE DE INTERVALO
• Procedimento simples para testar valores
numéricos	

• Checar se valores estão acima ou abaixo dos
limites estabelecidos para uma variável	

• Marcar valores suspeitos para análise manual
LIMPEZA DE NOTAS
Matrícula Nota
679372531 980
673540288 99
674082892 97
673923590 96
LIMPEZA DE NOTAS
Matrícula Nota
679372531 78
673540288 75
674082892 74
673923590 9
ORTOGRAFIA
• Verificação ortográfica é uma outra forma de detectar dados
problemáticos	

• Cienca da Computaçao, Ciensia da Computasao ,etc	

• Recomenda-se que cada variável (coluna) seja testada isoladamente	

• Um valor considerado incorreto para uma variável pode ser correto
para outra
PADRÕES / EXPRESSÕES
REGULARES
• Expressões regulares são suas aliadas	

• Testar se todas as entradas para a variável e-mail
são realmente endereços de e-mail	

• Só fazem sentido se aplicadas a variáveis (colunas)
isoladamente
A MAIORIA DOS CONJUNTOS
DE DADOS NÃO É 100% LIMPA
• Aceite isso!	

• Se você seleciona 1000 entradas de uma base com
1.000.000 entradas e você detecta que 2 estão
com o nome e sobrenome em um único campo,
faz sentido processar toda a base novamente ?	

• Depende!
DEPOIS DA LIMPEZA
• há documentação!	

• Como outros podem verificar que a limpeza que você fez não corrompeu
os dados?	

• Os dados tratados podem ser muito diferentes dos dados brutos	

• É preciso documentar tudo!	

• É melhor documentar durante a limpeza e não após terminar.	

• Ajudará a explicar porque determinados pontos de dados foram
removidos
REGRA GERAL
• Se o número de valores incorretos ou ausentes
em uma [linha, coluna] é maior do que o número
de valores corretos o mais recomendado é excluir
esta [linha, coluna]
O QUE UMA BOA LIMPEZA DE
DADOS CONSEGUETRATAR
• erros de digitação, erros de digitação	

• outliers, valores inválidos, valores extremos	

• dados que não são internamente consistentes	

• ausência ou excesso de dados	

• padrões estranhos em distribuições 	

• valores ausentes
O QUE A LIMPEZA NÃO FAZ
• Detectar valores incorretos mas dentro do intervalo esperado	

• Uma pessoa de 45 anos digita sua idade como 54	

• Detectar respostas que não refletem sua opinião do respondente	

• Escolheu Concorda Fortemente quando queria na verdade
escolher Discorda Fortemente	

• Distinguir dados ausentes de dados omitidos	

• Prefiro não responder

Weitere ähnliche Inhalte

Was ist angesagt?

Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERRangel Javier
 
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosBanco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosLeinylson Fontinele
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dadosvini_campos
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dadoscardoso80
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBItiaquarius
 
Banco de Dados II Projeto Final de Banco de Dados
Banco de Dados II Projeto Final de Banco de DadosBanco de Dados II Projeto Final de Banco de Dados
Banco de Dados II Projeto Final de Banco de DadosLeinylson Fontinele
 
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...Leinylson Fontinele
 
Banco de Dados II Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)
Banco de Dados II  Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)Banco de Dados II  Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)
Banco de Dados II Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)Leinylson Fontinele
 
Modelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e HierárquicoModelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e Hierárquicorosimaracorsino
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Sistemas de Gestão de Bases de Dados
Sistemas de Gestão de Bases de DadosSistemas de Gestão de Bases de Dados
Sistemas de Gestão de Bases de DadosClara Ferreira
 

Was ist angesagt? (20)

Banco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DERBanco de Dados - Introdução - Projeto de Banco de Dados - DER
Banco de Dados - Introdução - Projeto de Banco de Dados - DER
 
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de DadosBanco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
Banco de Dados I - Aula 03 - Conceitos de Sistemas de Banco de Dados
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dados
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Modelagem de dados
Modelagem de dadosModelagem de dados
Modelagem de dados
 
Introdução a Bancos de Dados
Introdução a Bancos de DadosIntrodução a Bancos de Dados
Introdução a Bancos de Dados
 
Palestra Ciência de Dados
Palestra Ciência de DadosPalestra Ciência de Dados
Palestra Ciência de Dados
 
Treinamento PowerBI
Treinamento  PowerBITreinamento  PowerBI
Treinamento PowerBI
 
Estudo de Usuários - Conceitos e Aplicações
Estudo de Usuários - Conceitos e AplicaçõesEstudo de Usuários - Conceitos e Aplicações
Estudo de Usuários - Conceitos e Aplicações
 
Banco de Dados II Projeto Final de Banco de Dados
Banco de Dados II Projeto Final de Banco de DadosBanco de Dados II Projeto Final de Banco de Dados
Banco de Dados II Projeto Final de Banco de Dados
 
Aula 1
Aula 1Aula 1
Aula 1
 
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
 
Big Data
Big DataBig Data
Big Data
 
Banco de Dados II Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)
Banco de Dados II  Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)Banco de Dados II  Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)
Banco de Dados II Aula 02 - Modelagem de Dados (Definição, Modelo conceitual)
 
Modelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e HierárquicoModelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e Hierárquico
 
Metadados: dados a respeito de dados
Metadados: dados a respeito de dadosMetadados: dados a respeito de dados
Metadados: dados a respeito de dados
 
Fontes de informação - pesquisa de informação científica 1/2
Fontes de informação - pesquisa de informação científica 1/2Fontes de informação - pesquisa de informação científica 1/2
Fontes de informação - pesquisa de informação científica 1/2
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Bases De Dados
Bases De DadosBases De Dados
Bases De Dados
 
Sistemas de Gestão de Bases de Dados
Sistemas de Gestão de Bases de DadosSistemas de Gestão de Bases de Dados
Sistemas de Gestão de Bases de Dados
 

Ähnlich wie Preparação e Limpeza de Dados

Principais processos de criação de um Banco de Dados e comuns erros de aplica...
Principais processos de criação de um Banco de Dados e comuns erros de aplica...Principais processos de criação de um Banco de Dados e comuns erros de aplica...
Principais processos de criação de um Banco de Dados e comuns erros de aplica...Perla Coutinho Barbosa
 
Curso de Delphi - Banco de Dados
Curso de Delphi - Banco de DadosCurso de Delphi - Banco de Dados
Curso de Delphi - Banco de DadosJosé Araújo
 
Clean Code - Fork In Tuba
Clean Code - Fork In TubaClean Code - Fork In Tuba
Clean Code - Fork In TubaRafael Paz
 
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)A Scuola di OpenCoesione
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerAlexandre Duarte
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...tdc-globalcode
 
Escrita Acadêmica em Inglês - Módulo 7
Escrita Acadêmica em Inglês - Módulo 7Escrita Acadêmica em Inglês - Módulo 7
Escrita Acadêmica em Inglês - Módulo 7Ron Martinez
 
Boas práticas no desenvolvimento de software
Boas práticas no desenvolvimento de softwareBoas práticas no desenvolvimento de software
Boas práticas no desenvolvimento de softwareFelipe
 
Banco de Dados.pptx
Banco de Dados.pptxBanco de Dados.pptx
Banco de Dados.pptxBrunoWuo
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informaçãoFábio Andrade
 

Ähnlich wie Preparação e Limpeza de Dados (20)

Principais processos de criação de um Banco de Dados e comuns erros de aplica...
Principais processos de criação de um Banco de Dados e comuns erros de aplica...Principais processos de criação de um Banco de Dados e comuns erros de aplica...
Principais processos de criação de um Banco de Dados e comuns erros de aplica...
 
Curso de Delphi - Banco de Dados
Curso de Delphi - Banco de DadosCurso de Delphi - Banco de Dados
Curso de Delphi - Banco de Dados
 
Clean Code - Fork In Tuba
Clean Code - Fork In TubaClean Code - Fork In Tuba
Clean Code - Fork In Tuba
 
Ip 01 logica
Ip 01 logicaIp 01 logica
Ip 01 logica
 
Aula 01 Revisão
Aula 01   RevisãoAula 01   Revisão
Aula 01 Revisão
 
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
ASOCEU PORTUGAL - Lesson 2 - Data Refining (slides)
 
Lógica de programação e algoritmos
Lógica de programação e algoritmosLógica de programação e algoritmos
Lógica de programação e algoritmos
 
Db2
Db2Db2
Db2
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
 
Apostila Intensivo Python - Desafio 2.pdf
Apostila Intensivo Python - Desafio 2.pdfApostila Intensivo Python - Desafio 2.pdf
Apostila Intensivo Python - Desafio 2.pdf
 
pgDay Campinas – 2015
pgDay Campinas – 2015pgDay Campinas – 2015
pgDay Campinas – 2015
 
Aula Base de dados 2.pdf
Aula Base de dados 2.pdfAula Base de dados 2.pdf
Aula Base de dados 2.pdf
 
Clean Code
Clean CodeClean Code
Clean Code
 
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
TDC2017 | São Paulo - Trilha BigData How we figured out we had a SRE team at ...
 
Aula 1.1
Aula 1.1Aula 1.1
Aula 1.1
 
Escrita Acadêmica em Inglês - Módulo 7
Escrita Acadêmica em Inglês - Módulo 7Escrita Acadêmica em Inglês - Módulo 7
Escrita Acadêmica em Inglês - Módulo 7
 
Boas práticas no desenvolvimento de software
Boas práticas no desenvolvimento de softwareBoas práticas no desenvolvimento de software
Boas práticas no desenvolvimento de software
 
Banco de Dados.pptx
Banco de Dados.pptxBanco de Dados.pptx
Banco de Dados.pptx
 
Isc aula 5 - estrutura e organização da informação
Isc   aula 5 - estrutura e organização da informaçãoIsc   aula 5 - estrutura e organização da informação
Isc aula 5 - estrutura e organização da informação
 
ed_aula01.pdf
ed_aula01.pdfed_aula01.pdf
ed_aula01.pdf
 

Mehr von Alexandre Duarte

Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosAlexandre Duarte
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Alexandre Duarte
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaAlexandre Duarte
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como CiênciaAlexandre Duarte
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: IntroduçãoAlexandre Duarte
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBAlexandre Duarte
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisAlexandre Duarte
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2DAlexandre Duarte
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1DAlexandre Duarte
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosAlexandre Duarte
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de SurveysAlexandre Duarte
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosAlexandre Duarte
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Alexandre Duarte
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Alexandre Duarte
 

Mehr von Alexandre Duarte (20)

Projeto de Experimentos
Projeto de ExperimentosProjeto de Experimentos
Projeto de Experimentos
 
Táticas para Projeto de Experimentos
Táticas para Projeto de ExperimentosTáticas para Projeto de Experimentos
Táticas para Projeto de Experimentos
 
Causalidade e Abdução
Causalidade e AbduçãoCausalidade e Abdução
Causalidade e Abdução
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!
 
Atividades Científica
Atividades CientíficaAtividades Científica
Atividades Científica
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como Ciência
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: Introdução
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPB
 
Agrupamento com K-Means
Agrupamento com K-MeansAgrupamento com K-Means
Agrupamento com K-Means
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis Nominais
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2D
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1D
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Introdução ao Projeto de Experimentos
Introdução ao Projeto de ExperimentosIntrodução ao Projeto de Experimentos
Introdução ao Projeto de Experimentos
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de Surveys
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de Dados
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
 

Kürzlich hochgeladen

6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptxJssicaCassiano2
 
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...azulassessoria9
 
Plano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptxPlano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptxPaulaYaraDaasPedro
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxLuizHenriquedeAlmeid6
 
3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptx3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptxMarlene Cunhada
 
Sistema de Bibliotecas UCS - Cantos do fim do século
Sistema de Bibliotecas UCS  - Cantos do fim do séculoSistema de Bibliotecas UCS  - Cantos do fim do século
Sistema de Bibliotecas UCS - Cantos do fim do séculoBiblioteca UCS
 
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...andreiavys
 
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxResponde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxAntonioVieira539017
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfTutor de matemática Ícaro
 
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxLuizHenriquedeAlmeid6
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxFlviaGomes64
 
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...azulassessoria9
 
Historia de Portugal - Quarto Ano - 2024
Historia de Portugal - Quarto Ano - 2024Historia de Portugal - Quarto Ano - 2024
Historia de Portugal - Quarto Ano - 2024Cabiamar
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfcomercial400681
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.denisecompasso2
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticash5kpmr7w7
 
classe gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptxclasse gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptxLuciana Luciana
 
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...PatriciaCaetano18
 
Expansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVExpansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVlenapinto
 
Cópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptx
Cópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptxCópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptx
Cópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptxSilvana Silva
 

Kürzlich hochgeladen (20)

6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx6ano variação linguística ensino fundamental.pptx
6ano variação linguística ensino fundamental.pptx
 
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
O estudo do controle motor nada mais é do que o estudo da natureza do movimen...
 
Plano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptxPlano de aula Nova Escola períodos simples e composto parte 1.pptx
Plano de aula Nova Escola períodos simples e composto parte 1.pptx
 
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptxSlides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
Slides Lição 6, CPAD, As Nossas Armas Espirituais, 2Tr24.pptx
 
3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptx3 2 - termos-integrantes-da-oracao-.pptx
3 2 - termos-integrantes-da-oracao-.pptx
 
Sistema de Bibliotecas UCS - Cantos do fim do século
Sistema de Bibliotecas UCS  - Cantos do fim do séculoSistema de Bibliotecas UCS  - Cantos do fim do século
Sistema de Bibliotecas UCS - Cantos do fim do século
 
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...E a chuva ...  (Livro pedagógico para ser usado na educação infantil e trabal...
E a chuva ... (Livro pedagógico para ser usado na educação infantil e trabal...
 
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptxResponde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
Responde ou passa na HISTÓRIA - REVOLUÇÃO INDUSTRIAL - 8º ANO.pptx
 
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdfCurrículo - Ícaro Kleisson - Tutor acadêmico.pdf
Currículo - Ícaro Kleisson - Tutor acadêmico.pdf
 
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptxSlides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
Slides Lição 6, Betel, Ordenança para uma vida de obediência e submissão.pptx
 
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptxMonoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
Monoteísmo, Politeísmo, Panteísmo 7 ANO2.pptx
 
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
Considerando as pesquisas de Gallahue, Ozmun e Goodway (2013) os bebês até an...
 
Historia de Portugal - Quarto Ano - 2024
Historia de Portugal - Quarto Ano - 2024Historia de Portugal - Quarto Ano - 2024
Historia de Portugal - Quarto Ano - 2024
 
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdfApresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
Apresentação ISBET Jovem Aprendiz e Estágio 2023.pdf
 
O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.O que é arte. Definição de arte. História da arte.
O que é arte. Definição de arte. História da arte.
 
Slide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemáticaSlide - SAEB. língua portuguesa e matemática
Slide - SAEB. língua portuguesa e matemática
 
classe gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptxclasse gramatical Substantivo apresentação..pptx
classe gramatical Substantivo apresentação..pptx
 
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
A EDUCAÇÃO FÍSICA NO NOVO ENSINO MÉDIO: IMPLICAÇÕES E TENDÊNCIAS PROMOVIDAS P...
 
Expansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XVExpansão Marítima- Descobrimentos Portugueses século XV
Expansão Marítima- Descobrimentos Portugueses século XV
 
Cópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptx
Cópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptxCópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptx
Cópia de AULA 2- ENSINO FUNDAMENTAL ANOS INICIAIS - LÍNGUA PORTUGUESA.pptx
 

Preparação e Limpeza de Dados

  • 1. PREPARAÇÃO E LIMPEZA DE DADOS Alexandre Duarte - http://alexandre.ci.ufpb.br/ensino/iad
  • 2. Dados desorganizados vão cruzar o seu caminho, seja você um analista de dados super bem pago com um bilhão de registros ou uma startup com uma única pessoa e uma lista com 90 contatos.
  • 4. PREPARAÇÃO • É comum que os dados coletados não estejam inicialmente prontos para uso • Há um conjunto comum de tarefas de preparação que precisam ser executadas, principalmente com dados coletados por terceiros • Se você tiver sorte, conseguirá automatizar pelo menos parte destas tarefas! • A maioria dos analistas detestam esta parte do trabalho mas alguém precisa limpar os dados
  • 5. ETAPAS DA PREPARAÇÃO DE DADOS • Separação • Conversão • Padronização
  • 6. SEPARAÇÃO • Separar os dados em campos que serão mais úteis para sua análise Dado que você precisa Dado disponível C77000S GA3C77000S W30000P GA1W30000P D21250G DE1D21250G
  • 7. SEPARAÇÃO • Um exemplo um pouco mais complexo Shopping Endereço Cidade Estado Manaíra Shopping,Av. Flávio Ribeiro Coutinho, 805 Manaíra - João Pessoa - PB Shopping Recife, R. PE. CARAPUCEIRO, 777, BOAVIAGEM - RECIFE/PE Shopping Midway,Av. BernardoVieira, 3775 -Tirol Natal-RN
  • 8. SEPARAÇÃO Nome Pedro Campos José João Maria Silva Luiz Santos Zeca Oliveira Marlene Maria Nome Sobrenome Pedro Campos José João Silva Maria Luiz Santos Zeca Oliveira Marlene Maria
  • 9. SEPARAÇÃO Iniciais no meio Alexandre N. Duarte Designação profissional Prof. Alexandre Duarte Prefixos Dr. Alexandre Duarte Sufixos Alexandre Duarte II Sobrenome com hífen Alexandre Nóbrega-Duarte Sobrenome primeiro Duarte,Alexandre Nóbrega Primeiro nome duplo Alexandre Antônio Duarte
  • 10. SEPARAÇÃO Prefixo/Sufixos Prof. Alexandre Duarte, PhD Outros campos incluídos incorretamente Alexandre Duarte UFPB João Pessoa Primeiro nome ausente Nóbrega Duarte Sobrenome ausente Alexandre Tudo ausente Não sei AA Não é um nome de pessoa Universidade Federal da Paraíba
  • 11. COMO PROCEDER? • Suponha que precisamos separar os nomes para podermos ordenar uma lista de 500 itens pelo sobrenome
  • 12. ANTES DE COMEÇAR • Qual a importância de fazer essa separação? • O que se perde mantendo o nome como um campo único? • Qual o resultado esperado? • Deve-se manter algum outro campo além do nome e sobrenome? • Vale a pena o esforço ? • E se alguém disser que corrige a lista para você por R$ 1000? E por R$ 100? • Como lidar com entradas incorretas/incompletas?
  • 13. COMO SEPARAR OS DADOS? • É possível escrever um livro inteiro apenas sobre isso! • Conhecimento de uma linguagem de programação facilita bastante o trabalho
  • 14. “Você deve sempre manter uma cópia dos dados originais.”
  • 15. PROCURE PELO CASO COMUM • Muitas vezes, a maior parte dos dados pode ser separada de forma trivial • Você pode perceber que dos 500 nomes, 200 possuem apenas o primeiro nome e o sobrenome • Separe estes 200 e concentre-se nos 300 restantes
  • 16. IDENTIFIQUE AS SINGULARIDADES • Dê uma olhada no conjunto de dados para identificar entradas sem dados, nomes complicados, nomes incompletos, dados que não representam nomes e entradas com as quais você não sabe lidar. • Digamos que este grupo é formado por 40 nomes • Reserve-os para mais tarde.
  • 17. PROCURE POR SIMILARIDADES • Dos 260 nomes restantes, talvez 60 sejam mais complicados por conta de designações profissionais. • Apague ou separe manualmente de uma única vez essas 60 designações profissionais • Adicione os que agora possuem apenas nome e sobrenome aos 200 que separamos no começo • Os que ainda não estiverem no formato esperado (sobrenomes duplos, etc) são classificados em grupos apropriados
  • 18. ESFORÇO MANUAL • Os 40 nomes estranhos podem acabar tendo que ser tratados manualmente, com a redigitação correta dos dados
  • 19. CONVERSÃO • Uma outra tarefa importante na fase de preparação é garantir que todos os dados de um determinado campo sejam descritos utilizando a mesma unidade e tipo de dados • Exemplo: considere uma base com dados biometricos de pessoas de diferentes países. • Pesos podem especificados em kilos ou libras • Alturas podem ser especificadas em centímetros ou polegadas
  • 20. PADRONIZAÇÃO • Talvez a etapa mais intensiva da preparação dos dados seja a padronização, ou controle de inconsistências • Valores diferentes para representar o mesmo conceito • Geralmente requer preparação semi-automática
  • 21. PADRONIZAÇÃO Engenharia da Computação Ciência da Computação Ciências da Computação Matemática Engenharia de Computação EC CC MAT 0 7.5 15 22.5 30 Engenharia da Computação Ciência da Computação Matemática 0 12.5 25 37.5 50
  • 22. DIMINUINDO A DOR DE CABEÇA • A melhor solução é a prevenção • Se você está coletando os dados, faça o máximo possível para minimizar a possibilidade de coletar dados que demandem grande esforço na preparação • Veremos mais sobre isso ainda hoje!
  • 24. LIMPEZA DOS DADOS • Após a preparação dos dados devemos procurar identificar dados incorretos • Números inconsistentes • Erros de digitação • Decidir se é possível corrigir os erros ou se os dados devem ser ignorados • Atividade semi-automática
  • 25. TESTE DE INTERVALO • Procedimento simples para testar valores numéricos • Checar se valores estão acima ou abaixo dos limites estabelecidos para uma variável • Marcar valores suspeitos para análise manual
  • 26. LIMPEZA DE NOTAS Matrícula Nota 679372531 980 673540288 99 674082892 97 673923590 96
  • 27. LIMPEZA DE NOTAS Matrícula Nota 679372531 78 673540288 75 674082892 74 673923590 9
  • 28. ORTOGRAFIA • Verificação ortográfica é uma outra forma de detectar dados problemáticos • Cienca da Computaçao, Ciensia da Computasao ,etc • Recomenda-se que cada variável (coluna) seja testada isoladamente • Um valor considerado incorreto para uma variável pode ser correto para outra
  • 29. PADRÕES / EXPRESSÕES REGULARES • Expressões regulares são suas aliadas • Testar se todas as entradas para a variável e-mail são realmente endereços de e-mail • Só fazem sentido se aplicadas a variáveis (colunas) isoladamente
  • 30. A MAIORIA DOS CONJUNTOS DE DADOS NÃO É 100% LIMPA • Aceite isso! • Se você seleciona 1000 entradas de uma base com 1.000.000 entradas e você detecta que 2 estão com o nome e sobrenome em um único campo, faz sentido processar toda a base novamente ? • Depende!
  • 31. DEPOIS DA LIMPEZA • há documentação! • Como outros podem verificar que a limpeza que você fez não corrompeu os dados? • Os dados tratados podem ser muito diferentes dos dados brutos • É preciso documentar tudo! • É melhor documentar durante a limpeza e não após terminar. • Ajudará a explicar porque determinados pontos de dados foram removidos
  • 32. REGRA GERAL • Se o número de valores incorretos ou ausentes em uma [linha, coluna] é maior do que o número de valores corretos o mais recomendado é excluir esta [linha, coluna]
  • 33. O QUE UMA BOA LIMPEZA DE DADOS CONSEGUETRATAR • erros de digitação, erros de digitação • outliers, valores inválidos, valores extremos • dados que não são internamente consistentes • ausência ou excesso de dados • padrões estranhos em distribuições • valores ausentes
  • 34. O QUE A LIMPEZA NÃO FAZ • Detectar valores incorretos mas dentro do intervalo esperado • Uma pessoa de 45 anos digita sua idade como 54 • Detectar respostas que não refletem sua opinião do respondente • Escolheu Concorda Fortemente quando queria na verdade escolher Discorda Fortemente • Distinguir dados ausentes de dados omitidos • Prefiro não responder