2. Um pouco de história (e links)...
-
- Campanha 'Quem são os proprietários do Brasil?'
http://proprietariosdobrasil.org.br/)
- Investigação para a Agência Pública sobre cartelização em grandes empreiteiras
e financiamento de campanha:
http://apublica.org/2014/06/um-jogo-para-poucos/ &&
https://apublica.org/2014/06/as-quatro-irmas/
- Repositórios organizados por Rafael Polo: https://mostre.me/ &&
https://mostre.me/eleicoes && https://github.com/rafapolo/tribuna
- Cruzamento automático para identificar doações da Odebrecht para o grupo
Connectas/The Intercept: http://github.com/belisards/match-tse-odb/ &&
https://theintercept.com/staff/adriano-belisario/
3. Alguns conceitos...
- Partidos, comitês e candidatos: possuem prestações de contas distintas.
Comitês são organizados de acordo com o cargo que se disputa. Já a Direção dos
Partidos divide-se pelos três níveis da federação.
- Doações estimada: prestação de serviços cujos valores são contabilizados
como receita pela prestação de contas.
- Doação direta/indireta: uma prática comum era a empresa doar para um
partido que então repassava este recurso aos candidatos. a partir de 2014, surge
o campo de 'Doador Originário' que vincula este recurso repassado pelo partido à
empresa/pessoa fonte do dinheiro.
- Doações empresariais: proibidas desde a eleição de 2016. Pessoas poderiam
doar até 10% do rendimento.
- Novas regras futuras: A partir de 2018, o limite de doação de pessoa física
para cada cargo ou chapa será de 10 salários mínimos. Autofinanciamento em
debate. Financiamento coletivo. Limite de gastos.
4. Quais dados são estes?
- Os dados brutos das receitas das campanhas eleitorais são disponibilizadas
pelo Tribunal Superior Eleitoral (TSE) em seu Repositório de Dados Eleitorais:
http://www.tse.jus.br/eleitor-e-eleicoes/estatisticas/repositorio-de-dados-
eleitorais-1/repositorio-de-dados-eleitorais
- Baseado na autodeclaração das receitas de campanhas oficiais: muitas vezes,
é a "ponta do iceberg". Dados oficiais, mas inconsistentes ou mesmo ausentes.
- Podem ser atualizados retroativamento por meio de retificações solicitadas
pelos candidatos e partidos, que depois de aceitas pelo TSE atualizam o
Repositório de Dados.
- Dividido por eleições de 2002 e 2016. De 1994 e 1998, quando não havia
sistema eletrônico, há dados transcritos pelo prof. norte-americano David
Samuels, que foram tratados pelo pesquisador Bruno Carazza:
http://leisenumeros.com.br/2016/06/dados-sobre-financiamento-de-
campanhas-eleitorais-producao-legislativa-e-comportamento-parlamentar/
5. Mais sobre o banco de dados....
- Nem o TSE tinha....
- Reúne informações de 2002 a 2016 de todas prestações de contas já
registradas no TSE
- Cerca de 26gb de dados brutos. Dump final compactado tem aprox. 600mb
- Script de importação auditável e aberto: ele automaticamente baixa,
descompacta, limpa e importa todas planilhas em um banco de dados SQL
- 1 tabela (doacoes) por ora. Abstração dos doadores e candidatos da tabela de
doação em fase avançada
- Colaboradores são bem vindos!
6. Quais dados são estes?
Os campos da
prestação de contas
variam de ano a ano.
Para unificar a prestação
de contas de todas
eleições, era preciso
então unificar os campos
comuns em um esquema,
que incluísse também as
particularidades
relevantes de cada
eleição.
7. Quais campos são estes?
id= ID única da doação no
banco
uf= Estado
cpf = CPF e CNPJ
numero=n. da candidatura
doador_original=a partir
de 2014, revela origem
das doações indiretas
fonte=origem do recurso;
recurso=Estimado,
financeiro, cheque, etc;
data=dia da doação
motivo= despesa atrelada;
valor=em R$, não
atualizado
valor_at = valor atualizado
pelo IPCA;
tipo=
partido/comite/candidato
10. Fazendo perguntas em SQL
Termos básicos
SELECT = defina separado por vírgulas quais serão os campos consultados
FROM = define a tabela onde será a feita consulta. no nosso caso, "doações"
WHERE = define condições para a consulta, com operadores como AND e OR
GROUP by = defina o agrupamento das colunas. necessário para realizar somas,
por exemplo
ORDER by = ordena os resultados de modo ascendente (ASC) ou descendente
(DESC)
LIMIT = limitar a quantidade de resultados;
11. Fazendo perguntas em SQL
Alguns operadores para incrementar as buscas
SUM(): soma
AVG(): média
LENGTH(): quantidade caracteres de um campo;
COUNT(): quantidade de resultados de um grupo;
MIN()/MAX(): valores mínimos/máximos de um grupo;
20. Buscando empresas e filiais
- A mesma empresa pode ter vários CNPJs: as filiais de uma mesma empresa-
matriz possuem um prefixo comum de oito dígito (tudo antes da barra):
XX.XXX.XXX/YYYY-ZZ
- O nome da empresa pode estar grafado de forma incorreta. Vale a pena
consultar considerando possíveis variações nos nomes, inclusive foneticamente;
- A utilização de curingas nos ajuda a contornar estes problemas nas consultas;
- Busque sempre utilizar curingas quando procurar por nomes e posicione-os
estrategicamente
- Em 2014 e 2016, considerar também o campo "doador_original" e
"cpf_doador_original"
28. Atualizando valores
- Para analisar a evolução temporal de doações em uma série histórica, é
útil corrigir os valores. Isto porque o valor de - por exemplo - R$ 1 milhão
doado em 2002 não tem o mesmo "peso" que R$ 1 milhão em 2017.
- Calculamos a média da inflação por ano pelo IPCA e criamos um campo
novo para ter o valor atualizado, além do valor original (ref. setembro de
2017) :
29. Cruzando listas
Passo a passo:
- Listar a razão social de empresas, candidatos, doadores, CPFs e etc, em
planilhas.
- Carregar estas tabelas no SQL e com JOIN cruzar com as doações
registradas, incluindo filiais
- Deletar falsos positivos;
- Exportar e analisar os resultados
Script de exemplo: http://github.com/belisards/match-tse-odb/