Otimização da configuração amostral para o mapeamento pedométrico
1. Otimização da configuração amostral
para o mapeamento pedométrico
Autor
Alessandro Samuel-Rosa(1)
Orientação
Lúcia Anjos(1)
, Gustavo Vasques(2)
, Gerard Heuvelink(3)
(1) Universidade Federal Rural do Rio de Janeiro, Seropédica, Brasil.
(2) Embrapa Solos, Rio de Janeiro, Brasil.
(3) ISRIC – World Soil Information, Wageningen, Holanda.
2. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Estrutura
● Definição do problema
● Solução e estratégia de trabalho
● Componentes
● Trabalho futuro
3. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Definição do problema (1)
● Mapeamento pedométrico
– Modelo desconhecido
● Observações pontuais
– Identificar e estimar o componente determinístico
– Identificar e estimar o componente estocástico
– Fazer predições espaciais (krigagem)
● Objetivos diferentes, configurações diferentes
Z (s)=μ(s)+ε(s)
4. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Configuração amostral para estimar o variograma
Imagem gentilmente
fornecida por Murray Lark
5. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Definição do problema (2)
● Algoritmos para amostragem (inteligência artificial)
– Grande número, porém dispersos ou de acesso
limitado
– Fonte fechada e/ou do tipo “caixa preta”
– Muito específicos, limitados para outros usos
● Compromete maior adoção e desenvolvimento,
correção de erros e bugs
– Ex.: cLHS (Minasny & McBratney, 2006) dá maior peso
às covariáveis contínuas do que categóricas
6. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Solução e estratégia de trabalho
● Criar um pacote de otimização amostral
– é FOSS, fácil e popular
● Iniciar a partir de pacotes existentes
– intamapInteractive (Edzer Pebesma, Jon Skoien, et
al.), e clhs (Pierre Roudier)
– Otimização usando recozimento simulado (simulated
annealing)
● Ferramentas para construção do pacote
– RStudio + roxygen2 + Rcpp + GitHub
8. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – funções objetivo (1)
● Cinco funções objetivo singulares
● Tendência, variograma, krigagen
– CORR: associação/correlação entre covariáveis
– DIST: distribuição marginal das covariáveis
– MSSD: média quadrática da distância mais próxima
– MKV: média/máxima variância da krigagem
– PPL: número de pontos/pares por lag
● Função definida pelo usuário (USER)
9. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – funções objetivo (2)
● Duas funções objetivo múltiplas
● Tendência, variograma, krigagen
– ACDC: CORR + DIST
● Melhoria do método de Minasny & McBratney (2006)
– PAN (ou MOOPa): ACDC + PPL + MSSD
● Estudo de doutoramento (Gerard Heuvelink, Dick Brus,
Gustavo Vasques, Lucia Anjos)
● Sampling for digital soil mapping in terra incognita
● European Journal of Soil Science
10. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – otimização multiobjetivo
● Formulação do problema de otimização
● Agregação
– Soma ponderada
● Escalonamento
– Máximo e mínimo
– Evitar dominância numérica
– Ex.: PCA e cLHS
f i
es
=
f i(x)−f i
o
f i
max
−f i
o
U =∑
i=1
k
wi f i(x)
f(x)=(f 1(x),f 2(x),...,f k (x))
11. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – recozimento simulado
1. Pontos selecionados aleatoriamente
2. Calcula o valor da função objetivo
3. Muda a posição de um ponto qualquer
4. Calcula o valor da função objetivo
1. Melhorou? Aceita a nova posição!
2. Piorou? Qual a chance de aceitar um ponto pior?
5. Repete 3 e 4 até encontrar a solução final
12. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Comp. – visualização
● Evolução do estado
de energia
● Evolução da
probabilidade de
aceitação
● Estados de energia:
inicial e último melhor
● Evolução do tamanho
do gráfico de
pesquisa
● Configuração inicial
do sistema (cinza)
● Configuração atual
do sistema (preto)
Exemplo usando o conjunto de dados meuse do pacote do sp.
Função MSSD com 100 pontos e 1000 iterações.
13. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Trabalho futuro – dois caminhos
● Melhorar/Estender
– Encontrar/corrigir
bugs
– Superfície de custo
– Mais funções objetivo
– Adir/deletar pontos
– C++
– ...
● Reformular
– Simplificar a estrutura
– Separar funções
objetivo do
recozimento simulado
– Linguagem mais
eficiente (C/C++)
– ...
14. Apresentação: Otimização da configuração amostral para o mapeamento pedométrico
Autor: Alessandro Samuel-Rosa (UFRRJ)
Orientação: Lúcia Anjos (UFRRJ), Gustavos Vasques (Embrapa Solos), Gerard Heuvelink (ISRIC)
Outras informações
● Esse trabalho foi apoiado pelo governo brasileiro
– CAPES (Processo BEX 11677/13-9)
– CNPq (Processo 140720/2012-0)
● O código fonte do pacote do spsann está disponível
gratuitamente em https://github.com/samuel-rosa
– Contribuições são bem vindas!
● Esse documento está disponível gratuitamente em
http://www.slideshare.net/alessandrosamuelrosa