O documento propõe a construção de uma Infraestrutura Nacional de Dados sobre Biodiversidade (INDBio) no Brasil. A INDBio terá uma arquitetura em forma de rede com instituições, atores, recursos e instrumentos interagindo. O objetivo é integrar e compartilhar dados sobre biodiversidade para apoiar a tomada de decisão na conservação.
Rumo à construção de uma Infraestrutura Nacional de Dados sobre Biodiversidade - INDBIO
1. Rumo à construção de uma
Infraestrutura Nacional de Dados
sobre Biodiversidade
“INDBIO”
Brasília – MCTI/CNPq – SiBBr
24 de novembro de 2014
Eduardo Dalcin
Núcleo de Computação Científica e Geoprocessamento
Diretoria de Pesquisas
Instituto de Pesquisas Jardim Botânico do Rio de Janeiro
2. Apresentação da Proposta
• Contexto
– Motivação e Justificativa
• A Proposta
– Visão Geral
– Elementos
– Situação atual
• Estamos no rumo?
4. Motivação e Justificativa
• Novembro 2011
– “Reunião de Peritos em Sistemas de Informação
sobre Biodiversidade – SIBBr”, em Brasília – DF
• Objetivo: apresentar aos presentes o “Projeto SiBBr” e
a “Coleta de subsídios para a definição da estratégia de
elaboração, implementação e consolidação do SIBBr
(“Road map”);
• Questões à serem respondidas pelos grupos de
trabalho, entre elas a questão “Qual deve ser a
estrutura (arquitetura) geral do sistema?”
• Criado o “Comitê Técnico Científico do SiBBr”
5. “...O projeto proposto irá remover as
barreiras identificadas através do
desenvolvimento do Sistema de Informação
sobre a Biodiversidade Brasileira (SIBBr) -
um sistema totalmente integrado de
informação da biodiversidade com
ferramentas de visualização estado da arte,
tendo por objetivo apoiar efetivamente os
processos de tomada de decisões que visam
à conservação da biodiversidade...”
Documento do Projeto, pg. 18
7. Motivação e Justificativa
• Reuniões do CTC
– Dezembro 2011
• Demandada a criação de um “GT de arquitetura” cuja
proposta era a “Revisão da arquitetura do Sistema”
– Fevereiro de 2012
• Discussão de “aspectos” da arquitetura, sem a visão de
um “modelo conceitual”
– Março de 2012
• Relato dos “avanços” do GT de arquitetura
8. 1ª Reunião da Arquitetura da INDBio
25 de abril de 2014
Instituições: EMBRAPA, GIZ, IBAMA, IBGE, ICMBIO, INPA, JBRJ, LNCC, MCTI, MMA, MPEG, RNP, USP
Convidados: FIOCRUZ, SCIELO, CI, UFRJ, BIOTA-SP, CRIA, UFG
Missão: Identificar e descrever os principais componentes da INDBio
10. Visão Geral
“...Neste documento
consideramos uma visão
em geral, em seu mais
alto nível de abstração,
onde elementos básicos
interagem entre si na
forma de uma rede.”
11. Visão Geral
“...Consideramos neste documento as seguintes definições de
“Arquitetura”:
• ‘‘The fundamental organization of a system, embodied in its
components, their relationships to each other and the
environment, and the principles governing its design and
evolution.’’ (ISO/IEC/IEEE, 2011);
• “A formal description of a system, or a detailed plan of the
system at component level to guide its implementation.”
(The Open Group, 2011);
• “The structure of components, their inter-relationships, and
the principles and guidelines governing their design and
evolution over time”. (The Open Group, 2011).”
12. “...Esta visão geral, aqui descrita,
não substitui, muito menos
descarta uma documentação que
prevê uma abordagem global ao
design, planejamento,
implementação e governança de
uma arquitetura formal, modelada
em níveis ou domínios, como:
Negócios (Business), Aplicação
(Application), Dados (Data) e
Tecnologia (Technology). Para tal,
um framework apropriado deve ser
utilizado, como o TOGAF - The Open
Group Architecture Framework
(Haren, 2011).”
13. Missão e objetivos
• Missão:
– “Proporcionar melhor tomada de decisão na conservação e no uso
sustentado e socialmente justo da biodiversidade por meio de uma
iniciativa governamental interdisciplinar voltada para qualificação,
integração e publicação de dados.”
• Objetivos:
– Assegurar ampla colaboração entre instituições, especialistas e grupos
temáticos;
– Assegurar o acesso aberto e público a dados de qualidade;
– Evitar a duplicação de esforços e fontes de informação inconsistentes;
– Garantir que o melhor conhecimento disponível e o rigor científico
sejam preponderantes na tomada de decisão.
14. Princípios da Arquitetura
• A INDBio possui uma organização em forma de rede, não linear, não
hierárquica, formada de elementos e interações e centrada em
Instituições;
• Os elementos da arquitetura podem se agregar em Unidades Funcionais;
Exemplo de Unidade Funcional
provedora de dados primários
15. Princípios da Arquitetura (cont.)
• A arquitetura é baseada no compartilhamento e reutilização de dados e
componentes entre as aplicações, e orientada a serviços, com a adoção de
padrões e protocolos abertos, largamente utilizados;
16. Princípios da Arquitetura (cont.)
• Todo o dado sobre biodiversidade disponível na INDBio deve
ter um conjunto de metadados associado, em formato aberto,
padronizado e também digitalmente acessível;
• Todo o dado sobre biodiversidade disponível na INDBio deve
ter um responsável pela sua qualidade, consistência e
integridade;
• Todo o dado sobre biodiversidade que trafega na INDBio é
considerado público, e seu uso é definido pela licença citada
nos metadados correspondentes;
18. Elementos:Instituições
“...As instituições 1 são
consideradas os elementos
fundamentais desta
arquitetura, uma vez que se
apresentam como agregadores
de outros elementos da
arquitetura. Além disto,
conferem à arquitetura solidez
institucional, que pode ainda
ser promovida por
instrumentos jurídicos e
normativos apropriados.”
(1) Instituições: Organizações
governamentais, das esferas
federal, estadual e municipal;
e sociais de direito privado,
sem fins lucrativos (Lei nº
9.637, de 15 de maio de 1998;
e Lei nº 9.790, de 23 de março
de 1999)
20. Elementos:Instituições
• Provedora de Dados
– Dados Mestres e de Referência
– Dados de Ocorrências
– Dados Ecológicos
– Produção Intelectual
– Dados Genéticos
– Dados de Germoplasma
• Bancos de Sementes
• Coleções Vivas
• Qualificadora de Dados
• Provedora de Infraestrutura
• Provedora de Ferramentas e Sistemas
• Provedora de Análise e Síntese
• ...
21. Instituições Provedoras de Dados Mestres e de
Referência
“...Dados Mestres e de Referência são aqueles que são
requeridos por diferentes grupos, processos e sistemas da
INDBio, e provêm contexto para os dados transacionais
(DAMA International, 2012 - adaptado).”
22. Instituições Provedoras de Dados sobre Ocorrências
“...As instituições detentoras de coleções
biológicas são um dos pilares fundamentares
da INDBio, oferecendo dados sobre ocorrência
para serem:
• Consumidos por outros sistemas de
integração, análise e síntese (machine
readable ou M2M);
• Consumidos por especialistas e utilizados
em processos de produção intelectual e
análise e síntese (human readable);
• Expostos à crítica visando à melhoria de
qualidade por especialistas e ferramentas
automatizadas ou assistidas (machine and
human readable);”
26. Instituições Provedoras de Dados sobre
Ocorrências
• O documento necessita ainda caracterizar:
– Coleções correlatas
• DNA
• Madeiras (xiloteca)
• Frutos (carpoteca)
• Etc...
– Outras fontes de dados de ocorrência
– Licenciamento
– “Citizen Science”
– Etc...
– Coleções Paleontológicas
32. Elementos:Atores
“...Neste documento,
reconhecemos dois grandes
grupos de atores: aqueles
relacionados com o conteúdo –
dados e informações, e aqueles
relacionados com a
infraestrutura, física e lógica,
que os suportam.”
“...Em relação aos
atores relacionados
com o conteúdo,
podemos ainda
agrupá-los em três
grupos, à saber:
Produtor,
Transformador e
Consumidor “
34. Organizações de atores
• Sociedades Científicas
• Redes temáticas
• Redes de especialistas
35. Elementos:Recursos
• Recursos de Infraestrutura
– Armazenagem
– Processamento
– Conectividade
– Plataformas, ferramentas e aplicativos
• Recursos de Dados
– Dados sobre espécies e suas características
– Dados sobre testemunhos, ocorrência e registro de
espécimes
– Dados Ecológicos ou Observacionais
– Dados sobre interações entre espécies
– Dados sobre ameaças
36. Recursos de Infraestrutura
• Processamento
• Armazenagem
• Conectividade
• Plataformas, ferramentas
e aplicativos
37. Recursos de Dados
• Dados sobre espécies e suas características;
• Dados sobre testemunhos, ocorrência e
registro de espécimes;
• Dados ecológicos ou observacionais;
• Dados sobre interações entre espécies;
• Dados sobre ameaças;
• Dados ambientais ou abióticos;
• ...
40. Elementos:Instrumentos
• Normas, Políticas, Decretos, Leis, etc.
• Padrões, Vocabulários e Ontologias
• Estratégia Nacional de Informação Sobre
Biodiversidade
• Sistema de Informação sobre a Biodiversidade
Brasileira - SiBBr
42. Normas, Políticas, Decretos, Leis, etc.
• Política Nacional do Meio Ambiente (Lei n.º 6.938, de 31 de agosto de 1981)
• Lei n.º 10.650, de 16 de abril de 2003 (Lei de Acesso à Informação Ambiental)
• Lei n.º 9.795, de 27 de abril de 1999 (Política Nacional de Educação Ambiental)
• Lei n.º 9.610/1998 (Lei de Direitos Autorais, LDA)
• Lei n.º 9.279/96, ou Lei da Propriedade Industrial (LPI)
• Lei n.º 12.527/2011, de 18 de novembro de 2011 (Lei e Acesso à Informação – LAI)
• Decreto n.° 76.623 de 1975, que trata da Convenção sobre o Comércio
Internacional de Espécies Ameaçadas de Fauna e Flora Silvestres (Cites)
• Decreto nº 6.666, de 27 de novembro de 2008: Institui a INDE
• Decretos legislativos nos. 02 e 03 de 1994, que disciplinam a Convenção da
Diversidade Biológica
• Decreto Federal Nº 4.339, de 22 de agosto de 2002. - Institui princípios e diretrizes
para a implementação da Política Nacional da Biodiversidade
• Resolução CONABIO no 06, de 03 de setembro de 2013 – Dispões sobre as Metas
Nacionais de Biodiversidade para 2020
• Portaria no. 43, DE 31 DE JANEIRO DE 2014 – MMA Pró-espécies
• Etc...
43. Padrões, Vocabulários e Ontologias
“...Padrões, vocabulários e ontologias são
elementos fundamentais da
interoperabilidade entre sistemas de
informação e, em última instância, são
elementos que possibilitam que a INDBio
funcione como uma rede.”
44. Estratégia Nacional de Informação Sobre
Biodiversidade
“... A Estratégia Nacional de Informação sobre
Biodiversidade é um documento que estabelece
diretrizes que irão orientar e priorizar as ações
nacionais e regionais para a instalação da
Infraestrutura Nacional de Informação sobre
Biodiversidade, seu funcionamento, evolução e
sustentabilidade.”
45. Estratégia Nacional de Informação Sobre
Biodiversidade
• Eixos prioritários
– Capacitação
– Comunicação
– Infraestrutura
– Governança
• Ações Estruturantes
– Oferta de capacitação em Informática na Biodiversidade, qualificação
e governança de dados, análise e síntese, Taxonomia, etc;
– Promoção da geração de produtos oriundos dos produtos e serviços
oferecidos pelo SiBBr, e da utilização destes produtos no apoio à
decisão;
– Oferta de infraestrutura de armazenagem e gestão de recursos
computacionais, infraestrutura adequada ao crescimento e
dinamização das coleções biológicas.
46. Sistema de Informação sobre a
Biodiversidade Brasileira - SiBBr
“...A instalação de uma infraestrutura
como a INDBio demanda um conjunto de
ferramentas, produtos e serviços que,
pelas suas características estruturais e
transversais, atuam como o “núcleo”
operacional desta Infraestrutura. Este
núcleo auxilia na implementação,
propagação e consolidação destas
ferramentas, produtos e serviços, no
momento inicial de instalação da INDBio,
onde esta estrutura é precária ou
inexistente. Além disso, funciona como
articulador central entre a demanda e a
oferta de informações sobre
biodiversidade pelos diferentes atores,
define e homologa padrões e protocolos
de interoperabilidade entre os sistemas e
garante um fluxo contínuo de dados e
informações de qualidade pela rede.”
47. Sistema de Informação sobre a
Biodiversidade Brasileira - SiBBr
Ferramentas, produtos e serviços
• Portal agregador de produtos e
serviços
• Cadastro Nacional de Coleções
Biológicas
• Agregador de dados de coleções
biológicas
• Serviço de imagem em alta resolução
• Serviço de Mapa
• Serviço de Modelagem
• Repositório de Produção Intelectual
• Resolvedor de nomes científicos
(“taxonomic backbone”)
• Serviço de Limpeza e Mineração de
Dados
• Serviço de Anotações
• Serviço de “Biodiversity Literature
Mark-up”
• Serviço de identificador único
persistente para objetos de coleção
biológica
• Repositório de códigos-fonte
• Repositório de “Workflow Científico”
• Registrador de Serviços
• Sistema de Suporte à Decisão
50. SiBBr - Portal agregador de produtos e serviços
Cadastro de
Coleções
Interface
única e
intuitiva
Dados de
Ocorrências
Dados sobre
Espécies
Ferramentas
de Análise e
Síntese
Produção
Intelectual
Imagens em
Alta
Resolução
Mapas
Anotações
Resolvedor
de Nomes
Códigos-fonte
Modelos
52. SiBBr - Cadastro Nacional de Coleções Biológicas
“...Coleções Biológicas desempenham um
papel central, fundamental e crítico em
qualquer iniciativa relacionada com a
informação sobre biodiversidade...
...Entretanto, não existe um Diretório
Nacional de Coleções Biológicas, nem
como proposição em nenhum dos
documentos acima, capaz de servir de
referência quantitativa e qualitativa das
coleções biológicas nacionais.
No contexto da INDBio, um diretório
nacional destes repositórios da
biodiversidade, seria capaz de fornecer
um Identificador Persistente Único para
estas coleções que, associado ao
Identificador Persistente Único do
testemunho do espécime (voucher)
depositado na coleção, cria uma forma
inequívoca de se referenciar à este
testemunho depositado em uma coleção,
facilitando a integração e
interoperabilidades destes dados (GBIF,
2011).”
65. SiBBr - Serviço de identificador único persistente
• Para conjuntos de dados
• Para objetos em coleções
• Para nomes científicos
• Para “taxa concept”
69. SiBBr - Sistema de Suporte à Decisão
“...Sistema de Suporte à Decisão (SAD) é um sistema
ou subsistema interativo, baseado em computador,
destinado a ajudar os tomadores de decisão a
utilizarem tecnologias de comunicação, dados,
documentos, conhecimento e / ou modelos para
identificar e resolver problemas, concluir tarefas do
processo de tomada de decisão, e tomar decisões.
“Sistema de Suporte à Decisão” é um termo geral
para qualquer aplicação de computador que
melhora a capacidade de uma pessoa ou grupo
para tomar decisões (Power, Burstein, & Sharda,
2011).
No nível conceitual, Power (2002) apud
(Hättenschwiler & Gachet) enumera cinco tipos de
Sistemas de Suporte à Decisão: Os dirigidos à
comunicação (Communication-Driven DSS), os
dirigidos à dados (Data-Driven DSS), Os dirigidos à
documentos (Document-Driven DSS), os dirigidos à
conhecimento (Knowledge-Driven DSS) e os
dirigidos à modelos (Model-Driven DSS) ...”
http://siscom.ibama.gov.br/painel
72. “Redator” do documento final
• Foi identificada pelo GT a necessidade de se
contratar um “Redator” para harmonizar as
diferentes contribuições, a exemplo do que foi
feito com o documento da INDE;
• Foi elaborado um ToR com os seguintes prazos:
– Assinatura do Contrato (T0)
– Plano de Trabalho (T0+7 dias)
– Primeira Versão (T0+21 dias)
– Versão Final (T0+60 dias)
73. Status do ToR para contratação do
“Redator”
abr
2014
Inicio da elaboração do ToR do
Redator
16/5/14
ToR enviado pelo CGEC à UGP
9/6/14
mai jun jul ago set out nov
Today
ToR na UGP aguardando
publicação no DOU
9/7/14
Apresentação da proposta e
formação do GT
25/4/14
9/7/14 Aguardando.... 24/11/14
74. Estamos “rumo à construção da INDBio”?
1º componente lançado em 1998
Primeiros habitantes: Novembro de 2000
75. Rumo à construção da INDBio
• Informação sobre biodiversidade é “transversal” – multi-institucional
e “multi-Ministerial”;
• Iniciativas precisam ser integradas;
• Duplicidade de esforços e inconsistências devem ser evitadas;
• A implementação da INDBio é um esforço integrado, de longo prazo;
• Um modelo de governança deve ser escolhido e implementado;
• É fundamental a formação de recursos humanos para gerir a INDBio e
seus dados;
• É fundamental a digitalização e qualificação dos dados das coleções;
• Um backbone taxonômico e nomenclatural está à caminho!
• Instituições precisam reconhecer seu papel e absorver as novas
responsabilidades em seu quadro de pessoal e orçamento;
• Deve haver espaço para a inovação – liderar é melhor que seguir
76. Rumo à construção da INDBio
• Pesquisadores precisam ser reconhecidos por métricas que
também valorizem o compartilhamento e qualificação de dados,
assim como a geração de dados primários inéditos
(preenchimento de lacunas espaciais e taxonômicas);
• Comunicação e articulação entre os diferentes atores, instituições
e gestores é fator crítico de sucesso da construção e consolidação
da INDBio. Não deve ser subestimado;
• Um “sistema” em si não resolve nada;
• É necessária uma visão compartilhada e dinâmica de uma
infraestrutura que englobe todos os aspectos desta apresentação
– e outros aqui eventualmente esquecidos – complementando a
visão de uma “e-Science” nacional, com a sua parte de “e-
Biodiversity”, oferecendo um “norte” para investimentos e
capacitação.
77. Eduardo Dalcin, Ph.D.
Instituto de Pesquisas Jardim Botânico do Rio de Janeiro
Diretoria de Pesquisas
Núcleo de Computação Científica e Geoprocessamento
edalcin@jbrj.gov.br
Obrigado!