Paulo Augusto Loncarovich Gomes - UNESP - Mestrado em Ciência da Informação e Tecnologia, Universidade Estadual Paulista Júlio de Mesquita Filho - Faculdade de Filosofia e Ciências - Campus de Marília - Av. Hygino Muzzi Filho, 737 - Campus Universitário 17525-900 - Marilia, SP - Brasil - Caixa-Postal: 181
e-mail: loncarovich@marilia.unesp.br
Apresentado em 31 de Agosto de 2009.
Boas práticas de programação com Object Calisthenics
Metadados com XML
1. METADADOS e XML Formas de representação: dos catálogos aos repositórios digitais
Metadados
Fluxo de Criação de Metadados
Metadados e XML
Paulo Augusto Loncarovich Gomes – Bolsista CAPES
UNESP - Mestrado em Ciência da Informação e Tecnologia
2. Metadados Conceitos
Metadados (DD ou Dicionário de dados), ou Metainformação, são dados
sobre outros dados.
Os METADADOS permitem:
- Organizar os dados geográficos;
- Manter controle sobre os níveis de atualização dos dados;
- Documentar origem, formato, estrutura e sistemas de referência dos
dados;
- Permitir intercâmbio entre diferentes sistemas;
- Definir autoria, armazenamento, disponibilização e utilização dos dados.
Entretanto Metadados são as lentes pelas quais enxergamos a informação.
GOMES. METADADOS e XML, 2009.
3. Origem do Metadados
Teve início em 1995, por um grupo (Library of Congress, universidades,
empresas de TIC, organizações não governamentais, etc.) liderado pela
OCLC reuniu-se na cidade de Dublin, no estado americano de Ohio, para
propor uma padronização para estas informações sobre informações dos
arquivos digitais. Depois de mais algumas reuniões, o grupo chegou a um
conjunto mínimo de elementos para a identificação dos objetos digitais.
O conjunto ficou conhecido como Dublin Core (DC) e é mantido pela
Dublin Core Metadata Initiative. Em 2003, o DC tornou-se o uso padrão
ISO 15836.
GOMES. METADADOS e XML, 2009.
4. Fluxo de criação de Metadados
Podemos considerar que há três formas possíveis de relacionar estruturas de informação e as estruturas descritivas
de metadados relacionadas:
metadados embebidos é aquele que se pode conseguir nos recursos em formato HTML, onde os metadados podem
ser embebidos nos cabeçalhos dos documentos (em HTML é possível, através de uma “tag” <META>, a
especificação de qualquer elemento de metadados que se pretenda, o que poderá ser ignorado pelas máquinas de
processamento de HTML mas pode ser aproveitado por outros sistemas que identifiquem esses elementos).
metadados associados é inerente ao próprio conceito de hipertexto. Tomando como referência a tecnologia XML,
será possível definir um recurso como um grupo de ficheiros representando o nó de acesso (documento em XML), a
referência ao seu DTD ou espaço de nomes, referências para metadados, e ainda referências para outros ficheiros
com outros conteúdos (texto, som, imagens, etc.).
metadados separados é a do modelo da biblioteca tradicional, com bases de dados bibliográficas existentes em
sistemas próprios e os recursos, isto é, os livros, existindo nas prateleiras...
GOMES. METADADOS e XML, 2009.
5. Atributos dos Metadados
Identificam-se ainda quatro classes de atributos de metadados a levar em consideração:
Origem e modo de criação: processo e agente criador (exemplo: catalogador humano, termos de
indexação extraídos por uma aplicação informática, informação fornecida pelo editor, etc.).
Estrutura e semântica: metadados organizados segundo estruturas semânticas normalizadas ou
não, registos criados seguindo controlo de autoridades e vocabulários ou não (ex.: Dublin Core,
MARC, EAD, utilização das AACR, etc.).
Estatuto: metadados estáticos, dinâmicos, persistentes ou temporários (ex.: elementos estáticos
como título ou autor, ou elementos dinâmicos como preço, condições de acesso e uso, etc.).
Nível: nível de descrição (detalhado ou básico), descrição de colecções, objectos ou itens, etc. (ex.:
Dublin Core, MARC, RSLP, etc.).
GOMES. METADADOS e XML, 2009.
6. Criação de Interface para Metadados
Segundo Gohil, 1999, a criação de Interface para Metadados funcionais pode ser obtidas apenas com o uso de informações de
METADADOS , a completude dessas somente é alcançada através da participação do ambiente da computação, o qual
adiciona funcionalidades específicas como a dependência de controles, ajustes na aparência e a adição das regras do ambiente
(empresa, biblioteca, e outras).
Para realizar essa tarefa de interface METADADOS, é proposto o uso de cinco fontes de informação para o mecanismo gerador.
- A primeira é o uso dos METADADOS, esses são traduzidos durante a execução do sistema e originam as características
principais, consideradas básicas para os elementos da interface gerada, como tipos dos controles na tela, domínios de valores e
estruturas essenciais de ligação entre os elementos produzidos.
- A segunda é o uso de heurísticas, que permite a descoberta de propriedades e comportamentos com base em conceitos
simples, porém nem sempre utilizados. Como exemplo simplista cita-se a escolha da ordem de apresentação dos campos na
interface, o que pode ser feito seguindo a ordem de declaração dos atributos no objeto de negócio, sua obrigatoriedade ou nível
de complexidade.
- A terceira é o conhecimento empírico, que permite a reutilização de soluções de sucesso, obtidas através de experiências
anteriores. Esse tipo de informação é válido, principalmente no tocante à otimização das interfaces. A escolha do momento em
que validadores de conteúdo devem ser aplicados, adição de suporte a operações de arrastar e soltar e a correta relação entre o
tipo de dado e o controle de tela que o representa são apenas alguns exemplos.
- A quarta é o uso da inferência, a qual permite obter novas informações a partir de um conjunto inicial de valores. Nesse
contexto enquadram-se a construção de mensagens de auxílio para o usuário, nomes para controles de tela e o preenchimento
de valores default.
E finalmente, como quinta proposta o artifício para melhoria contínua das interfaces geradas, o uso de retroalimentação. Em
outras palavras, um histórico de uso e configuração é continuamente armazenado.
(Moreira e Mrack, 2002) e (Clifton, 2005)
GOMES. METADADOS e XML, 2009. Denomina-se 'heurística' à capacidade de um sistema fazer inovações e desenvolver técnicas de forma imediata e positivas para um determinado fim.
7. Classes de Requisitos para Metadados
Requisitos para o desenvolvimento de um modelo para METADADOS.
Metadados descritivos
Descrição bibliográfica e identificação dos recursos, tais como títulos, autores, informação de indexação ou
classificação, resumos, etc.
Metadados administrativos
Informação para administração do recurso, tais como elementos sobre a sua forma de aquisição, custo, etc.
Preservação dos recursos
Requisitos e condições, técnicas ou formais, para preservação a longo prazo.
Descrição estrutural e técnica dos recursos
Requisitos técnicos para manipulação do recurso (equipamento e aplicações), incluindo informação de autenticação,
chaves de codificação ou de descodificação, informação estrutural, etc.
Acesso, uso e reprodução dos recursos
Estabelece termos e garantias de acesso e uso, registo de acessos.
Metadados para gestão administrativa e técnica dos próprios metadados
Informação sobre os próprios metadados do recurso, nomeadamente a sua data e forma de criação, proveniência,
autenticidade, etc
GOMES. METADADOS e XML, 2009.
8. XML para descrição de METADADOS
Extensible Markup Language (XML) é linguagem de
marcação de dados (meta-markup language) que provê um
formato para descrever dados estruturados.
O uso da linguagem facilita as declarações mais precisas
do conteúdo e resultados mais significativos de busca
através de múltiplas plataformas. Portanto o XML é
utilizado como ferramenta para criação dos METADADOS.
O XML foi criado na década de 90 pelo W3C (World Wide
Web Consortium). Foi desenvolvido com o intuito de ser
uma METALINGUAGEM flexível, mas formal, permitindo a
troca de dados entre instituições, através da internet,
devido a adaptabilidade, seu uso é utilizado para trocar
informações complexas que não eram adequadamente
expressas em HTML.
GOMES. METADADOS e XML, 2009.
9. Exemplo XML e METADADOS
Dublin Core metadata editor
GOMES. METADADOS e XML, 2009.
10. XML e METADADOS
A complexidade de um modelo de dados depende da complexidade estrutural da informação que se quer
representar. A terminologia utilizada em geral para descrever dados semi-estruturados é baseada na teoria de
grafos. Szwarcfiter (1986)
Teoria dos Grafos
A Teoria dos Grafos é um ramo da matemática que estuda as
relações entre os objetos de um determinado conjunto.
GOMES. METADADOS e XML, 2009.
11. O Controle de qualidade para a criação de metadados
Um aspecto muito importante para o desenvolvimento de bases de dados de utilização por diversos grupos de usuários, com múltiplos
interesses, é a documentação de seu conteúdo. Uma vez encontrados os dados, normalmente é necessário conhecer como foram
coletados e que acurácias possuem. As descrições desses dados armazenados são comumente denominadas de METADADOS.
Organizações nos Estados Unidos, no Canadá e na Europa, por exemplo, já estabeleceram padrões uniformes. Esses padrões cobrem
conteúdo e semântica dos metadados, incluindo sua documentação detalhada e também sua representação digital. Esses
metadados são atualmente utilizados com níveis variados de detalhes, abordando, numa visão geral, os seguintes tópicos:
- Controle de qualidade: metadados detalhados são essenciais para permitir a garantia de qualidade da informação nas organizações
que produzem e mantém grandes bases de dados. Os metadados documentam por completo o ciclo-de-vida dos dados, incluindo sua
coleção, pré-processamento e manutenção. Esse tipo de metadados normalmente é muito pormenorizado;
- Intercâmbio de dados: devido ao alto custo na coleta e aquisição de dados geográficos, por meio de levantamentos específicos, o
intercâmbio desses dados é encorajado pelas organizações e promovido pelos produtores desses dados, tornando-se uma regra geral no
processamento da informação geoespacial. Os dados geográficos que faltam ou que são mal interpretados, representam uma das fontes
de erros e de incertezas quando se trata do uso de Bancos de Dados externos às organizações. Os detalhes encontrados nos
metadados, relativos a grandes bases de dados, contribuem para evitar esses tipos de problema;
- Diretórios de dados: a necessidade de reuso (reutilização) de conjuntos de dados caros motiva o estabelecimento de diretório de
dados. Eles permitem que os usuários conheçam e acessem as descrições de conteúdo de conjuntos de dados, sem ser necessário
acesso aos dados propriamente ditos a partir de sua base. Um exemplo típico: usuários estão interessados em conhecer e localizar dados
para uma determinada região geográfica. Diretórios devem ser criados pelas organizações contendo descrições do conteúdo dos
metadados de bibliotecas digitais a partir de suas fontes. Esses metadados tipicamente requerem um nível baixo de minúcias.
(JACOBSON, 1994)
GOMES. METADADOS e XML, 2009.
12. Benefícios da linguagem XML
- Esta característica confere à linguagem XML "habilidades" semânticas,
que possibilitam melhorias significativas em processos de recuperação e
disseminação da informação.
- As possibilidades e os benefícios reais em processos de recuperação da
informação.
- Buscas mais eficientes.
- Desenvolvimento mais flexível para documentos Web.
- Distribuição dos dados via rede de forma mais comprimida e escalável.
- Padrões abertos.
GOMES. METADADOS e XML, 2009.
13. METADADOS: criação de registros e Ferramentas
Editor de metadados DC-Dot's Dublin Core
http://www.ukoln.ac.uk/metadata/dcdot/
Ferramentas Dublin Core
http://dublincore.org/tools
Learning Object Metadata Editors
http://www.cancore.ca/editors.html
Ferramentas de metadados FGDC
http://www.nbii.gov/datainfo/metadata/tools/
Ferramentas Específicas OAI
http://www.openarchives.org/tools/tools.html
Editores e Ferramentas RDF
http://www.ilrt.bris.ac.uk/discovery/rdf/
Software TEI
http://www.tei-c.org/Software/index.html
Planilhas personalizadas para ferramentas de busca codificadas em EAD-Encoded Finding Aids
http://www.cdlib.org/inside/projects/oac/toolkit/templates/
GOMES. METADADOS e XML, 2009.
14. Considerações Finais
Dentro do contexto das Formas de representação: dos catálogos aos
repositórios digitais a Criação de METADADOS diretamente com
aúxílio da linguagem XML apresenta um fluxo de criação, interfaces,
controle de qualidade e benefícios considerável e relevância no que diz
respeito ao desenvolvimento de mecanismos de buscas e recuperação de
informação a partir da representação do conhecimento.
GOMES. METADADOS e XML, 2009.
15. Bibliografia
• AMBLER. User Interface Design: Tips and Techniques. Ambler, Scott W. 1998. Disponível em
http://www.ambysoft.com/userInterfaceDesign.pdf
• CLIFTON. A Dynamically Generated XML Data Editor. Clifton, Marc. Disponível em
http://www.codeproject.com/dotnet/xmldataeditor.asp
• JACOBSON, B. M.; JENNINGS, G D. & STALLINGS, C. 1994. Multi-User / Multi-Purpose GIS Databases.Computers in
Agriculture.Proceedings of The 5th International Conference. Orlando, ASAE: American Society of Agricultural Engineers.
• LUCCHESI. C. L.. Introdução à Teoria dos Grafos. 12º - Colóquio Brasileiro de Matemática. IMPA (Instituto de Matemática Pura e
Aplicada), 1979.
• MARCHAL, B. XML by example. Indianapolis : Que, 2000.
• Microsoft Developer Network Online – Web Workshop – XML Home http://msdn.microsoft.com/en-us/xml/default.aspx
• MOREIRA E MRACK. Sistemas Dinâmicos Baseados em Metamodelos. Moreira, Diego; Mrack, Marcelo. II Workshop de Computação
e Gestão da Informação – Univates. 2002.
• Organization for the Advancement of Structured Information Standards – http://www.oasis-open.org/home/index.php
• The XML Industry Portal – XML.ORG http://www.oasis-open.org/home/index.php
GOMES. METADADOS e XML, 2009.