O documento discute a preservação digital de documentos, abordando suas principais características e elementos de identificação, como metadados e formatos digitais. É apresentado o processo de preservação na gestão eletrônica de documentos e características arquivísticas a serem consideradas, como fixidez, organicidade e autenticidade. Também são descritos suportes digitais como CDs, DVDs e dispositivos de memória USB usados nesse processo.
1. Oficina preservação digital
Módulo 2: Preservação digital:
principais características e elementos
de identificação
2. Roteiro do segundo módulo:
• Preservação digital na gestão eletrônica de
documentos.
• Características “arquivísticas” a serem
consideradas no processo de preservação da
documentação e informação digital.
• Metadados: identificação e principais iniciativas.
• Suportes trabalhados para a preservação digital.
• Formatos de objetos digitais.
3. Preservação digital na gestão eletrônica de
documentos.
• As novas tecnologias da informação trouxeram grandes
desafios para os arquivos, especialmente a utilização
dos computadores que agilizou o processo de
produção de documentos e tornou mais dinâmicos o
acesso e o uso dos mesmos. Por outro lado,
intensificou-se a reprodução e a produção indevida de
documentos e o armazenamento e a preservação
tornaram-se preocupações constantes na pauta da
arquivologia. A automação dos arquivos, ou seja, a
implementação de computadores à prática arquivística,
tornou o trabalho na área mais ágil, porém, mais
complexo.
6. Preservação digital na gestão
eletrônica de documentos.
• A partir dos anos 1970/1980 surgimento do
Gerenciamento Eletrônico de Documentos (GED), que
se constitui em uma ou mais tecnologias aplicadas na
gestão de documentos, abrangendo tarefas para a sua
criação, acesso, tramitação e/ou destinação. Tais
tecnologias direcionam-se tanto a documentos
convencionais quanto eletrônicos e digitais.
• De acordo com o CONARQ (2011, p.10) “conjunto de
tecnologias utilizadas para organização da informação
não-estruturada de um órgão ou entidade, que pode
ser dividido nas seguintes funcionalidades: captura,
gerenciamento, armazenamento e distribuição.”
7. Preservação digital na gestão
eletrônica de documentos.
• “O gerenciamento arquivístico de documentos
eletrônicos se constitui hoje no maior desafio da
comunidade arquivística em todo o mundo. As
peculiaridades dos documentos em suportes
magnéticos e digitais têm suscitado uma série de
questionamentos sobre as práticas arquivísticas
adotadas até o advento desse tipo de informação,
bem como sobre os fundamentos teóricos que as
permeiam. (RONDINELLI, 2004 apud Shafer e
Constante, 2012). “
8. Características “arquivísticas” a serem consideradas no
processo de preservação digital
• “Documento arquivístico é um conjunto de
dados estruturados, apresentados em uma
forma fixa, representando um conteúdo
estável, produzido ou recebido por pessoa
física ou jurídica (pública ou privada), no
exercício de uma atividade, observando os
requisitos normativos da atividade à qual está
relacionado, e preservado como evidência da
realização dessa atividade (SANTOS, 2014)”
9. Características “arquivísticas” a serem consideradas no
processo de preservação digital
• Fixidez
“A transmissão de uma informação do
documento está vinculada ao conteúdo em si,
mas, também, à sua disposição (apresentação)
formal. No mundo digital o documento tende
a não apresentar fixidez. É, portanto,
necessário agir no sentido de garantir que os
documentos arquivísticos institucionais
apresentem esta característica.”
10. Características “arquivísticas” a serem consideradas no
processo de preservação digital
• Organicidade
“conjunto de relações que um documento
possui com os demais documentos vinculados
a uma mesma atividade e, também, em nível
macro, com o fundo ao qual faz parte. Essa
característica é uma das principais diferenças
entre os documentos arquivísticos e outros
registros informacionais.”
11. Características “arquivísticas” a serem consideradas no
processo de preservação digital
• Naturalidade
“Os documentos arquivísticos não são coletados
artificialmente, mas produzidos e recebidos
em um processo natural vinculado aos
interesses da instituição e à conformidade
legal de seus atos, e são assim acumulados. É
enfaticamente aconselhada a utilização de
modelos de descrição arquivística .”
12. Características “arquivísticas” a serem consideradas no
processo de preservação digital
• Unicidade
• “O documento arquivístico é único em sua função
e na relação orgânica com os demais documentos
da ação na qual está envolvido. Mesmo que
possua várias vias ou cópias, se cada uma exerce
uma função única vinculada à sua produção e uso
pela instituição e ao seu vínculo com outros
documentos relativos a uma mesma atividade,
está respeitada a unicidade. Não significa que
não existem cópias, mas que se cada uma tem
uma finalidade, elas são únicas. “
13. Características “arquivísticas” a serem consideradas no
processo de preservação digital
Autenticidade:
• Controle do processo de criação, manutenção e custódia do
documento arquivístico, o que, em análise inicial, evitaria
sua alteração não autorizada. Envolve preponderantemente
a relação do documento com o produtor e sua capacidade
de ser utilizado para os fins de sua criação.
• os documentos são o que aparentam ser (perceptível pelos
seus elementos identificadores) e não foram alterados.
• integridade (encontra-se completo e não sofreu alteração
não autorizada ou não documentada) e identidade
(características que identificam o documento de forma
única, distinguindo-o dos demais) .
• Diplomática contemporânea.
14. Metadados: identificação
• Metadados são dados que descrevem atributos de um
recurso. Eles suportam um número de funções: localização,
descoberta, documentação, avaliação, seleção etc.;
• Metadados fornecem o contexto para entender os dados
através do tempo.
• Utilizados para a descrição, que servirão tanto ao suporte, ou
seja, o meio pelo qual o documento é disposto, quanto ao
conteúdo.
• Preservar a proveniência do documento eletrônico;
resguardar as características da forma e do suporte da
tipologia dos documentos; recuperar a sua relação orgânica e
seu contexto de produção; definir os responsáveis (pessoas
físicas ou jurídicas) pela produção do item; e descrever
sinteticamente o conteúdo.
15. Metadados: identificação
• A primeira categoria, metadados do sistema eletrônico,
consiste em dados que descrevem o sistema
operacional, o programa que gera os documentos, a
localização física dos documentos no sistema
eletrônico (...) A segunda categoria, metadados dos
documentos, por outro lado, consiste em dados que
colocam o documento dentro do seu contexto
documentário e administrativo no momento da sua
criação (...) Em alguns sistemas eletrônicos, tais dados
são armazenados no dicionário de dados; em outros
são reunidos num perfil do documento anexado ao
documento arquivístico.
16. Metadados: principais iniciativas
Metadata Requirements Project (<
http://www.archimuse.com/papers/nhprc/BACartic.html >)
• iniciativa desenvolvida na University of Pittsburgh, que propõe um modelo
de referência para intercâmbio de registros visando à preservação digital
no contexto dos negócios. O conjunto de metadados definido possibilita
acesso seguro a documentos de transações comerciais e, portanto, lhes
atribui valor de prova legal, por um longo período de tempo. módulos
funcionais: organização, sistemas, aquisição de registros, utilização e
manutenção.
Dublin Core Metadata Initiative
• Metadados criados automaticamente para que não se tornem ambíguos
em função de alterações no ambiente da instituição. i) termos básicos
para descrição, como: nome, etiqueta de identificação, identificador Web,
definição etc. ii) termos de descrição adicionais, como: comentário,
referências, domínio, versão, dentre outros; e iii) termos para definição de
contexto, como: esquemas de vocabulário, sintaxe de esquemas de
classificação, classes, vocabulário de tipos, dentre outros
17. Metadados: principais iniciativas
Preservation Metadata for Digital Collections Initiative
• Baseado no OAIS, projeto da National Library of Australia que
objetiva manipular, para fins de preservação, coleções e
documentação de bibliotecas, arquivos de publicações digitais on-line,
publicações digitais e coleções (digitais ou analógicas) de
áudio, coleções de textos e imagens.
Metadata Encoding and Transmission Standards
• Também baseado no OAIS, desenvolvida pelo Network
Development and MARC Standards Office da U.S. Library of
Congress, se fundamenta no padrão OAIS e propõe um padrão de
metadados em formato Extended Markup Language (XML) para
gerenciar coleções de objetos digitais. Esté é um padrão para
codificação descritiva, administrativa e estrutural de metadados
que foi especificamente criado para bibliotecas digitais.
18. Suportes trabalhados para a preservação digital:
documentos eletrônicos e digitais
• Documento digital: “documento codificado em dígitos binários,
acessível por meio de sistema computacional”
• documento eletrônico: “gênero documental integrado por documentos
em meio eletrônico ou somente acessíveis por equipamentos
eletrônicos, como cartões perfurados, disquetes e documentos
digitais.”
• Câmara Técnica de Documentos Eletrônicos: documento eletrônico é
acessível e interpretável por meio de um equipamento eletrônico
(filmadora, computador, videocassete), podendo ser registrado e
codificado em forma analógica ou em dígitos binários. Já um
documento digital é um documento eletrônico caracterizado pela
codificação em dígitos binários e acessado por meio de sistema
computacional.
• Todo documento digital é eletrônico, mas nem todo documento
eletrônico é digital.
• Documento híbrido: possui parte em analógico e parte em digital.
19. Suportes trabalhados para a
preservação digital
• Discos magnéticos ou disquete: corresponde a um disco de
material flexível, coberto por uma superfície magnética,
recoberto por uma capa de plástico ou vinil, utilizado para
o armazenamento de dados. Foi inventado em 1971, e
possui como termo equivalente em inglês a expressão
“floppy-disk”, que significa disco flexível. essa ferramenta
foi o principal dispositivo de armazenamento utilizado nos
microcomputadores entre o final dos anos 70 e início dos
anos 90. Pode ter o tamanho de 3,5 polegadas com
capacidade de armazenamento de 720 KB (DD = Double
Density) até 2,88 MB (ED = Extra Density), embora o mais
comum seja 1,44 MB (HD = High Density), ou 5,25
polegadas, com armazenamento de 160 KB (Single Side) até
1,2 MB (HD).
21. Suportes trabalhados para a
preservação digital
• CD-R (CD-Recordable): é um disco fino, elaborado com
policabornato, que utiliza a tecnologia Dye-based.
Corresponde a um sistema baseado em alterações das
características de um tipo de tinta, que é utilizado para
a gravação de dados e músicas. A tecnologia dye-based
estrutura o CD-R em cinco camadas: a primeira é uma
camada de proteção, que rotulamos o CD-R; a segunda
camada é o “lacquer”; a terceira é a liga metálica,
camada reflexiva; a quarta camada é a “dye layer”,
onde são gravados os dados; e a quinta camada é a de
policarbonato.
• CD-RW: permite ao utilizador gravar e regravar os
dados.
23. Suportes trabalhados para a
preservação digital
• Fita DAT (Digital áudio Tape); DDS (Digital Data
Storage) e AIT (Advance Intelligent Tape):
correspondem a unidades de armazenamento
de dados informáticos. Essas fitas são
“unidades com grande capacidade de
armazenamento, podendo chegar a mais de
700 GB em uma única unidade. São
normalmente utilizadas para backup de
dados”.
25. Suportes trabalhados para a
preservação digital
• DVD (Digital Versatile Disc): corresponde a um tipo de disco para
armazenamento de mídias digitais. Surgiu da união de dois formatos: o
MMCD (Multi Media Compact Disc) e o SD (Super Density Disc) e foi
inicialmente denominado de DVD Consortion e DVD Forum. Esse
material pode armazenar até 17GB, em uma única mídia.
• Digital Video Disc Random Access Memory (DVD-RAM): gravável
domesticamente ou em empresas permite acrescentar ou apagar
dados mesmo após a finalização da gravação. A capacidade de
armazenamento para de um DVD-RAM varia de 4.7 GB (camada
simples) a 8.5 GB (camada dupla).
• Digital Video Disc Read-Only Memory (DVD-ROM): é utilizado para
gravação de vídeos e outros documentos;
• Blu-ray Disc ou DVD Blu-Ray: disco óptico utilizado para vídeo e áudio
em alta definição, e também para foto. Sua capacidade varia de 25 GB
(camada simples) a 50 GB (camada dupla).
27. Suportes trabalhados para a
preservação digital
• USB Flash Drive (Pen drive): são dispositivos
eletrônicos de armazenamento constituído
por uma memória flash, tem uma ligação USB
que permite sua conexão a uma porta USB de
um computador. A capacidade de
armazenamento varia entre 64MB a 64GB.
28. Suportes trabalhados para a
preservação digital
• Disco rígido: corresponde a um dos principais dispositivos para
armazenamento de dados no computador. Estruturalmente, os
discos rígidos são “feitos de metal (normalmente alumínio) em vez
do mylar ou plástico flexível, usado na fabricação dos disquetes”.
Apresenta grande capacidade de armazenamento de dados, que
pode chegar a 500GB em uma única unidade.
29. Formatos de objetos digitais
• PDF (Portable Document Format): Desenvolvido pela Adobe
Systems em 1992, atualmente o formato PDF é um padrão aberto
para troca de documentos eletrônicos mantido pela ISO 32000.
Quando se converte documentos, formulários, ilustrações e páginas
da Web em PDF, eles ficam com a aparência exata que terão se
forem impressos. Ao contrário dos documentos impressos, os
arquivos PDF podem conter links e botões em que se pode clicar,
campos de formulário, vídeos e áudio. Também podem incluir uma
lógica usada para automatizar processos corporativos de rotina. Um
arquivo PDF compartilhado pode ser lido por todos com o software
gratuito ou o aplicativo para dispositivos móveis.
• PDF/A: também conhecido como ISO 19005-1, é um derivado do
PDF, com restrições e algumas pequenas adições que tornam um
PDF confiável e adequado para armazenamento e leitura por longos
períodos de tempo.
30. Formatos de objetos digitais
• ASCII (American Standard Code for Information
Interchange):desenvolvido nos anos 1960, código binário usado para
representar textos em computadores, equipamentos de comunicação,
entre outros dispositivos que trabalham com texto.
• Optical Character Recognition (OCR) : tecnologia que permite
converter tipos diferentes de documentos, como papeis escaneados,
arquivos em PDF e imagens capturadas com câmera digital em dados
pesquisáveis e editáveis.
• Joint Photographic Experts Group (JPEG): desenvolvido em 1983,
permite comprimir um arquivo e obter como resultado final uma
imagem com qualidade razoável e pequena em tamanho. A relação
entre qualidade e tamanho da imagem diferencia o JPEG dos outros
formatos, porque facilita o armazenamento e distribuição de arquivos.
• DOC: arquivo de tratamento de texto do pacote Microsoft Office.
• Txt (arquivos de texto); XLS (planilhas excell); mdb (arquivos access)
31. Formatos de objetos digitais
• MP3 (MPEG-1/2 Audio Layer 3): comercializado desde 1995, e
baseado nas normas ISO/IEC 13818-3 e ISO/IEC 11172-3, é um
formato de compressão de aúdio, que permite armazenar
músicas e arquivos de áudio no computador em um espaço
relativamente pequeno, mantendo a qualidade do som.
• MP4 (MPEG-4 Part 14): baseado no padrão ISO/IEC 14496-14,
é um padrão que tem arquivos exclusivamente de áudio
(.m4a) e outros que trazem vídeo (.m4v, .m4p) em boa
resolução.
• FLAC (Free Lossless Audio Codec) criado por Josh Coalson, é
um formato de compressão, se aplicado ao master áudio
(arquivo original da gravadora) garante uma cópia perfeita da
música, mantendo todos os detalhes do arquivo original por
ser um método de compressão sem perdas.
32. Formatos de objetos digitais
• Audio Video Interleave (AVI): disponível desde
1992, formato encapsulador de áudio e vídeo
criado pela Microsoft cuja extensão oficial é .avi ,
formato esse conhecido pela maioria das versões
do Windows.
• Windows Media Video (WMV), conjunto de
formatos de vídeo desenvolvidos pela Microsoft,
concorrente do realaudio e quicktime.
• WAVE form audio format (WAV) formato-padrão
de arquivo de áudio da Microsoft e IBM para
armazenamento de áudio em PCs.
33. Formatos de objetos digitais
• SWF (Shockwave Flash): formato de arquivo de aplicações
web, criado pela Macromedia, atualmente adquirida
pela Adobe. Tem por característica suportar conteúdo
multimídia, além de ser relativamente leve, usado
extensivamente na Web para inserir conteúdo multimídia em
sites. O formato também é utilizado para desenvolver
animações e gráficos em outros meios, como filmes em DVD e
anúncios de televisão.
• Tagged Image File Format (TIFF/ bitmap):criado em 1986, é
um formato de arquivo raster (baseado na definição por
pixels) para imagens digitais, usado extensamente em
aplicações de manipulação de imagem tais como
Photoshop, DTP e scanners e também muito utilizado para o
intercâmbio de imagens entre diferentes plataformas.
34. Formatos de objetos digitais
• HTML (HyperText Markup Language): Consiste
em uma linguagem de marcação
utilizada para produção de páginas na web,
que permite a criação de documentos que
podem ser lidos em praticamente qualquer
tipo de computador e transmitidos pela
internet.