1. DIGITALIZAÇÃO DE OBRAS EDIGITALIZAÇÃO DE OBRAS E
O FORMATO PDF/AO FORMATO PDF/A
Ursula BlattmannUrsula Blattmann
ursula@ced.ufsc.br
Local: LABINFOR – CIN – CED- UFSC
Das 14 às 18h
Florianópolis, 22 de outubro de 2010
Promoção : Núcleo de Pesquisas e Estudos em Arquivos
Contemporâneos
Instituto de Pesquisas BIBLION
URL: http://www.slideshare.net/blattmann
2. ESTRATÉGIAS DE PRESERVAÇÃO
DIGITAL
Ferreira (2006, p.33) foca a conservação do objeto
digital no seu formato originalformato original e do conteúdoconteúdo
intelectualintelectual. Na conservação do objeto digital no
seu formato original, pode se aplicar duas
estratégias:
a) Refrescamento: transferir a informação de
um objeto físico de armazenamento para outro
mais atual, antes que o primeiro deteriore.
b) Emulação: técnica de criar um ambiente
tecnológico que emule o ambiente original do
objeto digital. Mais relevante na preservação de
aplicações de software, como por exemplo, jogos
de computador.
3. O SUPORTE DO FORMATO DIGITAL
Evolução das fontes de informação
Pedra, papiro, papel, fotografias e microfilme,
para os mais recentes dispositivos, como fitas
magnéticas, fitas K7, discos flexíveis, fitas VHS
Disquetes, discos rígidos (HD), Compact Disc
(CD’s), videolaser, DVD’s e pen-drives
4. OBJETOS DIGITAIS
Sayão (2007, p.15) para manter os objetos digitais perenemente
acessíveis para uso, se requer algo mais do que preservar
simplesmente o artefato físico; é necessário considerar também várias
outras dimensõesoutras dimensões como:
a) Preservação física - foco está na preservação das mídias e na sua
renovação quando se fizer necessário;
b) Preservação lógica - foco os formatos e a dependência de hardware
e software que mantenha legíveis e interpretáveis a cadeia de bits;
c) Preservação intelectual - foco o conteúdo intelectual e sua
autenticidade e integridade;
d) Preservação do aparato – na forma de metadados - necessária para
localizar, recuperar e representar a informação digital; e,
e) Monitoramento e à instrumentalização da comunidade alvo -
audiência para o qual a informação de forma privilegiada se dirige,
no sentido de garantir que ele possa compreender plenamente a
informação no momento do seu acesso.
5. CONTEÚDO INTELECTUAL DA OBRA
DIGITAL
Ferreira (2006, p.36) lembra a importância de transferir periodicamente um
objeto digital de uma tecnologia de hardware e/ou software para outra mais
atual. Podem ser aplicadas as seguintes formas de migração:
a) Migração para suportes analógicos: consiste em converter um objeto
digital para um suporte não digital, como, por exemplo, imprimir um texto e
armazená-lo em papel.
b) Atualização de versões: utilizado essencialmente para software,
consiste em criar uma versão mais atual do mesmo.
c) Conversão para formatos concorrentes: consiste em converter o
objeto digital para outro formato concorrente, como, por exemplo, converter
uma imagem para o formato jpeg.
d) Normalização: consiste um reduzir o número de formatos de um
repositório de objetos digitais, criando condições favoráveis ao processo de
interoperabilidade entre sistemas distintos.
e) Migração a pedido: consiste em aplicar processos de conversão sempre
no objeto digital original, pois os diversos processos de conversão do objeto.
6. CONTEÚDO INTELECTUAL DA OBRA
DIGITAL (2)
f) Migração distribuída: consiste em aplicar
remotamente a um objeto digital um conjunto de
conversores, acessíveis na Internet, reduzindo assim
os custos de preservação.
g) Encapsulamento: consiste em manter o objeto
digital original inalterado até que a comunidade
efetivamente necessite do mesmo. Nesse momento
que o objeto deverá ser tratado.
h) Pedra de Rosetta digital: como no caso da Pedra
de Rosetta descoberta no delta do Nilo em 1799, essa
estratégia propõe preservar não as regras que
permitem decodificar o objeto, mas amostras
representativas desse objeto que permitam sua
recuperação.
7. O QUE PRECISA PARA DIGITALIZAR?
Análise do contexto e do documento
Autorização para efetuar a digitalização
Equipamentos
Softwares
Pessoas capacitadas
Estrutura de armazenamento
8. INICIAR A ORGANIZAÇÃO DA
DIGITALIZAÇÃO DA
DOCUMENTAÇÃO
Identificação
Documentos digitais preservados e
compartilhados
Documentos físicos organizados
Chaves (2008 ) apresenta:
9. • Disponibilizar a informação para a tomada de decisão;
• Atender às demandas fiscais e legais;
• Preservar a memória da organização (instituição, empresa);
• Atender às demandas sociais.
QUAIS OS MOTIVOS PARA
DIGITALIZAR?
10. ITENS PARA CONHECER UM
DOCUMENTO DE ARQUIVO?
Objetividade
Inter-relação
Unicidade
Caráter seriado
Autenticidade
Integridade
Chaves (2008 ) apresenta:
11. IDENTIFICAR O CONTEXTO DA
ORGANIZAÇÃO
Acessibilidade
Agilidade
Flexibilidade
Confiabilidade
Chaves (2008 ) apresenta:
12. PRINCÍPIOS DA ARQUIVÍSTICA
Proveniência = os documentos de uma mesma
procedência não devem misturar-se com os de outra
procedência;
Ordem original = Os documentos são produzidos com
base em um procedimento, pelo qual inatamente uns se
vão colocando após os outros;
Descrição coletiva = Princípio de descrever corpos
documentais coletivamente em vez de fazê-lo
individualmente.
Chaves (2008 ) apresenta:
13. IDENTIFICAR O VALOR DOS
DOCUMENTOS
Administrativo
Fiscal e Legal Histórico e
Científico
Chaves (2008 ) apresenta:
14. QUAL O CICLO DE VIDA DOS
DOCUMENTOS?
NASCIMENTO
REGISTRO
START
DESENVOLV.
TRAMITAÇÃO
ON
REPOUSO
ARQUIVO
STAND BY MORTE
EXPURGO
OFF
PERMANÊNCIA
ARQUIVO GERAL
PERMANENTLY
corrente inter.
permanente
Chaves (2008 ) apresenta:
15. ATENÇÃO!
• Entender o contexto documental antes de
qualquer coisa;
• Preservar o fundo arquivístico;
• Atentar para a suposta organização que há
dentro da desorganização;
• Não desprezar informações constantes na
situação originalmente encontrada;
• Acreditar que documento classificado de
forma errada dificilmente será localizado.
Chaves (2008 ) apresenta:
17. LEVANTAMENTO
• Permite a visão do todo;
• Evita surpresas;
• Viabiliza a padronização;
• Facilita a organização;
• Possibilita a pesquisa.
PROCESSO DE ORGANIZAÇÃO
Chaves (2008 ) apresenta:
18. CLASSIFICAÇÃO
• Reúne documentos por semelhança;
• Sistematiza a organização;
• Agiliza a composição do plano de
arquivo;
• Possibilita a pesquisa.
PROCESSO DE ORGANIZAÇÃO
Chaves (2008 ) apresenta:
19. SELEÇÃO
• Separa o “joio do trigo”: guarda
temporária, guarda permanente ou
eliminação;
• Antecede a eliminação;
• Aponta o foco de trabalho;
• Possibilita a pesquisa.
PROCESSO DE ORGANIZAÇÃO
Chaves (2008 ) apresenta:
20. ELIMINAÇÃO
• Fundamenta-se na Tabela de
Temporalidade;
• Regula o fluxo documental do arquivo;
• Deve ser registrada, autorizada e
divulgada.
PROCESSO DE ORGANIZAÇÃO
Chaves (2008 ) apresenta:
21. ORDENAMENTO
• Estabelece critério de ordem
(alfabética, numérica ou cronológica);
• Corresponde ao início da Indexação;
• Disposição na pasta/caixa
• Facilita a pesquisa.
PROCESSO DE ORGANIZAÇÃO
Chaves (2008 ) apresenta:
22. INDEXAÇÃO
PROCESSO DE ORGANIZAÇÃO
• Estabelece índices de busca;
• Permite busca mais precisa;
• Representa o elo entre o documento
físico e os registros no sistema;
• Facilita a pesquisa.
Chaves (2008 ) apresenta:
23. PROCESSO DE DIGITALIZAÇÃO
Os formatos de arquivos com especificações
proprietárias e abertas, também são
encontrados em softwares com grande aceitação
de mercado, como o Adobe Acrobat. Alguns
desenvolvedores disponibilizaram publicamente
suas especificações, permitindo que outras
empresas produzam software que possam utilizá-
los.
Existem ainda vários de formatos
proprietários e abertos, que são adotados
como norma, como é o caso do PDF. Existem
ainda os formatos não proprietários e com
especificação aberta como exemplo o PDF/A.
24. SOFTWARES E PADRÕES
Software BrOffice suporta nativamente o formato de arquivo ODF Open
Document Format , criado em 1999 Formato Aberto de Documentos.
A versão 1.0 do ODF, finalizada pelo OASIS em 2005 foi aprovada por
unanimidade pela ISO, em Março de 2006, como Norma Internacional, a
norma ISO/IEC 26.300:2006. Em Maio de 2008, o ODF foi aprovado e
publicado pela ABNT como norma brasileira a NBR ISO/IEC 26.300.
No Brasil, as definições referentes às tecnologias associadas à
interoperabilidade são definidas pelos Padrões de Interoperabilidade de
Governo Eletrônico (e-PING)
(
http://www.governoeletronico.gov.br/acoes-e-projetos/e-ping-padroesde-interoperab
)
De acordo com e-Ping, para que se conquiste a interoperabilidade,
faz-se necessário o engajamento da sociedade num esforço contínuo para
assegurar que sistemas, processos e culturas de uma organização sejam
gerenciados e direcionados para maximizar oportunidades de troca e reuso de
informações, interna e externamente ao governo federal.
25. E-PING
Ministério do Planejamento e Orçamento e Gestão do Governo do
Brasil disponível em (
http://www.governoeletronico.gov.br/acoes-e-projetos/e-ping-padroesde-interop
) a arquitetura e-PING cobre o intercâmbio de informações entre os
sistemas do governo federal – Poder Executivo e as interações com:
•a) Cidadãos;
•b) Outras esferas de governo (estadual e
•municipal);
•c) Outros Poderes (Legislativo, Judiciário e
•Ministério Público Federal);
•d) Governos de outros países;
•e) Empresas (no Brasil e no mundo);
•f) Terceiro Setor.
27. O QUE É O FORMATO PDF/A?
Portable Document Format PDF, criado pela
Adobe Systems:
1990 – Adobe PostScript
1992 – Divulgado o Formato PDF
1994 – Distribuição gratuita software Acrobat
Reader http://www.adobe.com/br/downloads/
1999 – American National Standards Institute -
ANSI padrão de intercâmbio protegido de
conteúdo impresso
28. O QUE É O FORMATO PDF/A?
2000 – e-book Stephen King “Riding the Bullet”
2003 – Suporte para XML e formulários
2005 – Library of Congress, National Archives e
Records Adminitration e várias empresas de
Tecnologias da informação elegeram formato
para preservação a longo prazo dos documentos
INTERNATIONAL ORGANIZATION FOR
STANDARDIZATION. . ISO 19005-1:
Information and documentation - electronic
document file format for long-term preservation.
Geneva: ISO, 2005. pt. BU/UFSC Número de
Chamada: ISO 19005-1 I61i Pasta ISO 08
29. POR QUE USAR O FORMATO PDF/A?
PDF/A:PDF/A: Archive usado documentos a serem
preservados em bibliotecas, arquivos e centros de
documentação.
32. PDF/A
Aprovado pela ISO em maio de 2005, o PDF/A fornece
especificações para a criação, a visualização e a
impressão de documentos digitais para uma
preservação a longo prazo. Os arquivistas e os
profissionais de gerenciamento de documentos e de
conformidade industrial podem usar o Acrobat X para
preservar e proteger com facilidade os documentos
finais de registro como arquivos independentes,
ajudando a garantir o acesso futuro à informação.
33. PDF/E
Ratificado pela ISO como um padrão aberto em
junho de 2007, o PDF/E fornece especificações
para a criação, a visualização e a impressão de
documentos utilizados em fluxos de trabalho de
engenharia. Arquitetos, engenheiros,
profissionais da construção e equipes de
fabricação de produtos podem utilizar o Acrobat
X para facilitar o intercâmbio de documentações
e desenhos com outros profissionais da cadeia de
fornecimento e para agilizar a revisão e a
marcação do documento.
34. PDF/X
As diversas versões do PDF/X, que foi o primeiro
padrão PDF da ISO, em 1999, fornecem
especificações para a criação, a visualização e a
impressão de páginas prontas para a impressão
ou para a imprensa.
Este padrão define algumas configurações do
PDF que causam um impacto em aspectos
críticos da impressão, tais como espaço de cor e
trapping. Profissionais da área de impressão,
projetistas gráficos e outros profissionais de
criação podem utilizar o Acrobat X para a criação
e distribuição de arquivos previsíveis e prontos
para impressão compatíveis com o padrão PDF/X.
35. OUTROS FORMATOS EM PDF
PDF/UA para a criação de arquivos PDF que
sejam acessíveis universalmente para pessoas
com deficiência visual ou mobilidade limitada.
PRC para a representação de modelos em 3D e
montagens em um formato de arquivos 3D,
ideal para o armazenamento, o carregamento e
a exibição de diversos tipos de dados em 3D.
PDF/VT para a criação, a visualização e a
impressão de arquivos utilizados na indústria
de impressão variável e transacional, tais como
declarações bancárias e faturas de negócios.
36. VEJA MAIS SOBRE PDF/A
ASOREY, Manuel. Introducción al PDF/A. PDF/A Competence Center
Webinars , 2010. Disponível em: <
http://www.slideshare.net/masorey/introduccion-al-pdfa >.
FANNING , Betsy. PDF/Archive: Preserving Electronic Documents.
Disponível em <
http://www.slideshare.net/bfanning/pdfarchive-preserving-electronic-documents
>.
POE, Stephen D. PDF/A 101: An Introduction . 1st Intl. PDF/A Conference,
Amsterdam 2008, 10 April 2008 . Disponível em: <
http://www.slideshare.net/sdpoe/pdfa-an-introduction >.
SULLIVAN, Susan J. Preserving PDF Documents: Exploring the PDF/A
Standard. Chicago, 2005. Disponível em: <
http://www.slideshare.net/Nedrick/arma-september-2005-chicago >
37. AGRADECIMENTOS
Agradeço aos :
Organizadores da SEPEX 2010 UFSC pelo espaço e oportunidade
Ao Departamento de Ciência da Informação e ao Centro de Ciências da
UFSC pelo uso do Laboratório de Informática
Aos participantes do minicurso pela curiosidade e dedicação .
Ao Curso de Graduação em Arquivologia da UFSC por estimular iniciativas
desta natureza.
Em especial a Ana Luiza ChavesAna Luiza Chaves pela apresentação disponível no
Slideshare no sentido de facilitar a introdução e importância da organização
de arquivos :
CHAVES, Ana Luiza. Organização, automação (ged) e digitalização. Fortaleza, 11
de agosto de 2008. Evento sobre Organização, GED e Digitalização na Biblioteca
Pública Fortaleza-CE. Disponível em: <
http://www.slideshare.net/ivanezjunior/palestra-dia-110808-ana-maria-luiza-evento-
sobre-organizao-ged-e-digitalizao-presentation >.
38. REFERÊNCIAS
ADOBE Systems Incorporated. Família Adobe Acrobat / Acrobat e padrões PDF. 2010 .
CHAVES, Ana Luiza. Organização, automação (ged) e digitalização. Fortaleza, 11 de agosto de 2008. Evento
sobre Organização, GED e Digitalização na Biblioteca Pública Fortaleza-CE. Disponível em: <
http://www.slideshare.net/ivanezjunior/palestra-dia-110808-ana-maria-luiza-evento-sobre-organizao-ged-e-digitalizao-
presentation >.
FERREIRA, M. Introdução à preservação digital: conceitos, estratégias e actuais consensos. Guimarães, Portugal:
Escola de Engenharia da Universidade do Minho, 2006. Disponível em: <
https://repositorium.sdum.uminho.pt/handle/1822/6411 >.
MÁRDERO ARELLANO, Miguel Ángel. Critérios para a preservação digital da informação científica. Brasília,
2008. 356f. Tese(Doutorado em Ciência da Informação). Programa de Pós-Graduação em Ciência da Informação.
Universidade de Brasília, Brasília, 2008. Disponível em: <
http://bdtd.bce.unb.br/tedesimplificado/tde_busca/arquivo.php?codArquivo=4547 >.
NATIONAL ARCHIVES AND RECORDS ADMINISTRATION. NARA. Disponível em:<
http://www.archives.gov/index.html >.
PDFLIB. XMP in PDF/A. Disponível em: < http://www.pdflib.com/knowledge-base/xmp-metadata/ >.
SAYAO, L. F.. Padrões para bibliotecas digitais abertas e interoperáveis. Encontros Bibli, v. 1, p. 2, 2007. Disponível
em: < http://www.periodicos.ufsc.br/index.php/eb/article/viewFile/461/463 >.
TAMMARO, Anna Maria; SALARELLI, Alberto. A biblioteca digital.
Brasília: Briquet de Lemos, 2008. 377p.
Wensing, Jairo. Preservação e recuperação de informação em fontes de informações digitais: estudo de caso
do Greenstone. 2010. 219 p. Dissertação (Mestrado em Ciência da Informação) – Programa de Pós Graduação em
Ciência da Informação, Universidade Federal de Santa Catarina, Florianópolis, 2010. Disponível em: <
http://www.cin.ufsc.br/pgcin/Wensing%20Jairo.pdf >.