Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


O Formato PDF, Notas de estudo de Biblioteconomia

Versa sobre o Formato PDF/A1

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 09/10/2009

raffaello-magni-5
raffaello-magni-5 🇧🇷

2 documentos

1 / 3

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
O PDF/A-1 como meio de preservação de documentos electrónicos a longo prazo
A criação e a conversão de documentos em formato digital têm colocado, nos últimos
anos, diversas questões no seio do mundo da informação, especialmente no que
concerne à preservação de longo prazo. Como é que podemos garantir que um
documento nado-digital ou digitalizado será correctamente visualizado (isto é, tal como
foi originalmente criado) dentro de 20 ou 30 anos? De facto, há que reconhecer que o
ritmo de obsolescência das novas tecnologias de informação e comunicação impôs uma
ruptura relativamente a outros suportes não informáticos, como o papel e o microfilme,
em que a inteligibilidade da informação, do ponto de vista intelectual, pode estar apenas
dependente da capacidade interpretativa humana e de tecnologia totalmente analógica.
Todavia, também é consabido que os suportes clássicos constituem um obstáculo ao
acesso remoto à informação e que o uso e abuso do papel têm dificultado a sã gestão
arquivística. Tendo em conta esses senãos, a aceitação e utilização de suportes digitais
com fins de arquivo de longa duração têm sido graduais, havendo, ainda assim,
consensos positivos em torno de determinados formatos, como é o caso do TIFF (ou
TIF), que, com uma estrutura bastante estável, oferece garantias de reprodutibilidade a
longo prazo. Podemos acrescentar às vantagens do formato TIFF a característica de ser
facilmente transmissível, mas não é, por exemplo, intrinsecamente pesquisável e os
ficheiros podem apresentar tamanhos pouco compatíveis com a rápida transferência
electrónica de informação.
Esses aspectos foram, decerto, levados em consideração pela AIIM (Association for
Information and Imagem Management), pela NEPS (National Printing Equipment
Association) e pelo Administrative Office of the U.S. Courts quando tomaram a
iniciativa de submeter à ISO (Internacional Standard Organization) um suporte
electrónico de preservação a longo prazo baseado no formato PDF, da Adobe Systems.
À partida, o formato PDF oferecia maior versatilidade do que o TIFF, pois, ao invés
deste, permite o armazenamento de objectos estruturados (isto é, texto, imagens
vectoriais e imagens bitmap), a pesquisa no texto e OCR interno, bem como a inserção e
classificação automática de metadados (título, data de criação, autor, etc.). Além disso,
os ficheiros PDF são mais compactos, exigindo uma fracção da memória dos ficheiros
TIFF. Apesar de vantajosas, estas características não eram, todavia, suficientes para
fazer do PDF comum um formato estandardizado de arquivo electrónico de longa
duração. Além de estar sujeito a uma falta de uniformização (uma vez que, no mercado,
pf3

Pré-visualização parcial do texto

Baixe O Formato PDF e outras Notas de estudo em PDF para Biblioteconomia, somente na Docsity!

O PDF/A-1 como meio de preservação de documentos electrónicos a longo prazo

A criação e a conversão de documentos em formato digital têm colocado, nos últimos anos, diversas questões no seio do mundo da informação, especialmente no que concerne à preservação de longo prazo. Como é que podemos garantir que um documento nado-digital ou digitalizado será correctamente visualizado (isto é, tal como foi originalmente criado) dentro de 20 ou 30 anos? De facto, há que reconhecer que o ritmo de obsolescência das novas tecnologias de informação e comunicação impôs uma ruptura relativamente a outros suportes não informáticos, como o papel e o microfilme, em que a inteligibilidade da informação, do ponto de vista intelectual, pode estar apenas dependente da capacidade interpretativa humana e de tecnologia totalmente analógica. Todavia, também é consabido que os suportes clássicos constituem um obstáculo ao acesso remoto à informação e que o uso e abuso do papel têm dificultado a sã gestão arquivística. Tendo em conta esses senãos, a aceitação e utilização de suportes digitais com fins de arquivo de longa duração têm sido graduais, havendo, ainda assim, consensos positivos em torno de determinados formatos, como é o caso do TIFF (ou TIF), que, com uma estrutura bastante estável, oferece garantias de reprodutibilidade a longo prazo. Podemos acrescentar às vantagens do formato TIFF a característica de ser facilmente transmissível, mas não é, por exemplo, intrinsecamente pesquisável e os ficheiros podem apresentar tamanhos pouco compatíveis com a rápida transferência electrónica de informação. Esses aspectos foram, decerto, levados em consideração pela AIIM ( Association for Information and Imagem Management ), pela NEPS ( National Printing Equipment Association) e pelo Administrative Office of the U.S. Courts quando tomaram a iniciativa de submeter à ISO ( Internacional Standard Organization) um suporte electrónico de preservação a longo prazo baseado no formato PDF, da Adobe Systems. À partida, o formato PDF oferecia maior versatilidade do que o TIFF, pois, ao invés deste, permite o armazenamento de objectos estruturados (isto é, texto, imagens vectoriais e imagens bitmap ), a pesquisa no texto e OCR interno, bem como a inserção e classificação automática de metadados (título, data de criação, autor, etc.). Além disso, os ficheiros PDF são mais compactos, exigindo uma fracção da memória dos ficheiros TIFF. Apesar de vantajosas, estas características não eram, todavia, suficientes para fazer do PDF comum um formato estandardizado de arquivo electrónico de longa duração. Além de estar sujeito a uma falta de uniformização (uma vez que, no mercado,

muitas são as ferramentas que permitem criar PDFs), o PDF, como a maioria dos utilizadores o conhece, não é necessariamente um formato “self-contained”, isto é, não obriga a que, por exemplo, todas as fontes de que o documento precisa para ser visualizado estejam embebidas no próprio ficheiro. O mesmo é dizer que, sob a forma do PDF comum, um documento pode ficar dependente de recursos externos para ser correctamente visualizado, o que, a logo prazo, é um risco, porque não se sabe durante quanto tempo esses recursos externos vão manter-se disponíveis. Por esta ordem de motivos, o grupo de trabalho liderado por aquelas três entidades, a que se juntaram a Library of Congress , a NARA ( National Archives e Records Administration ), a Adobe, a Xerox, entre outros, elegeu um novo formato para a preservação de documentos electrónicos a longo termo, que veio a ser homologado como norma ISO 19005-1: em Setembro de 2005: o PDF/A-1. O PDF/A-1 baseia-se na Referência PDF 1.4 da Adobe Systems , uma plataforma estável que foi implementada no Adobe Acrobat 5, com provas dadas e aceite internacionalmente, mas tal referência teve de ser adaptada a novas exigências, que vão ao encontro de um formato de arquivo consistente e de uso generalizado. O PDF/A- caracteriza-se, assim, por ser um formato independente de qualquer plataforma de software ou hardware que se utilize; por ser auto-suficiente, isto é, tudo quanto é necessário para visualizar e imprimir um PDF/A-1 está embebido no próprio ficheiro; por ser auto-descritivo, uma vez que pressupõe a existência de metadados; por não ter mecanismos de protecção e de restrição de acesso; por ser disponível ao mercado, visto que qualquer pessoa pode usar a Referência PDF e a Especificação XMP (formato de metadados do PDF) para conceber aplicações informáticas que leiam e criem ficheiros PDF/A-1; finalmente, por reunir condições intrínsecas e extrínsecas que fazem presumir um uso crescente e generalizado. Além de obrigar a determinadas características (fontes embebidas, independência de cor relativamente à plataforma usada e metadados XMP), o PDF/A-1 não admite encriptação, compressão LZW (por motivos de direitos de propriedade), ficheiros embebidos, referências a conteúdos externos, transparências PDF, multimédia e JavaScript. A assinatura digital é suportada pelo PDF/A-1, desde que as fontes utilizadas estejam embebidas no formato. Por outro lado, o PDF/A-1 divide-se em dois níveis conformes: o PDF/A-1a e o PDF/A- 1b. Enquanto que o PDF/A-1a salvaguarda a estrutura lógica e semântica do documento e a sequência do texto, contemplando, por exemplo, o ajustamento do conteúdo textual