

Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Versa sobre o Formato PDF/A1
Tipologia: Notas de estudo
1 / 3
Esta página não é visível na pré-visualização
Não perca as partes importantes!


O PDF/A-1 como meio de preservação de documentos electrónicos a longo prazo
A criação e a conversão de documentos em formato digital têm colocado, nos últimos anos, diversas questões no seio do mundo da informação, especialmente no que concerne à preservação de longo prazo. Como é que podemos garantir que um documento nado-digital ou digitalizado será correctamente visualizado (isto é, tal como foi originalmente criado) dentro de 20 ou 30 anos? De facto, há que reconhecer que o ritmo de obsolescência das novas tecnologias de informação e comunicação impôs uma ruptura relativamente a outros suportes não informáticos, como o papel e o microfilme, em que a inteligibilidade da informação, do ponto de vista intelectual, pode estar apenas dependente da capacidade interpretativa humana e de tecnologia totalmente analógica. Todavia, também é consabido que os suportes clássicos constituem um obstáculo ao acesso remoto à informação e que o uso e abuso do papel têm dificultado a sã gestão arquivística. Tendo em conta esses senãos, a aceitação e utilização de suportes digitais com fins de arquivo de longa duração têm sido graduais, havendo, ainda assim, consensos positivos em torno de determinados formatos, como é o caso do TIFF (ou TIF), que, com uma estrutura bastante estável, oferece garantias de reprodutibilidade a longo prazo. Podemos acrescentar às vantagens do formato TIFF a característica de ser facilmente transmissível, mas não é, por exemplo, intrinsecamente pesquisável e os ficheiros podem apresentar tamanhos pouco compatíveis com a rápida transferência electrónica de informação. Esses aspectos foram, decerto, levados em consideração pela AIIM ( Association for Information and Imagem Management ), pela NEPS ( National Printing Equipment Association) e pelo Administrative Office of the U.S. Courts quando tomaram a iniciativa de submeter à ISO ( Internacional Standard Organization) um suporte electrónico de preservação a longo prazo baseado no formato PDF, da Adobe Systems. À partida, o formato PDF oferecia maior versatilidade do que o TIFF, pois, ao invés deste, permite o armazenamento de objectos estruturados (isto é, texto, imagens vectoriais e imagens bitmap ), a pesquisa no texto e OCR interno, bem como a inserção e classificação automática de metadados (título, data de criação, autor, etc.). Além disso, os ficheiros PDF são mais compactos, exigindo uma fracção da memória dos ficheiros TIFF. Apesar de vantajosas, estas características não eram, todavia, suficientes para fazer do PDF comum um formato estandardizado de arquivo electrónico de longa duração. Além de estar sujeito a uma falta de uniformização (uma vez que, no mercado,
muitas são as ferramentas que permitem criar PDFs), o PDF, como a maioria dos utilizadores o conhece, não é necessariamente um formato “self-contained”, isto é, não obriga a que, por exemplo, todas as fontes de que o documento precisa para ser visualizado estejam embebidas no próprio ficheiro. O mesmo é dizer que, sob a forma do PDF comum, um documento pode ficar dependente de recursos externos para ser correctamente visualizado, o que, a logo prazo, é um risco, porque não se sabe durante quanto tempo esses recursos externos vão manter-se disponíveis. Por esta ordem de motivos, o grupo de trabalho liderado por aquelas três entidades, a que se juntaram a Library of Congress , a NARA ( National Archives e Records Administration ), a Adobe, a Xerox, entre outros, elegeu um novo formato para a preservação de documentos electrónicos a longo termo, que veio a ser homologado como norma ISO 19005-1: em Setembro de 2005: o PDF/A-1. O PDF/A-1 baseia-se na Referência PDF 1.4 da Adobe Systems , uma plataforma estável que foi implementada no Adobe Acrobat 5, com provas dadas e aceite internacionalmente, mas tal referência teve de ser adaptada a novas exigências, que vão ao encontro de um formato de arquivo consistente e de uso generalizado. O PDF/A- caracteriza-se, assim, por ser um formato independente de qualquer plataforma de software ou hardware que se utilize; por ser auto-suficiente, isto é, tudo quanto é necessário para visualizar e imprimir um PDF/A-1 está embebido no próprio ficheiro; por ser auto-descritivo, uma vez que pressupõe a existência de metadados; por não ter mecanismos de protecção e de restrição de acesso; por ser disponível ao mercado, visto que qualquer pessoa pode usar a Referência PDF e a Especificação XMP (formato de metadados do PDF) para conceber aplicações informáticas que leiam e criem ficheiros PDF/A-1; finalmente, por reunir condições intrínsecas e extrínsecas que fazem presumir um uso crescente e generalizado. Além de obrigar a determinadas características (fontes embebidas, independência de cor relativamente à plataforma usada e metadados XMP), o PDF/A-1 não admite encriptação, compressão LZW (por motivos de direitos de propriedade), ficheiros embebidos, referências a conteúdos externos, transparências PDF, multimédia e JavaScript. A assinatura digital é suportada pelo PDF/A-1, desde que as fontes utilizadas estejam embebidas no formato. Por outro lado, o PDF/A-1 divide-se em dois níveis conformes: o PDF/A-1a e o PDF/A- 1b. Enquanto que o PDF/A-1a salvaguarda a estrutura lógica e semântica do documento e a sequência do texto, contemplando, por exemplo, o ajustamento do conteúdo textual