Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Guía Indización y Catalogación de Documentos: Introducción a Lenguajes de Indización, Apuntes de Publicidad y Promoción

Una introducción a los diferentes tipos de resúmenes y lenguajes de indización, incluyendo la indización con lenguaje natural y documental, así como el uso de términos únicos y descriptores. Además, se abordan temas como la indización social y la web semántica.

Tipo: Apuntes

2012/2013

Subido el 27/05/2013

martag834
martag834 🇪🇸

3.9

(52)

15 documentos

1 / 35

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA III
El Proceso documental: Cómo seleccionar, analizar y
guardar la información
Cuando se busca información en una base de datos o en un motor de búsqueda
se tiene garantía, con una buena estrategia, de encontrar lo que se necesita
Para que exista esa garantía, es preciso que se haya puesto en marcha,
anteriormente, todo un complejo proceso de análisis sobre los documentos y las
informaciones
III.1.- Proceso Documental: Definición y objetivo
Definición
Consiste en el “conjunto de operaciones que se realizan sobre los documentos para que
estén disponibles al usuario”
Objetivo
Se trata de tener un control sobre los millones de documentos que
continuamente se producen, de manera que siempre podamos localizar el que
nos hace falta
Para los profesionales de la Comunicación, supone la trastienda de sus
actividades para recuperar eficazmente la información
Proceso Documental y Recursos Digitales
Las Operaciones Documentales ha sido aplicadas tradicionalmente en Archivos,
Bibliotecas y Centros de Documentación.
Ahora se aplican también, en sus aspectos esenciales, a conjuntos de recursos
en la Red
La propia naturaleza de la Red Impone la adaptación del proceso documental
por su volumen de información y recursos
por la falta de estructuración de la información
El objetivo último es crear herramientas que ayuden a la recuperación de la
información: Catálogos, Bases de datos, Índices diversos, son las que el
profesional de la Comunicación tendrá que manejar
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23

Vista previa parcial del texto

¡Descarga Guía Indización y Catalogación de Documentos: Introducción a Lenguajes de Indización y más Apuntes en PDF de Publicidad y Promoción solo en Docsity!

TEMA III

El Proceso documental: Cómo seleccionar, analizar y

guardar la información

 Cuando se busca información en una base de datos o en un motor de búsqueda se tiene garantía, con una buena estrategia, de encontrar lo que se necesita

 Para que exista esa garantía, es preciso que se haya puesto en marcha, anteriormente, todo un complejo proceso de análisis sobre los documentos y las informaciones

III.1.- Proceso Documental: Definición y objetivo

Definición

Consiste en el “conjunto de operaciones que se realizan sobre los documentos para que estén disponibles al usuario”

Objetivo

 Se trata de tener un control sobre los millones de documentos que continuamente se producen, de manera que siempre podamos localizar el que nos hace falta

 Para los profesionales de la Comunicación, supone la trastienda de sus actividades para recuperar eficazmente la información

Proceso Documental y Recursos Digitales

 Las Operaciones Documentales ha sido aplicadas tradicionalmente en Archivos, Bibliotecas y Centros de Documentación.

 Ahora se aplican también, en sus aspectos esenciales, a conjuntos de recursos en la Red

 La propia naturaleza de la Red Impone la adaptación del proceso documental

 por su volumen de información y recursos  por la falta de estructuración de la información

 El objetivo último es crear herramientas que ayuden a la recuperación de la información: Catálogos, Bases de datos, Índices diversos, son las que el profesional de la Comunicación tendrá que manejar

 Para que existan esas herramientas, se debe completar el ciclo del Proceso Documental:

  1. Seleccionar la información
  2. Tratar la información seleccionada
  3. Organizar la información seleccionada cara a la búsqueda

III.2.- Etapas del Proceso Documental

 Entrada: Selección de los documentos

 Tratamiento:

 Análisis:

1.- Condensación 2.- Indización 3.- Catalogación

 Salida: Difusión de la información

1.- La Entrada de documentos: Selección y adquisición. Conceptos de Relevancia, exhaustividad y pertinencia

 El analista de un Centro hará la selección en función de:

 La especialización del Centro

 El tipo de usuario que se prevea

 Dependiendo de estos factores, se aplican los criterios selectivos

Criterio de Relevancia

El Centro adquiere los documentos en función de su importancia para cubrir las necesidades previstas

Criterio de Exhaustividad

El Centro debe dar todo lo que el usuario le pida dentro de su especialidad

Criterio de Pertinencia

El Centro debe responder exactamente demanda, sin defectos y sin excesos

El análisis formal: La descripción Bibliográfica

 Es el proceso mediante el cual se extraen del documento aquellos datos que le identifican unívocamente frente a otros documentos y que componen el asiento bibliográfico

 La descripción bibliográfica más completa que existe es la contenida en las normas ISBD (Normas Internacionales para la Descripción Bibliográfica)

International Standard Bibliographic Description: ISBD

Acogen a todo tipo de documentos. Variantes:

 ISBD (G) General

 ISBD (M) Monografías

 ISBD (S) Publicaciones Periódicas

 ISBD (A) Publicaciones Antiguas

 ISBD (PM) Música impresa

 ISBD (CM) Documentos cartográficos

 ISBD (MNL) Material No Librario

 ISDB (CP) Partes de una publicación

 ISBD (CF) Archivos de ordenador

Esquema general de ordenación de elementos

Puede tener hasta 9 áreas:

1.- Área del Autor y del Título

2.- Área de la Edición

3.- Área Específica de Material

4.- Área de la Publicación (Pié de Imprenta)

5.- Área de la Descripción Física (Colación)

6.- Área de la Serie o Colección

7.- Área de las Notas

8.- Área de la Normalización

9.- Área de Identificación en Centro de Consulta

1.- Área del Autor y del Título

 Autor o autores. Responsable intelectual

 Título propiamente dicho

 Otros títulos. Títulos paralelos. Información sobre el título (ampliaciones, subtítulos…)

Características en Medios Audiovisuales:

Música

 Autor: Encabeza solamente si se trata de música clásica

 Título unitario (si lo tiene): Encabeza en lugar del autor si no es música clásica

 Intérprete/intérpretes: Este dato se puede poner en lugar del autor si no

se trata de música clásica. Nunca encabeza

Cine-Vídeo

 Título.- Es el dato que encabeza. No lo hace el autor por considerarse la

autoría de carácter colectivo

 Responsable (intelectual) de la obra.- Pueden ser personas físicas o jurídicas:

 Compañías Productoras / Productores

 Directores

 Guionistas… etc.

Radio-TV

 Título del Programa

 Responsable del Programa

 Emisora / Cadena

2.- Área de la Edición:

 Edición (salvo que sea la primera, que no se pone)

 Autor o autores relacionados con la nueva edición (no autores originales, que entran en la 1ª Área)

5.-Área de la Descripción Física (Colación)

Impresos

Los datos deben recogerse de la portada o equivalente:

 Páginas de la obra  Número de volúmenes (en su caso) y número de páginas de cada uno  Ilustraciones  Tamaño  Material complementario (si lo hubiere)

Audiovisuales

 Duración (En minutos y segundos)

 Tipo de material (Película, vídeo, disco, en cinta magnética, CD-ROM, DVD)

 Para obras en varios elementos: nº de cintas, discos… y duración de cada elemento

 Tamaño y velocidad (Si no son normalizados)

 Número de canales de sonido

 Características de grabación (Dolby, digital, surround...)

 Material Complementario (Si lo hubiere)

6.- Área de la Serie o Colección

 Título de la Serie o Colección

 Títulos paralelos y complementarios (si hubiere)

 Mención de responsabilidad (Director, etc.)

 Título y mención de responsabilidad de la subserie (si la hubiere)

7.- Área de las notas

En general, amplían y precisan la descripción. Incluyen todo lo que se considere necesario y no tenga cabida en otras áreas:

 Opiniones, críticas, análisis personales…  Resúmenes

 Especificaciones  Naturaleza y alcance del documento

Por ejemplo:

 si es una obra de teatro para TV  si es una película publicitaria

8.- Área de la Normalización

 ISBN

 ISSN (de la Serie y de la Subserie si la tiene)

 IBSN (para los blogs)

 Depósito Legal

 Precio

 Otros datos de tipo comercial o informativo (tipos de encuadernación, direcciones…)

9.- Área de identificación en Centro

Para el caso de Bibliotecas, archivos, etc., es obligado:

 Número de Registro  Signatura del Centro

El Análisis Documental de Contenido

 El análisis formal presta atención a los elementos reconocibles, a simple vista, del documento

 El análisis de contenido trata de responder a las preguntas:

 ¿De qué trata este documento?

 ¿Cuál es su tema principal?

 ¿En qué áreas temáticas se inscribe?

 Los profesionales de la Documentación, deben hacer posible el acercarse al contenido del documento con estas operaciones:

 Resumen  Indización

Resúmenes de método “breve”: algunos modelos importantes

 El título.- En caso de que sea comprensivo del texto que ampara

 Anotación de contenido / Resumen telegráfico.- Consiste en:

 Una ampliación del título (especie de subtítulo)

 Una mezcla de palabras-clave sacadas del texto y utilizadas para indizar

 Resumen Indicativo.-

Es un modelo concreto, pero toma la denominación de toda la variante. Es el de mayor valor documental

Resúmenes de método “amplio”. Tipos:

A) Informativos

B) Analíticos

Método “amplio”: modelos importantes

El Resumen Informativo

 Es un modelo concreto, pero toma la denominación de toda la variante: “Informativo”

 Sigue el modelo “Indicativo” por estilo y contenido, pero añadiendo las conclusiones del texto resumido

 Es el más breve de este tipo, pero el de mayor valor documental

El Extracto.-

 Es un resumen hecho a base de frases extraídas de forma textual del propio documento

 No tiene el valor del resumen “informativo” por el riesgo de una elección que saque de contexto

La Reseña.-

 Modelo de resumen poco objetivo, ya que incluye comentarios críticos personales

Método “amplio”. Modelos importantes.- Tipo “Analítico”

El Compendio (Digest).-

 Es el más extenso de los resúmenes propiamente dichos

 Puede reemplazar al documento. Contiene entre el 20 y el 50 por ciento del documento completo

 En la forma, procura acercarse al estilo del autor original. Es la excepción de la regla general

Resumen. Normas y métodos de elaboración

Es difícil dar normas totalmente válidas porque se requieren dos capacidades: análisis y síntesis

 La forma y presentación pueden normalizarse

 El contenido, con recomendaciones estilísticas y semánticas, se puede ajustar

 Un resumen con garantías pasa por hacer:

 El análisis de contenido, desmenuzando el documento  La síntesis, reagrupando de nuevo el contenido

 Es preciso leer bien el texto a resumir y fijarse en determinadas zonas importantes:  Introducción del documento  Conclusiones del documento (si existen)  Títulos de los capítulos  Comienzo de los párrafos  Resumen hecho por el propio autor (si existe)

Fases para hacer un Resumen

  1. Hacer el resumen fielmente sin importar, en principio, la extensión
  2. Pulir el contenido hasta conseguir el modelo que queremos, sin sacrificar la fidelidad a la brevedad
  3. Seguir el orden del documento que se resumen

 Se debe comenzar sin circunloquios

 En el comienzo de la frase, no se deben emplear números arábigos ni símbolos químicos

 Se debe evitar el empleo abusivo de abreviaturas y acrónimos

La Indización

 Con independencia de los datos bibliográficos, necesitamos “algo” que nos permita encontrar los documentos en base a unas determinadas preguntas: ese “algo” es la indización

 La indización debe responder a la previsión que hace el analista de cómo preguntará el usuario.

 Es la parte más importante del Tratamiento, el único acceso posible a la información.

 Si falla, el usuario no podrá llegar a la información

Definición

 “Consiste en la selección de una o varias nociones que representen el contenido del documento, adecuándolas a un lenguaje determinado - natural o documental- elegido previamente por el analista”

 Para que la indización cumpla sus objetivos hay que tener en cuenta dos factores:

  1. El propio contenido del documento
  2. Las posibles preguntas de los usuarios

III.3.- Tipos de Lenguajes de indización

Hay dos grandes modelos:

 Indización con lenguaje natural

 Indización con lenguaje documental

La Indización con lenguaje natural. Características:

 Es el lenguaje utilizado para comunicarnos normalmente. Sin ninguna organización previa

 Este sistema no supone ningún cambio de las palabras naturales, sino una extracción de los conceptos que consideremos especialmente significativos.

 Estos términos tienen que figurar literalmente en el documento

 Mientras se hable de lenguaje natural, no se necesita una lista organizada de términos y/o frases

 No hay ninguna previsión

Los términos únicos :

También el lenguaje natural debe adecuarse:

 No son válidos los términos que no signifiquen algo por sí mismos (por ej. un verbo, un artículo)

 Tampoco las expresiones generales, puesto que no acotan y pueden significar varias cosas

 Tampoco los calificativos. Suponen problemas para acertar en la forma de preguntar

 Los términos más seguros son los sustantivos o expresiones sustantivadas

Indización con frases

 En principio, las frases tienen todos los componentes. No se suprimen verbos, artículos etc

 Siguen sin tener cabida los calificativos por el mismo motivo cara a la búsqueda

 En general, los calificativos tan solo se pueden utilizar si su valor es sustantivo

Ejemplo: las denominaciones de los reyes a lo largo de la Historia

Lenguaje natural en la Red

 Los motores de búsqueda analizan e indizan las bases de datos con robots, de forma automática, utilizando parámetros de relevancia .cara a la búsqueda- como estos:

 Frecuencia de aparición de los conceptos buscados

 Cercanía de las palabras claves dentro del texto

 No podemos dar a cada término un solo sentido, ya que no podemos manipularlos. El resultado es la imprecisión de los términos que pueden significar varias cosas

 No podemos prever las preguntas del usuario mediante un listado al que éste pueda acudir. No hay listado posible.

Premisas de las que partimos:

 En el lenguaje natural existen distintos términos y expresiones para referirse al mismo concepto

 Los términos de indización deben estar presentes en el documento. No podemos seleccionar otros aunque el usuario los comprenda mejor y pregunte más por ellos

 El usuario debe «hablar» el mismo «idioma» que el documentalista para acertar en la búsqueda. Pero no tiene ninguna ayuda: no hay listados preparados

 Resultado:

Se crean lenguajes especiales que resuelvan los problemas planteados por el lenguaje natural

La Indización con lenguaje documental

Definición

“Conjunto de términos o frases convencionales, utilizadas para representar el contenido de un documento”

 La indización es un proceso mediante el cual se eligen una serie de términos que representan el contenido de un documento, de acuerdo a una premisa esencial:

Debe ser la previsión que haga el analista de cómo le preguntará el usuario

 Frente al lenguaje natural hay una primera diferencia: se puede elaborar un listado de indizadores que responda a las posibles preguntas de los usuarios

 Es un lenguaje normalizado que permite denominar mejor los conceptos significativos del documento

 Los términos de indización pueden identificar diversos puntos, de los que los analistas deben utilizar un mínimo de tres a fin de cubrir varias entradas a la información:

 Materias

 Biografías (Personas importantes)

 Autores

 Títulos

 Personas Jurídicas (instituciones, asociaciones, etc.)

 Protagonistas (personas físicas y jurídicas)

 Lugares (criterio geográfico)

 Fechas (criterio cronológico) etc.

Características

 Es un lenguaje “artificial” que tiende un puente entre:

 El lenguaje que emplea el documento (natural)

 El lenguaje que emplea el analista (documental)

 El lenguaje con que pregunta el usuario (natural)

 Puede utilizar:

 Términos diferentes a los del documento

 Los mismos términos si se consideran válidos

 Claves

 Se deben tener en cuenta dos puntos:

 El propio contenido del documento

 Las posibles preguntas de los utilizadores

 Un lenguaje documental se compone de muchos menos términos y expresiones que los que componen el lenguaje natural. Implica una reducción del lenguaje natural

 La comunicación con este lenguaje es compleja. Hay grados, según el sistema, pero siempre más compleja que con el natural

 La comunicación siempre está mediatizada en beneficio del usuario

Principal característica:

 No puede tener ambigüedad. Ha de ser preciso y significar una sola cosa.

 Resulta muy sencillo encontrar la información descendiendo por las distintas categorías

 Inconvenientes:

 No siempre están todo lo actualizados que debieran. La indización no automática, es proceso es más lento

 No contienen la cantidad de información que ofrece un motor de búsqueda

Tipos de Lenguajes Documentales

Hay dos grandes modelos:

 La estructura Clasificatoria

 La estructura Combinatoria

Estructura Clasificatoria : características

 Su ordenación es lógica. Las nociones más concretas de un determinado tema se agrupan bajo las nociones más generales, que las engloban.

 Es una ordenación sistemática lineal, siguiendo una jerarquía que puede ser objetiva o subjetiva.

 La subordinación se refleja en un encadenamiento de letras, de números o alfanumérico

 A cada elemento le corresponde un lugar concreto previsto para él y, en principio, no se puede mover

 Las nuevas inclusiones y las actualizaciones deben preverse dejando espacios en blanco

 Las materias solo se pueden ver desde un punto de vista en cada ordenación

 No hay posibilidad de reenvíos ni de puestas en contacto o asociaciones de contenidos

 Hay que estructurarlo a priori. No tiene sentido –dado lo costoso de su elaboración- que, con el tiempo, haya que cambiar contenidos importantes como sus ítems principales

Formas de representación del sistema:

Inclusión de categorías Estructura arborescente

La Clasificación Decimal Universal: CDU

 Es el lenguaje de clasificación más popular. Es el utilizado en la mayoría de las bibliotecas de todo el mundo

 Pertenece al modelo enciclopédico: se recogen todas las áreas del conocimiento humano

 Su precedente es la Clasificación de Dewey

 Si se quiere aplicar a campos especializados, se adapta el sistema a la especialidad concreta

 Para mantenerse al día, deben dejar espacios en blanco que se vayan ocupando con las novedades

Esquema general :

0 Generalidades

1 Filosofía

2 Religión. Teología

3 Ciencias Sociales