Lenguajes Documentales


La indización como método de recuperación de información. Tipos de índices



Descargar 268.06 Kb.
Página5/8
Fecha de conversión13.08.2018
Tamaño268.06 Kb.
Vistas218
Descargas0
1   2   3   4   5   6   7   8

3.4 La indización como método de recuperación de información. Tipos de índices.


La indización es el primer instrumento de recuperación mediante el índice, entendido éste como una lista alfabética de términos producto de la indización. El índice se comporta como una guía que nunca sustituye al documento primario sino que hace referencia a la localización, las fuentes y el contexto.

La efectividad de la indización no se mide por el tiempo ahorrado sino por el grado de recuperación de documentos pertinentes. Mooers comienza la elaboración de lo que hoy denominaríamos lista de autoridades, que el llamó check tags, organizados según un sistema de interrogación al que los especialistas someten la colección. Hay una serie de interrogaciones y el documentalista somete el documento a cada una de ellas. El documento se adscribe a una interrogación dentro de la que se seleccionan las autoridades útiles.


3.4.1 Índice de contexto.


Lo realizan usuarios especialistas. Consiste en una selección de términos referidos a lugares y personas, pero sobre todo a un concepto que está sometido a controversia y matizaciones, cuya comprensión está en el contexto. Este índice sólo sirve en índices de patentes y colecciones de fórmulas.

3.4.2 Índice de unitérminos.


Es la selección de palabras-clave o descriptores libres que están definidos o definen al documento. Se sitúan al final del documento o texto y remiten al lugar donde se encuentra.

3.4.3 Índice de publicaciones.


Los realizan documentalistas especializados. Es la indización que más se parece al resumen y se comporta como un documento secundario. El documentalista hace tanto una descripción física y característica como un resumen del documento. Estos documentos están organizados siguiendo un encabezamiento de materias o descriptores. Un caso especial dentro de estos índices son los índices de sumarios, que hacen referencia a publicaciones periódicas y suelen ser números especiales de éstas en donde aparecen ordenados los autores y los asuntos tratados en la publicación durante un tiempo determinado.

3.4.4 Índice analítico.


Es aquel en el que los documentos son sometidos a 5 puntos de acceso:

- ÍNDICE ONOMÁSTICO: en el aparecen nombres propios de persona identificados o explicados en el texto.

- ÍNDICE TOPONÍMICO: recoge nombres de lugares identificados en el texto.

- ÍNDICE CATALOGRÁFICO: hace referencia a las instituciones reflejadas: editoras, congresos notas y citas bibliográficas.

- ÍNDICE DE MATERIAS: trata los asuntos y conceptos.

- ÍNDICE CRONOLÓGICO: se entiende por la época retratada, pero además es necesario saber el año de edición.

3.4.5 Índices de términos permutados.


Pueden ser elaborados de forma automatizada. Su uso suele estar en soporte papel. No permite la combinación sino la permutación. Sirve para el índice de materias y se utiliza tomando los títulos de las obras de las que se eligen los términos significativos. El documento aparece tantas veces como términos seleccionados alfabéticamente.

Existen 3 posibilidades:



- KWIC: es una lista de términos aparecidos en el título que se les permuta de lugar con el fin de que aparezcan en letras capitales, en columna, en la posición central.

- KWOC: es una lista de términos seleccionados del título que son permutados, es decir, cambiados de sitio, y situados en el margen izquierdo y repetidos tantas veces como documentos los contengan. En lugar del término aparecen puntos suspensivos.

- KWAC: es una lista de términos seleccionados del título. Se coloca el término destacado en la parte superior y bajo el se consignan todos los documentos que lo contienen. Se dejan asteriscos o puntos suspensivos.

Entre estos índices existe un caso especial: el índice de descriptores permutados. Su aplicación se realiza comúnmente asociada a la DSI. La colección documental es sometida a una interrogación concreta por parte de los usuarios y los descriptores se colocan alfabéticamente según la interrogación. El descriptor aparece siempre en la parte superior y luego aparecen 10 (0-9) columnas con su número (registro o signatura) y así se colocan los documentos según coincidencia del último número de registro con el número de la columna. Sólo se ofrece la información sobre localización física del documento.

3.4.6 Índice articulado de términos post-coordinados.


El índice articulado de términos post-coordinados se realiza siempre a partir de lenguajes controlados y su elaboración y uso son siempre automatizados. Permiten la combinación por yuxtaposición de todos los descriptores que se consideren necesarios.

El principal problema es el número exponencial de registros recuperados que pueden provocar las combinaciones de varios descriptores. Para ello se inventó el sistema SLIC que depura las combinaciones anulando las más genéricas y redundante. Existen dos grandes estilos de post-coordinación que les ha acercado a los índices KWIC y KWOC:



- ESTILO DE ALTERNANCIA: se trata de seleccionar los términos significantes y mostrarlos destacadamente en orden alfabético.

- ESTILO DE DERIVACIÓN: el término seleccionado aparece, por cada una de las citas que se haga en dos ocasiones: encabezando y en la línea de descripción.

Caso especial es el índice articulado de materias, cuyo objetivo es eliminar las ambigüedades que la simple yuxtaposición de los descriptores puede proporcionar. El documentalista establece su enunciado representando las materias contenidas en el documento y después se yuxtaponen con todos sus elementos sintácticos (adjetivos, artículos...).


3.4.7 Índice de materias.


Está inspirado en el sistema de Mooers, que dio como resultado la división de materias de Ranganathan:

Ejemplo: Historia de la explotación económica de las minas de plata de Zacatecas (México) durante la Administración Borbónica

- PERSONALIDAD: es el tema o asunto del documento.

- MATERIA: plata.

- ENERGÍA: explotación.

- ESPACIO: México.

- TIEMPO: siglo XVIII.

A partir del sistema de Ranganathan aparece el de Coats, y es en él donde se da el concepto de facetas.


3.4.1 Índice de citas.


Los términos seleccionados son las citas que de obras o autores se haga en un documento. Su aplicación inmediata es bibliométrica de acuerdo con la Ley de Obsolescencia o Ley Burton-Kebler que mide el factor de impacto o uso potencia y el semiperíodo (la etapa de vigencia de un documento en una unidad informativa concreta).

TEMA 4: LOS TESAUROS.

4.1 Concepto, elementos de definición y clases de tesauros.


Proceden de la latinización del término griego θησαυρος, -ον, que dio thesaurus. Significaba tesoro. Documentalmente esta es la acepción que predominó durante la Edad Media: la de una selección de documentos considerados preciosos y que debían ser conservados.

Durante la Edad Moderna se convierte en una selección de palabras consideradas preciosas para un idioma, un diccionario cuyo objetivo es crear una lengua pura en independiente de latín.

En el siglo XVIII aparece una nueva acepción a partir del Shorter Oxford Dictionary, publicado en 1736. Será considerado como un almacén de conocimiento expresado por palabras de tal forma que se acercó a diccionario y enciclopedia.

En el siglo XIX Peter M. Roget utiliza tesauro como una lista de palabras destinadas a los escritores fundamentalmente con el fin de que usaran las palabras más adecuadas para sus obras literarias.

A principios del siglo XX comienza la aparición de los lenguajes documentales a partir de la invención de los unitérminos por Michael Taube y también el sistema de indización de Mooers.

En los años 50 Howerton recupera la palabra thesaurus para indicar una lista autorizada de palabras que representan conceptos y que están interrelacionadas.

En los 70 Wersig especifica el concepto al establecer que es una lista autorizada de términos extraídos de los documentos y que su combinación es post-coordinada.

En los 80 se produce la definitiva relación de tesauro y terminología de tal forma que el tesauro sería un instrumento de control de un lenguaje de indización mediante los términos.

Ha sido la automatización la que ha dado mayor protagonismo a los tesauros, de tal forma que ha habido una codificación, un catálogo de normas:

- UNESCO: a través del programa UNISIST ha dado una codificación-marco a los tesauros estableciendo su función de instrumento de control terminológico que transforma las palabras-clave en descriptores de lenguaje documental. Establece su carácter del lenguaje controlado de combinación por post-coordinación y con unas relaciones sintácticas y semánticas.

- ISO 2788-1986: se dan las definiciones y las reglas de aplicación.

- UNE 50-106: es una adaptación al castellano de la ISO anterior.

El tesauro tiene un campo de actuación muy determinado que lo distingue de otros lenguajes documentales:

Respecto de las obras de referencia (diccionarios, enciclopedias...) en el tesauro no hay definiciones ni acepciones. Además acepta términos compuestos.

Respecto de las listas de encabezamientos de materia los tesauros eliminan el lenguaje pre-coordinado.

Respecto de los índices establece una relación sintáctica y semántica (los índices no establecen esa relación).

Respecto de la lista de autoridades el tesauro es cerrado, no admite nuevos términos.

Los tesauros además tienen 3 grandes elementos de definición:

- CAMPO SEMÁNTICO: conjunto de unidades léxicas relacionadas con otras unidades por significación y que alcanzan su verdadera dimensión significativa por esta interrelación.

- FUNCIÓN: es doble:

- Normalización: debe ser un lenguaje convencional, con criterios arbitrarios y que traduzca el lenguaje natural a documental.

- Inducción: es un lenguaje que determina la combinación de los términos mediante inducción paradigmática o en vertical y sintagmática u horizontal o de equivalencia o asociación.

- TÉRMINOS: son las palabras-clave con una relación biunívoca con un concepto ideal. Dentro de un tesauro existen diversos tipos de términos:

- Descriptores: son los términos autorizados.

- No descriptores: los términos no autorizados.

- Identificadores auxiliares: dan sentido a los descriptores.

- Identificadores de función: definen que significado tiene el término en el tesauro.

Existen distintas clases de tesauros:



- SEGÚN SU ÁMBITO TEMÁTICO:

- Macrotesauros: son aquellos donde están implicadas varias áreas temáticas.

- Microtesauros: son las partes o áreas temáticas implicadas en un macrotesauro.

- SEGÚN EL IDIOMA:

- Multilingües: se reconocen varios idiomas en las correspondencias.

- Monolingües: un solo idioma.

- SEGÚN LA ORDENACIÓN:

- Alfabéticos.

- Sistemáticos: por materias y facetas.



Compartir con tus amigos:
1   2   3   4   5   6   7   8


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

enter | registro
    Página principal


subir archivos