Lenguajes Documentales


Estructura de los tesauros



Descargar 268.06 Kb.
Página6/8
Fecha de conversión13.08.2018
Tamaño268.06 Kb.
Vistas219
Descargas0
1   2   3   4   5   6   7   8

4.2 Estructura de los tesauros.


En un primer momento los tesauros se entendieron como un lenguaje de indización, es decir, como una forma de clasificar los documentos y localizarlos físicamente. Actualmente se da mayor predominio a su carácter de lenguajes de recuperación de información y a las estrategias de búsqueda a través de los términos.

La fijación de términos se convierte en la obra fundamental del tesauro. Se le reconoce una metodología con 4 pasos:

- Determinar cual es el tema principal, el tema auxiliar y el tema marginal del tesauro.

- Selección de las palabras clave y descriptores libres que aparezcan en los documentos afectados por el tema principal.

- Depuración de palabras clave y descriptores libres: comparándolos con diccionarios, enciclopedias, léxicos técnicos, usuarios, asesoría de especialistas...

- Contextualización: consignar como datos principales para cada palabra:

- La fuente terminológica: de donde se han extraído y con que documento se ha comprobado.

- Origen lingüístico.

- Ortografía.

- Frecuencia de uso.

- Evolución lingüística.

A partir de estas cuatro fases se elaboran las fichas de terminología o de términos que se organizan a su vez en grupos siguiendo dos criterios:



- POR MATERIAS: en tanto que es el sistema más familiar a los usuarios.

- POR FACETAS: atendiendo lógicamente a la naturaleza del documento, entendiéndolo como una realidad caleidoscópica, dependiendo del lado por el que lo miremos. Mediante las facetas se determinan fundamentalmente los llamados temas transversales. En tesauros se entiende que las principales facetas son:

Ejemplo: la producción textil de la Mule: hilatura de algodón en Bonaplata por parte de la burguesía barcelonesa del siglo XIX

- FENÓMENO: producción textil.

- PROCESO: hilatura.

- MATERIA: algodón.

- ORGANIZACIÓN: Bonaplata.

- SER VIVO: burguesía barcelonesa.

- EQUIPAMIENTO: mule.

- PROPIEDAD: automatización.

- DISCIPLINA: historia económica.

Una vez organizadas estas fichas de términos se establecen las microdisciplinas (a veces definidas por los top terms, de especialización de una disciplina se componen de 50 términos.

Cada 10 microdisciplinas (500 términos) se incluye un dominio, a veces definidos por el Middle Term (M.T.)

4.2.1 Normalización de términos.


Es el final de un proceso de selección y expurgo cuyo producto final van a ser unos términos autorizados o autoridades que serán los únicos aceptados.

Los identificadores auxiliares son unos términos que no sirven para la recuperación de información por su significado amplio, pero que, usados junto a otro descriptor pueden llevarnos a una recuperación eficaz:



Ejemplo: Compañía eléctrica.

Los no descriptores son términos no preferentes que hacen reenvíos use.

Los descriptores pueden tener tres funciones:

- INFRACONCEPTOS: son aquellos descriptores que se utilizan como prefijos, infijos y sufijos en otros descriptores.

Ejemplo: "eléctrico" en "electricidad", "piezoeléctrico" y "termoeletricidad".

- DESCRIPTORES PRINCIPALES: sustentan la principal carga informativa.

Ejemplo: "documentación" en "documentación automatizada".

- DESCRIPTORES SECUNDARIOS: complementan la información del descriptor principal

Ejemplo: "automatizada" en "documentación automatizada".

4.2.2 Relaciones sintácticas.


La norma ISO establece que deben ser prioritarios los términos simples.

La práctica nos dice que es cada vez más abundante la combinación de descriptores (descriptores sintagmáticos), fomentada por las actuales estrategias de búsqueda automatizada.

En los tesauros se admite la utilización de términos simples y de términos compuestos.

4.2.2.1 Términos simples.


La norma ISO establece que deben ser sustantivos, no se admiten los enlaces ni los adverbios ni los verbos, salvo, estos últimos, para la descripción de documentos audiovisuales, en el que hay una tendencia a utilizar los gerundios que se está contemplando.

Existe la excepción de los adjetivos ya que, en muchas ocasiones, el uso lo sustantiva en aquellos términos (ej.: variable, "pop-art"...) que tienen la carga informativa, adjetivos numerales tales como los ordinales y las fechas.

En cuanto a las reglas de presentación, son las siguientes:

- NO SE CONSIGNAN SIGLAS NI ACRÓNIMOS: excepto aquellos que actúan como sustantivos (ej.: la sigla Federación Italiana de Auto Transporte).



- EL TÉRMINO DEBE SER CIENTÍFICO, PERO LA ORTOGRAFÍA POPULARIZADA (ej.: no usar hepatopatías, sino hepatitis).

- EL TÉRMINO DEBE TRADUCIR LOS BARBARISMOS (ej.: no usar copyright, sino derechos de autor; no usar cassette, sino casete; no usar whisky, sino güisqui) Y LAS TRANSLITERACIONES (ej.: no Mao Tse-Tung, sino Mao Zedong; no Mastrique, sino Maastricht).

- EL TÉRMINO HA DE APARECER SIEMPRE EN MASCULINO.

- RESPECTO AL NÚMERO SE RECONOCEN 3 POSIBILIDADES:

- Términos que aparecen siempre en plural:

- Todos aquellos que sean divisibles en elementos y respondan a la interrogación ¿cuántos?

- Aquellos objetos que sean de uso igual en singular y en plural (ej.: pantalón, pantalones o gafa y gafas...),.

- Aquellos términos que sólo se utilicen en plural (ej.: elección, elecciones...).

- Términos que son elementos de un conjunto y aparecen en este conjunto con carácter múltiple (ej.: ojos, manos y no ojo, mano).

- Términos que aparecen sólo en singular:

- Términos que designan objetos no cuantificables en división de elementos. Sólo responden a la interrogación ¿cuánto? (ej.: arroz).

- Términos que designan elementos de un conjunto en el que aparecen de forma única (ej.: estómago, cabeza).

- Términos que designan propiedades (ej.: contaminación, solubilidad...), acción de verbos (ej.: contratación), ciencias (ej.: Historia, Física...), ideologías y creencias (ej.: comunismo, protestantismo).

- Términos que designan fenómenos naturales (ej.: lluvia).

- Entidades orgánicas, abstractas y conceptos (ej.: Gobierno, Ley...).

- Términos que aparecen tanto en singular como en plural: se les consigna siempre una nota de aplicación o aclaración, ya que tienen un significado diferente en cada caso (ej.: Humanidad, humanidades).

4.2.2.2 Términos compuestos o descriptores sintagmáticos.


Son aquellos que utilizan 2 o más términos para lograr un concepto preciso. El tesauro tiene dos posibilidades de unión:

- UNIÓN LEXICOLÓGICA: unión de 2 términos que produce un significado diferente. Se distingue entre aglutinación y fusión:

- Aglutinación: como una ensalada (ej.: balonmano).

- Fusión: como un puré.

- UNIÓN SINTÁCTICA: es el empleo de 2 términos que no pierden su carácter diferenciado de tal forma que uno tiene el carácter de descriptor principal (núcleo) y otro es el descriptor secundario (modificador) (ej.: documentación automatizada, en la que documentación sería el núcleo y automatizada el modificador). La unión sintáctica puede realizarse siguiendo diferentes métodos:

- Por yuxtaposición simple: dos términos que son contiguos (esto es, uno al ladito de otro). Se utiliza para las búsquedas booleanas de términos que sólo se complementan ocasionalmente (ej.: hilatura de algodón). Se utiliza también para lograr términos figurados (ej.: cine negro, literatura gris). En algunas ocasiones puede llegarse a alterar el sentido del núcleo, lo que se denomina yuxtaposición sincategoremática (ej.: flores artificiales).

- Por yuxtaposición por enlaces determinantes: es la utilización de la expresión de, es decir, del complemento determinativo, para:

- Términos genéricos y su especialidad: (ej.: Historia del arte).

- Descriptores auxiliares: (ej.: Compañía de Jesús

Son imprescindibles cuando el núcleo es una parte del modificador (motor de avión) o una acción que ha transformado el modificador (ej.: aleación de metal → metales aleados).

También cuando el núcleo y el modificador son la acción y el agente (ej.: migración o expulsión de albano-kosovares, aves migratorias).

- Por yuxtaposición de adjetivos significantes: se unen a un sustantivo y con él forman un sustantivo nuevo (ej.: Derecho Civil, Unión Europea, Método cartesano...).

- Entidades físicas y jurídicas: pueden ser descriptores que pueden colocarse de forma compuesta tanto si son descriptores onomásticos (nombres y apellidos), toponímicos y descriptores de personas jurídicas (ej.: Médicos sin fronteras).

4.2.3 Relaciones semánticas entre términos.


Son aquellas en que la combinación de los descriptores cuyo objetivo es garantizar la pertinencia de la búsqueda (deshacer sinónimos y polisemias) y la eficacia de la recuperación (sin ruido ni sombra). Se distinguen tres tipos de relaciones.

4.2.3.1 Relaciones jerárquicas.


Son aquellas que permiten ampliar o especificar el campo de búsqueda. Para diseñar estas relaciones es necesario saber qué microdisciplinas están representadas por los términos cabecera (Top terms). Son términos que establecen una familia semántica y engloban descriptores con significación complementaria.

Las UNE establecen la necesidad de:



- RELACIONES JERÁRQUICAS ASCENDENTES: en ellas se reconoce la existencia de relaciones de:

- Genérico-genérico (T.G.G.): la consignación del descriptor más general que afecte al descriptor considerado (ej.: Bahía TGG Océano).



- Genérico-específico (T.G.P5.): un término de la misma categoría o equivalente al término general más inmediato (ej.: Argüelles TGG Comunidad de Madrid; TG Madrid (metrópoli); TGP Leganés, Getafe, Alcalá de Henares...).

- RELACIONES JERÁRQUICAS DESCENDENTES: en ellas se reconoce la existencia de relaciones de:

- Específico-genérico (T.E.G.): es un descriptor que tiene la misma categoría que el específico del descriptor que estamos considerando (ej.: Argüelles TEG Calle Madrid6).

- Específico-específico (T.E.P.): serían los específicos que están subordinados a los específicos del término que estamos considerando. (ej.: Argüelles TEE nº 5).

Las normas también establecen cómo deben ser las relaciones jerárquicas. A este respecto establece como recomendable:

- La existencia de un solo genérico, aunque se establece una mayor casuística para las relaciones jerárquicas descendientes.

- Jerarquía sistemática: en ella cabrían las clasificaciones de seres vivos, las acciones y propiedades, la profesión y los profesionales.

- Jerarquía partitiva en ella se consignan los elementos de uno todo (objetos y clases, las ciencias y sus especialidades, las localidades geográficas y los órganos del cuerpo y los organigramas.

Cabeza


Oído

Tímpano


Archidiócesis

Diócesis


Parroquia

- Jerarquía enumerativa: se trata de enumerar todos los elementos de un descriptor (ej.: Mar decir todos los mares que hay en el mundo).

Las normas establecen diferentes aspectos en la presentación de las relaciones jerárquicas:

TG: Términos Generales (BT7 en inglés).

TE: Términos Específicos (NT8 en inglés).

El TG1 será el término general más alejado de nuestro término.

El TE1 será el específico más cercano a nuestro término.

TG1 España.

TG2 Castilla-La Mancha.

TOLEDO

TE1 Talavera.

TE2 Cualquier pedanía.

Cuando se representa una escala sistemática de todos los niveles se utiliza tras la expresión TE o TG un dígito. El número 1 se reserva para el más genérico-genérico y los números mayores para los más específicos-específicos.

En aquellos tesauros que evitan la presentación por letras se van a utilizar signos matemáticos:

< — Genérico.

> — Específico.


4.2.3.2 Relaciones asociativas.


Son aquellas que establecen la complementación colateral de temas auxiliares. Las normas establecen que deben ser pocos los términos relacionados y para controlar el exceso establece los casos donde conviene consignar las asociaciones:

- TÉRMINOS DE SIGNIFICADO PRÓXIMO: serían todos los específicos de un mismo genérico (ej.: del genérico bibliotecarios serían términos de significado próximo bibliotecarios universitarios y bibliotecarios escolares) o también los antónimos (ej.: sequedad TR humedad).

- TÉRMINOS DE DISTINTA CATEGORÍA SEMÁNTICA: estableciendo la relación provocan una mejor comprensión contextual. Estos son los casos más frecuentes:

- Proceso o fenómeno y su instrumento: temperatura TR termómetro.

- Ciencia y su fenómeno de estudio: sismografía TR terremoto.

- También una acción y su campo de actuación: enseñanza TR alumnos.

- Un objeto y sus accesorios: automóviles TR carreteras.

- Una persona y su característica: mujeres TR feminismo, ACNUR TR ayuda humanitaria.

Las normas establecen como presentación las siglas TR (en inglés RT9). Cuando se utiliza un tesauro sin siglas se utiliza un guión que precede al descriptor.

4.2.3.3 Relaciones de equivalencia.


Garantizan la especificidad de la búsqueda porque su objetivo es deshacer las sinonimias. La norma establece que deben aplicarse en los siguientes cuatro casos (en todos los casos el primer término es el aceptado en el tesauro):

- Descriptores con posible distinta ortografía: psicología y sicología.

- Descriptores con una acepción científica y popular: aspirina y ácido acetil-salicílico, hepatitis y hepatopatías.

- Descriptores con distinta acepción regional: coche y carro.

- Descriptores con distinto uso evolutivo: Zimbabwe y Rhodesia, Harare y Salisbury, R.D. del Congo y Zaire.

La presentación de los términos de equivalencia se realiza mediante el término USE tanto en inglés como en español que indica el descriptor que tenemos que usar. Por el contrario UP (UF10 en inglés) nos indica los no descriptores.


4.2.3.4 Notas de aplicación o alcance.


El objetivo es garantizar la pertinencia en la recuperación de información. En los tesauros estas notas tienen dos funciones:

- Explicar el significado del descriptor en una micro-disciplina.

- Establecer su uso en el tesauro.

Las normas establecen para su presentación las siglas NA11 (en inglés SN12). Si se emplea explicando el significado tras la denominación NA se hace una breve definición (ej.: cabo NA geográficamente considerado). Si se emplea en el segundo caso, junto al descriptor, se realiza un paréntesis aclaratorio (ej.: Mercurio (Planeta)).




Compartir con tus amigos:
1   2   3   4   5   6   7   8


La base de datos está protegida por derechos de autor ©psicolog.org 2019
enviar mensaje

enter | registro
    Página principal


subir archivos