Hola bloggeros:
Antes de profundizar de lleno en el tema, debemos de resolver una serie de cuestiones principales, necesarias, para entender mejor de qué estamos hablando.
La primera cuestión a resolver es....¿Qué es la indización?
Pues bien, la indización es un proceso por el cual, describimos o representamos un contenido temático relacionado con un recurso de información.
Con este proceso, obtenemos como resultado un indice de términos de indización, que utilizaremos más tarde como un herramienta de búsqueda y acceso al contenido de recursos de información, mediante conceptos principales (palabras clave) o vocabularios controlados (descriptores, términos, etc.) que estén contenidos en estos recursos (documentos).
Este proceso esta conformado en cuatro etapas:
1. Revisión del contenido del documento
2. Selección de los conceptos
3. Traducción de los conceptos en descriptores (vocabulario controlado)
4. Establecimiento de enlacessintácticos entre los descriptores (temas relacionados)
Y ¿qué podemos conseguir con la indización?, para responder a esta pregunta, vamos a ver las cuatro cualidades de las que dispones la propia técnica.
CUALIDADES DE LA INDIZACIÓN
1. Pertinencia: Consiste en ajustar con la mayor efectividad posible, el empleo de un término que sea útil tanto para los usuarios, como para la representación en sí del documento.
Una Indización será pertinente cuando más del 66% de los usuarios encuentren de forma útil documentos ofrecidos por los índices.
2. Exhaustividad: Ofrecer toda la información posible, sobre el tema o los temas deseados, al igual que conceptos y objetos que este representados en los documentos. En función del tipo de unidad informativa, puede ser más útil una exhaustividad más baja.
3. Especificidad: Representa el grado de precisión de los términos seleccionados en una recuperación. Está en relación directa con la eliminación de ambigüedades del lenguaje natural y con la correcta jerarquización de los documentos.
4. Uniformidad: Grado de conciencia en el uso de los términos por parte del usuario recuperando información. Se mide por la coherencia del lenguaje documental.

¿Qué tipos de indización podemos encontrar? Pues bien, hay dos tipos de indización, de las cuales vamos hablar:
1. Indiazión libre: Aquella que se realiza a través de una lista o conjunto abierto de términos.
2. Indización controlada: Aquella en la que la identificación se realiza a través de listas o conjuntos cerrados de términos. Existe además una serie de herramientas de donde extraer los términos y permiten la comprensión de datos e información por parte de los ordenadores sin necesidad de un usuario.
Tambíen no se nos puede escapar, que es muy común en materia de indización el término archivo invertido, que se compone de:
- Vocabulario: Conjunto de palabras que aparecen en un texto.
- Ocurrencias: lista de apariciones de las palabras en un texto.
A continuación, una vez tratado el tema de la indización, es hora de hablar de otro término, también muy importante en el tema que estamos tratando, la recuperación de información.
La recuperación de información (R.I) consiste en la utilización de términos indice para lograr la recuperación de documentos. Para ello, utilizamos una herramienta conocida como "sistema de recuperación de información".
¿Qué es un sistema de recuperación de información?, pues bien, se trata de un mecanismo automatizado que permite el almacenamiento, procesamiento y recuperación de la información, de acuerdo a una orden que se le imparte con unos términos específicos o palabras clave.
Es importante ante todo, no confundir (R.I) con otro término parecido; la recuperación de datos (R.D), este último sólo recupera datos sobre un tema específico y no permite la ambigüedad en las consultas.

bibliografía
Godoy Velasco, Marta. La Indización en la documentación [en línea]. Universidad Carlos III. [Fecha de consulta: 06 de noviembre de 2012]. Disponible en: http://galeon.com/indizacion/indizacion.html
No hay comentarios:
Publicar un comentario