por Yolanda de la Iglesia Sánchez
El adagio "una imagen vale más que mil palabras" puede servir de
marco iniciático para introducir el paradigma electrónico que es la "realidad
virtual". Pero sólo introducirlo, porque ahora una imagen sin palabras que la
describan, no tiene el mismo valor que antaño, y no sólo eso, sino que las
mismas palabras se han tenido que volver imágenes para ser divulgadas.
Eso ha ocurrido con el patrimonio bibliográfico y documental, que
ha permanecido escondido y ha evolucionado a la zaga de otros patrimonios como
el arquitectónico y el museístico. La gran difusión social del patrimonio
cultural y su explotación como recurso económico en las industrias culturales se
ha limitado al conocimiento de los dos últimos, hasta que el impacto de la
llamada sociedad de la información se ha introducido en el mundo de los
archivos, las bibliotecas y los centros de documentación.
Nadie puede dudar que los archivos, las bibliotecas y los centros y
redes de documentación se han abierto a la dinámica de las tecnologías de la
información, y se han convertido en el universo natural para la gestión del
conocimiento. Todo esto ha conllevado un cambio en los sistemas de trabajo, una
nueva definición de documento, una nueva gestión de la información y una
intensificación del intercambio y acceso a la documentación.
El proceso está abierto y tiene su mejor manifestación en un
fenómeno que podría denominarse "desmaterialización" del documento. Los
documentos se empiezan a convertir en algo intangible, lo cual era impensable
hasta ahora según la propia naturaleza de los mismos. El factor de
intangibilidad lo ha proporcionado la nueva realidad virtual que ha
revolucionado la accesibilidad al documento y por añadidura a la información.
La disponibilidad de los documentos ha cambiado al someterlos al
procesamiento electrónico, y la transmisión y la comunicación de los documentos
entregadas a la aplicación de la nuevas tecnologías multimedia, hipermedia y
realidad virtual se llevan a cabo sobre todo en el mundo de las redes.
El entorno digital está siendo objeto de numerosos estudios e
investigaciones, y como todos los fenómenos en sus primeras manifestaciones ya
ha producido su dosis de confusión terminológica.
En primer lugar se emplea el término "archivo" con gran asiduidad,
para referirse a fondos documentales de diversas materias y en distintos
soportes, que no constituyen el genuino fondo de archivo articulado por el
principio de procedencia. La acepción de archivo se toma como conjunto de
documentos, y es por ello que los sistemas de recuperación empleados no son los
que se ajustarían a un sistema de información descriptiva, de almacenamiento
electrónico organizado jerárquicamente de acuerdo a las reglas de descripción
multinivel y de herencia establecidas por la norma ISAD(G).
Cabe también referirse en este sentido a las expresiones "biblioteca
digital", "biblioteca electrónica" y "biblioteca virtual", que además de su
empleo indiscriminado, se suelen confundir entre ellas. La biblioteca digital
implica el uso de las telecomunicaciones, el acceso puede ser remoto e
independiente del lugar y número de conexiones. A diferencia de la virtual, la
digital suele estar formada por un conjunto de conexiones a varias fuentes de
información recogidas en Internet.
El diseño y la gestión de los recursos electrónicos procedentes del
patrimonio bibliográfico y documental parte de un proceso de digitalización de
los documentos. Y es este proceso de transformación del soporte papel al soporte
digital, el que me servirá de marco de referencia para estudiar aspectos
relacionados con la conversión y el almacenamiento de los documentos y su
manipulación en el entorno digital.
El adelanto que supone iniciar un proceso de digitalización de
documentos se manifiesta en dos propósitos sustanciales:
1. La preservación y conservación de los documentos.
2. La difusión y accesibilidad de los documentos.
La intención de este trabajo es centrarse exclusivamente en el
segundo aspecto. Por ello el desarrollo de los argumentos de este estudio se
fijarán en aquellos elementos de la digitalización que tienen que ver con la
recuperación y la difusión de la documentación digitalizada, esto es,
básicamente, el sistema de consulta.
El estudio que aquí se plantea ha surgido a partir de la
exploración de seis experiencias de digitalización diferentes, realizadas por
distintas entidades, y con fondos documentales diversos. En estas experiencias
en cuanto a los contenidos de sus fondos y de qué manera se ha resuelto su
consulta, así como su presentación a los usuarios, se basa este trabajo.
Para mucha gente el archivo digital o la biblioteca digital evoca
la imagen de un gigantesco repositorio de información en línea, al cual los
usuarios accederían a través de una búsqueda, cuyo final feliz sería conseguir
su información [1]. Pero hasta el momento los principales problemas de
recuperación surgen en este mismo punto de partida y se refieren a cómo
encontrar la información en un entorno digital.
El soporte digital es muy potente, pero es preciso organizar
opciones amigables para facilitar la búsqueda de información y el acceso a los
servicios que puede llegar a ofrecer.
Los soportes digitales de información y los vehículos que la
transportan, los servidores que la almacenan y los terminales que la
transforman, son ya muy variados y todos ellos contribuyen al peculiar y
novedoso fenómeno de la digitalización [2].
En términos generales, es injusto y hasta desproporcionado reducir
el mundo digital a la red Internet, pero como paradigma del archivo virtual que
ayuda a sustituir la autarquía documental por la cooperación, es una realidad
constante en todos los recursos sobre archivos disponibles en la red.
La Internet es una plataforma ideal para la materialización de la
difusión de los fondos documentales, con la construcción de un web se puede
ofrecer acceso a recursos propios, a recursos externos y a sistemas de
recuperación internos y externos (motores de búsqueda).
El requerimiento que supone la virtualidad en Internet ha provocado
que las experiencias estudiadas estén en su mayor parte en la red. No obstante,
quisiera destacar que en la selección de los ejemplos se ha tenido en cuenta la
representación de otros entornos de trabajo para el usuario: entorno telemático
(Internet), entorno monopuesto (CD-ROM comercializado) y entorno multipuesto
(centro de investigación).
Las expectativas que se pretenden cubrir con la elaboración de esta
investigación se concentran en un objetivo general, que es observar las
consecuencias de la recuperación de información digital dentro de la
estructuración de diferentes procesos de digitalización.
Además de esta consideración general, hay que anotar también otros
objetivos más concretos que son los que se exponen a continuación:
Objetivos específicos:
· Recoger los requerimientos técnicos básicos
y característicos de los procesos de digitalización (parámetros y sistemas de
digitalización).
· Evaluar la descripción y recuperación de
documentos (sistemas de consulta).
· Presentar diversas propuestas de edición y
explotación de documentos electrónicos (sistemas de almacenamiento, sistemas de
servicio de imágenes).
Los medios empleados han sido varios, y variada ha sido también su utilización.
Para realizar el presente trabajo me he servido de cuatro tipo de materiales:
1. Recopilación de datos en los centros.
2. Documentación facilitada por los centros.
3. Páginas web de los productores.
4. Bibliografía.
La
recopilación de datos en los propios centros ha sido sin duda la tarea más
laboriosa por su preparación. Por su parte, las páginas web han servido para
descubrir una serie de ventajas que ofrece el acceso digital, pero también a
través de este entorno se percibe una sensación de novedad y de provisionalidad
en la implementación de los proyectos, provocada muy probablemente por la propia
naturaleza de la red. Los proyectos presentados en Internet están más basados en
suposiciones que en realidades.
En cuanto al caso del almacenamiento y consulta en
disco óptico, la información se ha extraído de la propia aplicación, así como de
fuentes de información externas, pero complementarias sobre el producto y el
productor concreto que nos ocupa.
El análisis de la literatura sobre los procesos de digitalización
de los últimos años da una idea del crecimiento del interés por la gestión de
los documentos en el entorno automatizado. En su origen, como todos las
operaciones informáticas, la digitalización tenían atribuciones puramente
técnicas y su razón de ser implicaba exclusivamente al profesional que las
llevaba a cabo. Ahora estas consideraciones están cambiando, al incluir al
cliente-usuario como máximo exponente de los objetivos a conseguir al sumergirse
en uno de estos proyectos.
Cabe destacar una cierta división de los estudios
según se refieran a bibliotecas digitales o archivos digitales. Raramente se
localizan textos que traten el desarrollo de un plan de digitalización general.
Parece claro pues que las características de los documentos y su sentido como
colección diferencia al archivo de la biblioteca y viceversa. De momento existe
cierta ventaja para las bibliotecas, las cuales ya han desarrollado plenamente
una etapa imprescindible de normalización. Los archivos están a caballo entre la
redacción de sus normas de descripción y el avance y empuje de la realidad
virtual.
Finalmente hay que hacer notar que existe todavía
poca bibliografía específica sobre la recuperación específica de la información
en la órbita digital. De momento, se han trasladado las referencias y los
parámetros de evaluación de los sistemas automatizados de gestión de la
información.
En todo sistema de almacenamiento digital de imágenes cabe distinguir
dos procesos fundamentales: el proceso de digitalización y almacenamiento y el
proceso de consulta [3]. Como ya se ha indicado anteriormente, serían
específicamente el proceso de consulta y el formato de visualización de
resultados, los elementos que interesan en nuestro caso.
Para enfrentarme con el estudio de los casos de digitalización que
aquí se presentan he llevado a cabo dos tipos de actuación, a saber:
A1.Visitas a los centros digitalizadores
A2. Estudio de los productos a
través de sus entornos de difusión: páginas web, y discos ópticos
comercializados.
A1. Visitas a los centros:
La idea de conocer los procesos de digitalización in situ, me pareció
bastante interesante desde el momento en que surgió la posibilidad de realizar
este estudio. Se trataba de "poner una cara" a uno de tantos mecanismos que
conocemos en sus resultados, pero que no se suele tener la opción de contemplar
directamente.
Para realizar esas visitas, desarrollé un plan de trabajo con las
consideraciones y los datos que a primera vista exigía el conocimiento de los
centros digitalizadores. Así, elaboré unas pautas para tener un control y
obtener un aprovechamiento óptimo de las entrevistas con los responsables.
El Plan de trabajo
seguido se detalla a continuación:
I. INFORMACIÓN
GENERAL:
Fecha de creación de la colección y del centro.
Edificio e instalaciones (distribución del espacio, sucursales, condiciones materiales, etc.)
Fondos (número total de fondos y número clasificado por tipo de fondos, crecimiento estimado para los próximos años, política de préstamos, presupuestos, etcétera).
Servicios (número y tipo de servicios...)
Usuarios (número y tipo de usuarios que utilizan la biblioteca, crecimiento estimado para los próximos años, política de préstamo, etcétera).
Personal (número de empleados, categoría y funciones que tienen, estimación de su futuro crecimiento, cuántos trabajarían simultáneamente con los ordenadores, formación de los empleados, especialmente en lo que se refiere a informática y catalogación automatizada).
Organización actual (organigrama, horarios y calendario de apertura, turnos de trabajo, circuito de los documentos, tasa de actividad periódica, informatización parcial, servicios prestados, etcétera).
Previsiones para el futuro
(proyectos propios o del ámbito bibliotecario del que se depende, integración
en redes, etcétera).
II. PROYECTO DE
DIGITALIZACIÓN:
Fechas de inicio/ finalización.
II. 1. Aspectos del proyecto de
digitalización:
1. Plan de desarrollo global que determine los objetivos globales del sistema y defina el proyecto y las prioridades. Un PDG con:
Análisis de la institución
Necesidades a cubrir
Calendario de actuación
Objetivos globales del sistema, definición del proyecto y prioridades.
2. Análisis de sistemas. Objetivos y requisitos específicos. Estudio de viabilidad.
3. Especificación de los requisitos. Objetivos y requisitos del propio proyecto.
4. Evaluación de sistemas. En qué medida los sistemas propuestos cumplían los requisitos, y por qué se solicitó un producto existente, o se desarrolló un nuevo sistema.
5. Puesta en marcha. Control de la instalación del sistema elegido.
6. Control y mantenimiento. Revisión continua y mejora del sistema
II.2. Fase de planificación
Estudio y diseño del sistema: quién realizó el estudio: un consultor exterior, un responsable del centro o un equipo de trabajo.
Análisis del sistema existente: la descripción y análisis detallado de todos los elementos y funciones del centro.
II.3. Fase de selección:
Qué sistema se escogió y por qué.
II.4. Fase de implantación
Estructuración del proyecto (selección documental, preparación de documentos y número de documentos digitalizados).
PARÁMETROS DE DIGITALIZACIÓN: resolución de imágenes (número de puntos obtenidos por imagen ppp) y el nº de niveles de gris: valores. Mejorar la calidad de lectura de los originales.
SISTEMA DE DIGITALIZACIÓN (Proceso de captura de la imagen): escáner o cámara digital (características y descripción del procedimiento)
Formatos y compresión de imágenes.
SISTEMAS DE CONSULTA: Búsqueda y Recuperación Automatizadas. Normas ISAD, consulta digital de imágenes, gestión de usuarios (registro, petición de documentación original, impresiones, etc.)
Acceso a la información para el usuario: interfaces
Visualización en monitor y manejo y tratamiento digital de imágenes: ampliaciones, reducciones, rotaciones, eliminación de manchas, imagen en negativo y relieve, marcar zonas.
Aspectos informativos del original: formato del original (medidas)
SISTEMAS DE ALMACENAMIENTO DE IMÁGENES: discos ópticos (CD-ROM, DVD)
SISTEMAS DE SERVICIO DE IMÁGENES: servicio manual, servicio automático
Impresión
III. EQUIPO INFORMÁTICO:
III.1. Tipo de programas de aplicación y características:
Sistemas de gestión de bases de datos documentales, o relacionales.
Sistemas de archivo electrónico.
Programas de reconocimiento óptico de caracteres (OCR).
Sistemas de gestión de bibliotecas: integrado o modular.
Sistemas de gestión de
archivos.
IV. CONCLUSIONES:
Comentarios sobre los efectos
conseguidos tras la digitalización, situación actual, ventajas, desventajas:
revisión del fondo, manipulación del fondo original favoreciendo la preservación
y conservación; trabajo del personal; difusión de los fondos (CD-ROM,
intercambio con otras bibliotecas); servicio rápido; mejora de las
posibilidades de lectura (tratamiento de originales); reproducciones rápidas
(mejoran el original); sistemas automatizados accesibles por Internet.
A2. Estudio de los productos a
través de los entornos de difusión
A la hora de observar las experiencias a través de los resultados, se ha tenido en cuenta la diferencia de planteamiento y la dificultad de equiparar y nivelar los tipos de información obtenidos cuando el contacto con el centro digitalizador ha sido directo.
En
las experiencias volcadas en Internet, y en CD-ROM comercializado, se ha
investigado en la documentación incluida en ambos estadios siguiendo un Método
de estudio apropiado al soporte y medio de difusión. El esquema de este método
contempla los siguientes apartados:
1º
ESTUDIO DE LA PRESENTACIÓN Y CONTENIDOS DEL PROYECTO. Navegación por la web con
una valoración de:
Diseño de las páginas (colores, tipos de letras, grafismo...)
Organización de la información (sistema de información, estructura, planificación...)
Tipos de usuarios (generales, especiales, ambos...)
Tipo de información que contiene (adecuada, satisfactoria, ...)
Idoneidad de los enlaces incluidos en las páginas (pertinencia, calidad, cantidad...)
Idoneidad de la información para los usuarios (profundidad, accesibilidad, ...)
2º ANÁLISIS DEL SISTEMA DE BÚSQUEDA
a) La base de datos:
Contenido de la base de datos: qué se está buscando para localizar las bases de datos que cubren la materia de la búsqueda, autoridad y envergadura de los productores, capacidad de cobertura (cronológica, temática, actualización, tipología documental).
Presentación de los registros: qué clase de campos incluye, qué hay en cada uno, etc.
El análisis documental: grado de coherencia en el tratamiento que recibe la información de la base de datos.
b) La recuperación de la información:
Capacidades de búsqueda del software de recuperación (para usuarios finales, para usuarios expertos y profesionales, o para ambos; operadores...).
3º ANÁLISIS DEL SISTEMA DE VISUALIZACIÓN
La interfaz de usuario: El acceso del usuario a la información: amigabilidad, fácil navegación, variedad en los formatos de salida, consistencia.
B.-
Presentación de los resultados
Partiendo de estas dos formas de trabajo, he confeccionado a su vez un
subsistema de presentación del estudio de cada experiencia, producido tras la
elaboración de una sinopsis que contiene los puntos que son objeto de esta
investigación, y que se dividen en cinco aspectos, que sirven para describir y
distinguir cada una de las experiencias.
A partir del procesamiento de los datos obtenidos
por uno y otro método, el marco de presentación comprende los siguientes
exponentes:
I. Descripción del centro y de sus fondos: en este punto se esbozan
los aspectos generales sobre el centro digitalizador (historia y evolución del
centro) y los fondos que alberga (materias, volumen, etc.).
II. Definición del proyecto de
digitalización: con las premisas mínimas facilitadas por los centros.
III. Análisis del Sistema de consulta de
los documentos: contiene los detalles de la observación de la recuperación de la
información digitalizada.
IV. Descripción del Sistema de
visualización de los documentos: donde se da noticia de la presentación de los
documentos en pantalla.
V. Relación de las Características
específicas del proyecto: enumeración de las peculiaridades que cabe distinguir
en cada experiencia.
5. RESULTADOS Y CONCLUSIONES
Como reflexiones finales sobre lo desarrollado en este trabajo, voy
a plantear los puntos que considero fundamentales y que representarían el
sentido y la realización de un proyecto de digitalización, qué se consigue y
para qué. Por otro lado se señalan algunas estimaciones sobre la situación de
los sistemas de consulta y de visualización de los documentos. A través de las
valoraciones de las experiencias descritas y analizadas, cabe ahora desgranar
algunas conclusiones finales que responden a su vez a una serie de
interrogantes.
5.1. Objetivos y propósitos posibles de la digitalización
A) ¿POR QUÉ UTILIZAR EL SOPORTE DIGITAL?
Estas tecnologías permiten de una forma económica la edición o reedición de estos fondos al tiempo que posibilitan su consulta y reprografía sin necesidad de acudir a los propios materiales originales.
De esta manera, se consigue un doble objetivo:
1. propiciar la preservación y conservación de los originales.
2. facilitar el conocimiento y la difusión de aquellos materiales considerados
básicos para los investigadores mediante la edición en soporte digital, a
costes muy reducidos y de una manera viable.
En la edición
electrónica en CD-ROM, Internet u otros soportes se ha encontrado una
herramienta idónea para la difusión de fondos museográficos, bibliográficos, y
documentales mediante reproducciones facsimilares, bases de datos con
catálogos o instrumentos de descripción, etc.
La edición en soporte electrónico supone, además una notable economía en los
costes de edición respecto a la edición en papel y una ágil herramienta de
consulta, ofreciendo la información de manera estructurada y permitiendo
consultas textuales.
B)
¿QUÉ BENEFICIOS OBTIENE EL USUARIO/INVESTIGADOR?
Facilidad de acceso a unos materiales de consulta limitada.
Un servicio rápido.
Mejores posibilidades de lectura con la aplicación de los tratamientos que ofrece el software.
Obtención de reproducciones rápidas, e incluso mejores que el original.
Accesibilidad creciente a través de Internet, a fondos localizados por todo el mundo.
Utilizar en el lugar de trabajo una riquísima colección de textos de interés
histórico, filosófico, literario, etc.
C)
¿QUÉ VENTAJAS PROPORCIONA AL CENTRO DIGITALIZADOR?
Los procesos de digitalización implican revisiones del fondo, y manipulación
del fondo original, en definitiva, el movimiento que favorece la preservación
y la conservación.
Se evita la manipulación de originales, favoreciendo la preservación y
conservación.
El trabajo del personal de servicio en sala es sensiblemente inferior.
Se favorece el intercambio de datos con otros centros.
Se abre a los usuarios una amplia gama de servicios, como pueden ser el acceso
en línea al contenido de los libros desde OPAC's gráficos, la consulta remota
a través de las redes de transmisión de datos, la reproducción en papel con
una gran calidad o la posibilidad de trasladar esa información a un soporte
tan cómodo de manejo como los CD ROM.
5.2. Desarrollo de los sistemas de consulta
La integración de sistemas de información constituye un elemento primordial
para el establecimiento de los sistemas de gestión del conocimiento.
Las base de datos son en su mayoría referenciales, pero aprovechan el entorno
navegacional del hipertexto para facilitar el acceso al documento completo si
éste se encuentra en formato electrónico.
Hay iniciativas y cambios en el lenguaje y la arquitectura sobre los que se
construyen las páginas, los documentos. Todo parece indicar que el futuro pasa
por el XML (Extensible Markup Language), lenguaje que permite que un grupo
concreto de personas organice su propio lenguaje de etiquetas para
intercambiar información en un campo determinado.
Se explota una realidad nueva que es la del acceso de la información a través
de las capacidades hipertextuales: los enlaces.
No hay uniformidad en las interfaces, cada uno ofrece su opción propia a pesar
de estar tratando documentos muy semejantes en su contenido y en su forma.
5.3. Situación de los sistemas de visualización
La calidad de la imagen digital es una garantía en la recuperación.
No existe un estándar de resolución, hay dos opciones digitalizar para un
acceso adecuado, o digitalizar para la conservación fidedigna de los
documentos.
Las características del documento condicionan la elección de los parámetros.
Conviven las soluciones de digitalización del texto original, para
documentación antigua de carácter histórico, con los textos en html o en
ASCII, para los documentos contemporáneos.
Los sistemas de archivo electrónico han trabajado específicamente los efectos
de manipulación de los documentos digitales en la pantalla, aplicación que
resulta muy versátil y llamativa para el investigador, pero que no se ha visto
acompañada de un mismo nivel de explotación en la recuperación.