CEPAL/CLADES
Programa de Gestión de la Información
GRIFFITHS, José-Marie.Por qué la WEB no es una biblioteca. (Why the WEB is not a Library. En: FID Review, Vol. I No. I, 1999. pp. 13-20.) (Traducción y extracto preparado por el CLADES para fines docentes y de divulgación).
Que es y que está haciendo la Web - y por qué tenemos que tomarla en serio
Está rápidamente llegando a ser una una fuente de información omnipresente
Como los números lo aclaran, la Internet, y más especialmente la WEB, ha llegado a ser casi una fuente de información para millones de personas. Aún más, el segmento de población de mayor crecimiento en el uso de la Web es el de los niños en edad escolar. Estos futuros adultos están formando destrezas y hábitos de adquisición de información y trabajo con la misma, y para muchos de ellos la Web es un medio y profesor más atractivo que sus textos de estudios y que el bibliotecario local.
La Web tiene casi una atracción mágica
Ahora las computadoras personales salen con un modem interno y ya vienen configuradas con un software para buscar en la Web. El proceso de hacer una conexión a la red es ahora a menudo tan fácil como conectar un cable telefónico. Con un doble click de un icono, los usuarios tienen repentinamente un universo de información en sus dedos.
Los usuarios pueden obtener información sin necesitar asistencia, participación o supervisión de otra persona, tales como un profesor o un bibliotecario. Tampoco es necesario un conocimiento de la clasificación decimal universal de Dewey. Ellos no tienen que dejar el confort de su propio "mousepad", y tampoco tienen que buscar desesperadamente un estacionamiento o lamentarse de que son las dos de la tarde de un día sábado en la mañana, a sabiendas que la biblioteca no abre hasta las diez del día lunes.
Hace disponibles recursos escasos en cualquier parte
A menudo, los investigadores académicos necesitan recursos informativos de colecciones especiales disponibles sólo en un lugar en el mundo. El tiempo y los costos de un viaje pueden hacer esos recursos completamente inaccesibles para ellos y, de este modo, sólo pueden trabajar con aquello a lo cual tienen acceso. Las personas que buscan información por ellos mismos o sus familiares, a menudo tienen intereses exóticos, basados en antecedentes o necesidades muy específicos. Crecientemente, algo de lo que necesitan está en la Web.
¿Qué está mal en este panorama? Tenemos millones de personas que necesitan y quieren acceso a billones de piezas de información, y la Web pareciera estar haciendo esto posible. ¿Cuál es el problema entonces? El problema es que la Web no es una biblioteca por algunas razones muy importantes.
Razones por las cuales la Web no es una biblioteca
Primeramente, y lo que es más importante, no todo está allí. La enorme cantidad de información que uno es capaz de recuperar de una búsqueda en la Web da la impresión que uno ha penetrado profundamente en la información disponible sobre un tópico. Esto no es cierto en absoluto, no lo es hoy día y ciertamente no lo será todavía en los próximos años.
David Barber, en un artículo del Library Technology Reports, señala que "…la proporción de contenidos disponibles digitalmente es pequeño comparado con el monto de material impreso disponible. No es a través de la conversión de los impresos a formas digitales, como se reducirá sustancialmente el tamaño de las colecciones de material impreso. Muchos recursos informativos son tan grandes que una conversión digital completa no es posible. En la Biblioteca Pública de Cleveland, existe una colección de sobre un millón de fotografías. Asumiendo que existieran los recursos financieros necesarios, y asumiendo que la conversión digital de cada fotografía podría tomar cinco minutos para procesar y escanear, esta tarea tomaría a una persona más de 2000 semanas de 40 horas de trabajo, o 40 años.
Esta ilusión de profundidad y cobertura es, como lo sabe cualquier buen investigador, extremadamente peligrosa. Si se parte del razonable supuesto que la mayoría de la personas buscan información con algún propósito en mente, el hecho de recuperar un conjunto de información altamente sesgada o incompleta sobre un cierto tópico, mientras supone que tiene toda la información, es algo que nadie puede considerar sabio. La historia nos provee muchos ejemplos de los peligros de lo desconocido.
A la Web le faltan estándares y validación
En segundo lugar, está el caso que mucho de aquello disponible en la Web no cumple con un estándar de validación razonablemente aceptado, algo que las bibliotecas y los bibliotecarios han sido radicionalmente capaces de establecer cuando construyen sus colecciones. Una gran proporción de lo que está en la Web, ha sido publicado allí por individuos sin una revisión de sus pares y sin una afiliación institucional identificable.
Por ejemplo, la comunidad médica está expresando en forma creciente su preocupación acerca de la cantidad de información médica puesta en la Web que, sólo por el hecho de estar "publicada e impresa", parece ser autorizada y parece formar parte de la práctica médica aceptada. Mientras cualquier profesional médico al leerlo puede inmediatamente detectar las imprecisiones o contradicciones, una persona lega, no tiene las capacidades o el contexto para hacerlo.
Las instituciones médicas se han establecido especialmente en ciertos campos o filosofías de la medicina. Dada la información sobre afiliación en ciertos campos de la medicina, los profesionales médicos pueden saber y conocer el contexto subyacente de la información presentada y saber, antes de empezar a leer, si aceptan las premisas básicas sobre las cuales el artículo está escrito. Sin esa afiliación identificada, o una comprensión acerca de lo que puede significar esa afiliación, una persona lega nuevamente tendrá dificultades para discernir entre lo que es sólo una idea u opinión de una persona y lo que tiene una historia y un consenso de muchos expertos en esa disciplina.
La información en la Web tiene una mínima catalogación
En tercer lugar, la Web no es una biblioteca, en el sentido que casi no ofrece catalogación (descripción del contenido, de la forma o la versión del documento). En la Web hay, además, una mínima organización o estructura de las colecciones. Lo que el investigador encuentra depende de la adecuación de los motores de búsqueda, la destreza en el uso de ellos y del número de fuentes recuperadas. La mayoría, si no todos los motores de búsqueda, se apoyan en una recuperación basada en el análisis de frecuencias de la presencia de una palabra, y no en el contenido o significado de la información. Si uno está tratando con información cuantitativa, una aproximación estadística puede ser más adecuada que una aproximación semántica. Pero en nuestro mundo crecientemente complejo, hay cada vez menos problemas que puedan ser resueltos solamente con un enfoque estadístico.
La Web no provee una efectiva recuperación de información
Desafortunadamente, aquella facilidad de uso de las interfaces y herramientas de navegación de la Web, es una degradación del proceso de recuperación. Ya se escuchan quejas por la sobreabundancia de información, y la ansiedad (informativa). Las herramientas disponibles hoy en día son demasiado simples si se desea una recuperación efectiva para muchos propósitos, especialmente en un medio que puede favorecer una explosión de la cantidad de información que hace disponible. La Web es una excelente herramienta para encontrar información acerca de algún tópico, encontrar información de actualidad y muy cambiante y comunicarse con otras personas con intereses similares. Pero suministra cada vez menos apoyo a un investigador de información serio. La aproximación estadística (frecuencia de palabras) implementada en la mayoría de las herramientas de navegación de la Web, incluso con modificadores de tema, tipos o forma, son incapaces de discriminar entre colecciones y menos aún entre ítems individuales o desagregaciones más especificas de contenido
La investigaciones sobre los enfoques semánticos de la recuperación tienen una larga historia pero en su mayor parte ha tendido a ser ignorada por quienes desarrollan herramientas basadas en la Web. Para lograr algún progreso, es esencial que haya una mayor interacción entre quienes desarrollan herramientas de la Web y la comunidad que se ocupa de la investigación en la recuperación de información.
America Online, Netscape y Yahoo, entre otros, están empezando a proveer una organización estructurada con una jerarquía de sitios por temas que se pueden cliquear. Sin embargo, la categorización es sólo por sitios y sigue basándose en frecuencia de palabras o tipo de fuentes. No obstante, incluso estos mínimos esfuerzos resaltan el hecho que para que la información sea de utilidad para la gente, debe estar organizada. Sin embargo, es interesante notar que la catalogación que se está haciendo en la Web generalmente está ocurriendo fuera de los mundos académicos y bibliotecarios. Actualmente la Web se parece mucho a la Biblioteca del Congreso en su totalidad, con todos los materiales encajonados al azar, o lo que quizás sería una imagen más exacta, todos los materiales en grandes montones desorganizados puestos en el piso.
También sucede que los sitios de búsqueda se están convirtiendo en sitios de destino: una encuesta realizada por NPD Online Research sobre guías de búsqueda y de navegación, ha revelado que si bien la gente está utilizando los sitios de búsqueda para buscar en la Internet, también los están usando por el creciente número de servicios disponibles en los sitios de búsqueda mismos, tales como enlaces con nuevos sitios, sitios con contenidos noticiosos y sitios con entretenimientos y juegos. Cuando se les preguntó qué tipos de sitio visitaban, más del 50% dijo educación , 45% revistas y diarios y 42% tecnología.