II. LOS MOTORES DE BÚSQUEDA
Los motores de búsqueda basados en crawler, a diferencia de los basados en directorios, operan de forma automática para la clasificación de las páginas, es decir no requieren interacción humana. Los tres tipos de motores de búsqueda soportan un lenguaje de consulta el cual permite obtener resultados más precisos
2.5 CONCEPTOS GENERALES
A continuación se presentan las partes de una herramienta de búsqueda basada en crawler, en la figura 1 se puede apreciar la manera en la que interactúan estas partes:
- Formas para búsqueda: es una interfaz HTML que permite al usuario introducir los términos de búsqueda, es decir la frase con la cual identifica al tema, y especificar las preferencias (especificar un lenguaje, usar operadores, etc.) para realizar la consulta.
- Motor de búsqueda: es el programa (CGI Common GateWay Interface, módulo servidor o servidor separado) que acepta la petición de la forma para búsqueda o URL (localizador de recursos uniforme), busca al índice, y regresa la página de resultados al servidor.
- Archivo Índice: creado por un programa indexador de búsqueda, es un archivo índice especial que almacena los datos de los sitios, y está diseñado para accesos muy rápidos. Este archivo necesita ser actualizado constantemente, de lo contrario no estará sincronizado con las páginas o proveerá resultados obsoletos.
- Listado de resultados de búsqueda: es una página HTML que contiene el listado de resultados coincidente con los términos de la búsqueda. Se muestra de acuerdo a un orden de relevancia, generalmente se basan en el número de veces en que aparece el término de búsqueda en la página, y si este existe en el encabezado o el título. Los listados, generalmente, incluyen el título de la página y un resumen (las meta descripciones, las primeras líneas de la página o el texto más importante). Algunos incluyen además la fecha de modificación, el tamaño, y la URL.
- Crawler o indexador: es el programa que se encarga de inspeccionar e indexar la red y proveer los datos obtenidos de las páginas HTML al archivo índice. También es el encargado de mantener actualizado el índice.
- Páginas HTML: Aunque no son parte del motor de búsqueda, son la fuente de información que lo alimenta.

Figura 1. Partes de un motor de búsqueda basado en crawler[SUBIR]
2.6 COMO BUSCAR EN INTERNET
La dificultad no radica en la localización de información sobre un tema, sino en encontrar información realmente útil y tener un grado de seguridad relativamente alto de que lo que se encuentra es de lo mejor que se ha publicado (fiable, actualizado), al menos en Internet, sobre el tema.
Para la localización de información relevante en un período de tiempo adecuado se hace cada vez más necesario un conocimiento sobre el funcionamiento de las herramientas de búsqueda y una cierta sistemática (tener un procedimiento ordenado para realizar la búsqueda) a la hora de plantear las estrategias de búsqueda. Antes de la búsqueda vale la pena dedicar un pequeño período a reflexionar sobre la mejor manera de proceder para la búsqueda de la información y las herramientas más adecuadas para su localización.
Aunque no existe una metodología de búsqueda ideal, se puede decir que la experiencia adquirida con el uso de las herramientas es el mejor aprendizaje. El aprendizaje será más rápido y completo con un conocimiento suficientemente amplio de las funciones, ventajas y limitaciones de esas herramientas. Vale la pena dedicar un tiempo a aprender las posibilidades de recuperación que presentan, esto se puede observar en las páginas de ayuda y en las FAQs (Frequently Asked Questions) de los buscadores. Las FAQs son un conjunto de preguntas y respuestas muy frecuentes entre los usuarios, sobre los servicios del sitio.
A continuación se ofrecen algunos consejos que pueden ayudar a iniciarse en el uso de los motores de búsqueda:
- Seguir un procedimiento ordenado en la búsqueda de información:
- Conocimiento de la necesidad de la información. Tener claro cual es la necesidad de información, el grado de tratamiento y cobertura: qué enfoque (general, especializado), en qué idioma, a qué ámbito geográfico se refiere y con qué grado de actualización.
- Construir la frase de consulta, según las normas del lenguaje de interrogación del buscador. Si no se conoce ese lenguaje consultar la ayuda del buscador.
- Evaluación de los resultados. Comprobar los enlaces de las primeras páginas de resultados, sin dejarse abrumar por el número de resultados que arroje, ya que la información de las primeras referencias puede ser relevante.
- Utilizar los índices para recuperar temas amplios y los motores para búsquedas especificas:
- ¿Cuándo usar un directorio temático?
Cuando no se tiene una idea muy precisa de lo que se quiere, pero si del tema en el que cae. Cuando la información se debe restringir a un área geográfica concreta es más conveniente usar un directorio especializado en esa área.
- ¿Cuándo usar un motor de búsqueda?
Si se tiene muy clara la necesidad de información y el tipo de palabras que pueden contener los documentos relevantes. Cuando se quiere exhaustividad sobre temas específicos (el mayor número posible de documentos sobre algo).
- A la hora de realizar la consulta en un buscador:
- Para generalizar la consulta. Para obtener un mayor número de resultados se deben emplear sinónimos, equivalentes en otros idiomas, truncar palabras, usar menos palabras en la consulta, etc.
- Para especificar la consulta. Explotar las posibilidades del lenguaje de consulta, tales como comillas, operadores boleanos, paréntesis, ponderación de términos de búsqueda, operadores de adyacencia y proximidad, mayúsculas y acentos.
- Buscar otras opciones: complementar el uso de índices con el de motores de búsqueda cuando los resultados obtenidos sean escasos, o viceversa. Si un buscador no ofrece los resultados esperados se deben usar otros buscadores, o acudir a los meta motores de búsqueda. Se deben usar los índices y buscadores locales cuando lo que se busca es sobre un área geográfica o idioma concreto. Los índices locales suelen ser más rápidos que los mundiales.
- Usar minúsculas y no usar acentos, al menos al principio: esto aumenta las posibilidades de encontrar varios temas, dado que la mayor parte de los buscadores son sensibles a mayúsculas / minúsculas.
- Buscar pistas y seguir los enlaces: no se deben perder los enlaces que se han encontrado, se deben guardar por si se necesita hacer una revisión posteriormente.
- Vigilar la ortografía: se debe tener especial cuidado con las palabras en inglés, su ortografía no siempre es fácil. A veces hay diferencias entre el inglés americano y el británico, lo que en un lado es color, organize y elevator en el otro es colour, organise y lift, por poner algunos ejemplos.
- Leer las FAQs ( documento de preguntas frecuentes ) de un tema concreto: una buena idea es localizar la FAQ del tema sobre el que está buscando información.
- Optar por las páginas de calidad: las páginas de calidad tienden a ser más completas y están desarrolladas por personas y grupos interesados en recopilar información de forma completa y cuidadosa, manteniéndola actualizada. Los sitios bien diseñados tienen menos errores, cambian menos frecuentemente de lugar y en general son mejor referencia que las páginas personales o de aficionados. Las páginas de calidad son más mencionadas y mejor catalogadas por buscadores y páginas sobre temas similares.
- Intentar localizar empresas y organizaciones representativas: ¿qué mejor que la NASA (www.nasa.gov) para encontrar las fotografías de Marte?. Se debe tratar de encontrar primero las empresas por su dominio.
- Limitar los dominios y servidores: Esto sirve para motores como AltaVista, y permite limitar el dominio de donde deben obtenerse los resultados. Es útil para buscar información sólo dentro de una determinada entidad (empresa, universidad, etc.) o incluso un país.
- Buscar enlaces directamente: también en AltaVista, una expresión como link:www.paginaweb permite encontrar todas las páginas que contengan enlaces a una página determinada.
- Evitar repetir sitios: los enlaces cambian de color cuando el sitio ya fue visitado.
- Utilizar buscadores especializados: para realizar búsqueda de información de personas, software u otro tipo de información especial, es preferible utilizar un motor de búsqueda especializado en esa área.[SUBIR]
[COMENTARIOS] [ANTERIOR] [INICIO] [SIGUIENTE]