Taller en Tecnología de Redes Internet para América Latina y el Caribe.
Programa 4: Tecnologías Internet para Bibliotecas.|
|
14 al 18 de junio de 1999 |
Gabriela Ortúzar F.
Universidad de Chile
Sistema de Servicios de Información y Bibliotecas - SISIB
HERRAMIENTAS DE BÚSQUEDA
1. BUSCADORES AUTOMÁTICOS (Search engines)
1.1 Características de los Buscadores
1.2 ¿ Cómo Funcionan ?
1.3 ¿Cómo Ordenan los Resultados?
1.4 Principales buscadores automáticos
1.5 Buscadores regionales
1.6 Buscadores especializados
2. METABUSCADORES
3. DIRECTORIOS O BUSCADORES TEMÁTICOS
3.1 Características de los principales directorios
4. ESTRATEGIA DE BUSQUEDA
5. REFERENCIAS
6. ANEXOS
INTRODUCCION
Muchos han comparado a Internet como una enorme biblioteca global. Esto es cierto en algunos aspectos, sin embargo tiene grandes diferencias: no dispone de un catálogo centralizado para acceder a la información; el crecimiento Internet está sobrepasando la capacidad de los seres humanos, o de la tecnología para controlar la recuperación de la información; y, la calidad de sus contenidos es desigual.
Nos enfrentamos a un mundo de información que:
Para utilizar en mejor forma esta poderosa fuente de información debemos: Familiarizarnos con las herramientas de búsqueda (buscadores) y desarrollar técnicas efectivas de búsqueda.
HERRAMIENTAS DE BÚSQUEDA
1. BUSCADORES AUTOMÁTICOS (SEARCH ENGINES)
Son aquellos que a partir de cierta información entregada en lenguaje natural o de acuerdo a alguna especificación, puede recuperar la información que uno está buscando, desde la base de datos de los buscadores.
Encuentra los documentos que contengan las palabras claves introducidas. Habitualmente localiza las páginas Web que mejor se adapten a las palabras introducidas. Existen más de 1.000 buscadores en Internet, los que no entregan los mismos resultados, ya que existen diferencias en:
1.1 Características de los buscadores
Están compuestos por tres partes :
Son programas que buscan continuamente por todos los servidores de WWW (también en los de News , Gopher y FTP), construyendo un índice de lo hallado. También son conocidos como arañas por su continuo desplazamiento sobre la red o telaraña.
Cómo decide un robot qué visitar?
Depende del robot, cada uno usa su propia estrategia. En general comienzan por un listado histórico de URLs, especialmente de documentos que tienen enlaces a muchos Webs, listas de servidores, páginas de novedades y los webs más populares de Internet. Mayores detalles en anexo 2.
La mayoría de los servicios de indexación o buscadores permiten enviar URLs manualmente, las que quedan en lista de espera para que el robot las visite.
Una vez que tiene constancia de la existencia de un documento, lo indexa y lo añade a su base de datos.
Contiene todos los URL encontrados, y asociados a ellos, la información relativa sobre sus contenidos:
La base de datos es actualizada continuamente por los robots que añaden nuevas páginas o referencias, actualizan las que han cambiado y borran las que ya no existen.
Programas que buscan en la base de datos de documentos HTML indexados por un robot.
Es la parte que vemos cuando realizamos la búsqueda. Después de introducir una petición de búsqueda, el motor de búsqueda la coteja con la base de datos y devuelve una lista ordenada de las coincidencias. La lista está ordenada según la relevancia de la consulta colocando primero las más coincidentes.
1.2 ¿ Cómo funcionan ?
Al conectar con algún buscador nos encontraremos con una página que contiene un formulario para definir nuestra búsqueda y las opciones de la misma; tras rellenarla, enviarla y esperar unos segundos, el buscador nos devolverá una lista de lugares donde figura nuestra búsqueda. Así pues tendremos dos áreas según el propósito:
Si no conseguimos los resultados deseados, volvemos al inicio, pero modificando la estrategia de búsqueda según la observación de los resultados.
1.3 ¿Cómo ordenan los resultados?
Los buscadores seleccionan entre millones de páginas aquellas que coinciden con la palabra clave y luego despliegan esos resultados en un orden que varía según el tipo de buscador. Utilizan diferentes mecanismos para establecer la relevancia:
Título
— una palabra o frase asignada por el creador de la página web.Descripción — un tipo de metatag que entrega un pequeño resumen de la descripción del contenido, elaborado por el creador de la página.
Keywords o palabras claves— otro tipo de metatag que consiste en una lista de palabras claves que se espera sirvan para que los motores de búsqueda puedan identificar la página.
Cuerpo — El contenido que ve el que consulta la página web.
Aquellos motores de búsqueda que soporten metatags (descripción y keywords) le darán más importancia a los términos incluidos en esos campos.
Consideraciones:
En general no manejan información precisa. Darán mayor importancia a un documento que tiene mayor cantidad de ocurrencias en lugar de aquel que posee información relevante para el usuario.
1.4 PRINCIPALES BUSCADORES AUTOMÁTICOS
1. Alta Vista
URL:
Tamaño: Más de 150 millones de páginas
Actualización: 2 a 3 días
Interface: Simple y avanzada. Las dos permiten búsqueda booleana. La interface avanzada permite limitar la búsqueda por fecha.
Ayuda: Clara con instrucciones detalladas.
Características: Búsqueda por frase en forma automática. Operadores booleanos AND, OR, NOT, NEAR; truncación derecha e izquierda con '*'; habilidad para restringir la búsqueda a ciertas partes o a un tipo de documentos , ej. título o imagen, URL, Java applets, y enlaces. Indice de relevancia basado en el lugar donde se encontró el término dentro del documento, y el número de ocurrencias del término dentro del documento.
Alta Vista fue el primer buscador que incorporó la posibilidad de acotar las búsquedas por idioma, incluyendo 25 diferentes idiomas.
Resultados: El despliegue de aciertos muestra el título, la URL, las dos primeras líneas del documento, el idioma, fecha y tamaño (en bytes) de cada documento. Los resultados son desplegados en orden de relevancia. Además se puede acotar la búsqueda agregando palabras que pueden ser incluidas o excluidas de la búsqueda.
Otros: Hay opciones de búsqueda por newsgroups, personas y empresas. Posee un sistema de traducción automática que traduce textos y documentos web, desde y hacia diferentes idiomas.
Es el más potente, destaca por su rapidez de respuesta en devolver las direcciones y referencias. Es muy completo.
2. Northern Light
URL: http://www.northernlight.com
Tamaño: 140 millones de páginas. Su base de datos es una de las 3 más grandes, junto con HotBot y Alta Vista.
Indexación: 2 a 3 semanas.
Interface: Simple y avanzada.
Ayuda: Adecuada. Podría ser más detallada.
Características: Para buscar permite AND, OR y NOT (+ - para incluir o excluir términos), pero no todas las búsquedas booleanas.
Resultado: Los resultados son desplegados en orden decreciente de relevancia. Northern Light tiene una opción única dentro de los buscadores que es ordenar los resultados en carpetas (Custom Search Folders) que pueden ser de 4 tipos: materia, tipo de documento, fuente e idioma. Las materias se van subdividiendo en subcarpetas.
Otros: A través de su base de datos de documentos WWW ofrece acceso a una colección especial de 5.400 fuentes de información (7 millones de documentos en texto completo) que incluyen libros, revistas, publicaciones académicas y servicios en línea de news.
3. HotBot
URL: http://www.hotbot.com
Tamaño: 110 millones de páginas
Indexación: 1 y 3 días
Interface: HotBot ofrece 2 interfaces:
Una por defecto (que no es simple, ya que ofrece más posibilidades que algunas búsquedas avanzadas de otros buscadores) y SuperSearch.
Ambas interfaces ofrecen menús para modificar los criterios de búsqueda.
Restringen la búsqueda por fecha, lugar geográfico, y nombre de dominio.
Ayuda: "Getting Started", responde preguntas básicas sobre la búsqueda y FAQ (Frequently Asked Questions) entrega la mayor cantidad de información sobre la mayoría de los grandes buscadores.
Características: Opciones de búsqueda: Todas las palabras, algunas palabras, la frase exacta, la persona" (Ej. una búsqueda por "Bill Gates" buscará por "Bill Gates" and "Gates, Bill"), "enlace a su URL", and "la frase booleana".
Otras opciones permiten restringir la búsqueda por fecha, por dominio Internet (ej. .edu or www.okanagan.bc.ca), o por tipo de medio (ej. Java, Audio, Image, VRML).
El Ranking de relevancia está basado en una combinación de frecuencia de aparición del término y ubicación dentro del documento.
Resultados: Ofrece 3 opciones:
Descripción completa: incluye el título del documento, las primeras líneas del texto, URL, tamaño en (bytes) y fecha.
Descripción breve: título y las primeras 10 palabras.
Solamente URL.
Otros: Tiene opciones de búsqueda por newsgroups, negocios, personas, direcciones electrónicas.
4. Excite
URL: http://www.excite.com
Tamaño: Más de 50 millones de páginas
Indexación: 12 a 15 días
Interface: Ofrece 2 interfaces:
Simple: consiste en una búsqueda simple sin tener opción de modificar o acotar la búsqueda, sin embargo los operadores booleanos básicos pueden ser usados (+, -).
Power search: presenta una serie de formularios o ventanas de búsqueda, que permiten ingresar la palabra o frase a buscar y la posibilidad de acotar que palabras o frases que el documento DEBE incluir, PUEDE incluir y NO DEBE incluir.
Ayuda: Es detallada, clara y bien organizada.
Características: Operadores booleanos AND, OR y NOT, + y – para incluir o excluir palabras. Power Search permite buscar por frases. Después que los resultados son desplegados "More Like This" permite enlazar a documentos que son similares. Usa un ranking de relevancia con los resultados de búsqueda pero no indica cuales son los criterios para determinar esa relevancia.
Resultados: Para cada documento despliega: Título, URL, un breve resumen y nivel de relevancia (como un porcentaje). Por defecto despliega en orden de relevancia pero se puede elegir desplegar las 40 más relevantes. Esa es sumamente útil cuando se recupera una gran cantidad de resultados.
5. Infoseek
URL: http://www.infoseek.com
Tamaño: 45 millones de páginas
Indexación: Varía. A veces instantáneo, otras 1 o más días.
Interface: Sólo interface simple, pudiendo buscar por: ciertos tipos de documentos Internet , ej. Usenet News; nuevos servicios en línea, e información de empresas.
Ayuda: Detallada y clara.
Características: Operador booleano OR está por defecto. Permite también AND y NOT ( + - ). Búsqueda por frases. Búsqueda a ciertas partes del documento: títulos, enlaces, URLs.
Ranking de relevancia está basado en la ubicación del término dentro del documento, el número de ocurrencias dentro del documento y la frecuencia con que esta palabra aparece en la base de datos de Infoseek.
Resultados: Están desplegados en orden decreciente de relevancia. Incluye: título, URL, fecha, tamaño (en bytes), y las 3 primeras líneas del texto. Hay una opción de ver sólo la URL y el tamaño.
Después que los resultados han sido desplegados hay una opción de agregar términos adicionales de búsqueda y operadores.
Infoseek es el único de los buscadores que ofrece buscar dentro de una lista de resultados. AltaVista tiene una opción similar, sólo que obliga a elegir de una lista de palabras que sugiere no permitiendo elegir los términos de búsqueda.
Otros: Infoseek incluye una guía jerárquica temática, búsqueda por Usenet News articles, mapas de calles, y un directorio de páginas amarillas de Estados Unidos.
1.5. BUSCADORES REGIONALES
Permiten hacer búsquedas más acotadas por país o idioma. Los principales buscadores regionales son:
|
América Latina
|
||
|
AltaVista Magallanes |
http://www.altavista.magallanes.net/ |
Con interface en español |
|
Orientation Latin America |
http://la.orientation.com/ | |
|
Infoseek en Español |
http://www.infoseek.com/Home?pg=Home.html&sv=ES | |
|
StarMedia |
http://www.starmedia.com/ |
Muy popular en América Latina. Su BuscaWeb, es la marca de una versión del buscador Excite. |
|
Yahoo en Español
|
http://espanol.yahoo.com/ |
Registra sitios de 20 países hispanohablantes, incluyendo además información de noticias, negocios, deportes y entretención. |
|
Argentina Gaucho |
http://www.gauchonet.com.ar/ |
|
|
Grippo |
http://www.grippo.com/ |
|
|
Bolivia Bolivian |
http://www.bolivian.com/ |
|
|
Brasil Infoseek Brasil |
|
|
|
Radar |
http://www.radaruol.com.br/index.html |
|
|
Cade |
http://www.cade.com.br/ |
|
|
Chile ChilNet |
http://www.chilnet.cl/ |
|
|
La Brújula? |
http://www.brujula.cl/ |
|
|
C hile Online |
http://www.chile-online.com/ |
|
|
Colombia Colombia |
|
|
|
Costa Rica Orientation Costa Rica |
|
|
|
Info Costa Rica |
http://www.info.co.cr/ |
|
|
Cuba Cubaweb |
http://www.cubaweb.cu//index.shtml |
|
|
Escriba Búsqueda |
|
|
|
Bienvenido |
http://www2.ceniai.inf.cu// |
|
|
Ecuador Elexpreso |
http://www.elexpreso.com/ |
|
|
El Salvador InterSal |
http://www.elsalvador-sv.com/search/ |
|
|
Jamaica NetSearch |
http://www.netsearchjamaica.com/ |
|
|
México Mexico Web Guide |
http://mexico.web.com.mx/ |
|
|
SBEL |
http://www.sbel.com.mx/cgi-bin/sbel3.sh/cgis/indexred.p |
|
|
Mexmaster |
http://www.mexmaster.com/ |
|
|
Mexico Online |
http://www.mexonline.com/websites.htm |
|
|
Buscador |
http://www.buscador.com.mx/ |
|
|
Perú Nazcanet |
http://www.nazcanet.com/ |
|
América del Norte |
|||||
|
Canadá |
|||||
|
AltaVista Canada |
|
Indice contiene 14 millones de páginas web canadienses. |
|||
|
Canada.com |
|
||||
|
Yahoo Canada |
|
||||
|
Europa |
|||||
|
EuroFerret |
http://www.euroferret.com/ |
Indiza más de 30 millones de páginas de Europa, y su interface está disponible en 6 idiomas. |
|||
|
EuroSeek |
http://euroseek.net/ | ||||
|
Orientation Eastern Europe |
http://eeu.orientation.com/ |
Directorio de webs relacionados con Europa oriental. |
|||
|
Meta News |
http://www.lamine.fr/metanews/ | ||||
|
Spacesearch |
http://www.ee.surrey.ac.uk/Personal/L.Wood/spacesearch/ | ||||
|
Belgica |
|||||
|
Belgacom AltaVista |
http://www.belcast.be/fr/altavista/
(Fancés) http://www.belcast.be/nl/altavista/ (Holandés) http://www.belcast.be/en/altavista/ (Inglés) |
Indice de páginas web belgas compiladas usando Altavista.
|
|||
|
Ilse Belgium |
http://www.ilse.be/ |
Directorio y buscador |
|||
|
Lycos Belgique / |
http://www.be.lycos.de/ | ||||
|
Webbel |
http://www.webbel.be/ | ||||
|
WebWatch |
http://www.webwatch.be/ | ||||
|
Francia |
|||||
|
Ecila |
http://www.ecila.fr | ||||
|
Excite France |
http://fr.excite.com | ||||
|
Infoseek France |
http://www.infoseek.com/Home?pg=Home.html&sv=FR | ||||
|
Lycos France |
http://www.lycos.fr | ||||
|
Nomade |
http://www.nomade.fr/ | ||||
|
Yahoo France |
http://www.yahoo.fr | ||||
|
Alemania |
|||||
|
Apollo7 |
http://www.apollo7.de/ |
Metabuscador que cubre todos los servicios de búsqueda alemanes. |
|||
|
Excite Germany |
http://www.excite.de | ||||
|
Fireball |
http://www.fireball.de/ |
El más grande. Tiene más 3 millones de páginas. |
|||
|
Infoseek Deutschland |
http://www.infoseek.com/Home?pg=Home.html&sv=DE | ||||
|
Lycos Germany |
http://www.lycos.de | ||||
|
MetaGer |
http://meta.rrzn.uni-hannover.de/ |
Metabuscador de buscadores alemanes. |
|||
|
Suchen.com |
http://www.suchen.com/ |
Metabuscador. |
|||
|
Web.DE |
http://web.de/ |
Gran directorio de sitios web. Que cuenta con un buscador |
|||
|
Yahoo Germany |
http://www.yahoo.de | ||||
|
Deutsche Suchmaschinen |
http://kresch.com/search/searchde.htm | ||||
|
Klug Suchen |
http://www.klug-suchen.de/ |
Guía de buscadores y directorios alemanes. |
|||
|
Holanda |
|||||
|
Dutch Search Engines |
http://www.nic.surfnet.nl/infoserv/wegwijzers/zoektools.html | ||||
|
Excite Netherlands |
http://nl.excite.com/ | ||||
|
Infoseek Nederland |
http://www.infoseek.com/Home?pg=Home.html&sv=NL | ||||
|
Ilse |
http://www.ilse.nl/ | ||||
|
Lycos Netherlands |
http://www.lycos.nl/ | ||||
|
Track |
http://www.track.nl/ | ||||
|
Vindex |
http://www.vindex.nl/ | ||||
|
Italia |
|||||
|
Arianna |
http://www.arianna.it/ |
Uno de los más grandes directorios italianos. |
|||
|
Il Ragno Italiano |
http://ragno.ats.it/ |
Su base de datos de 500,000 sitios web se actualiza cada mes. |
|||
|
Infoseek Italia |
http://www.infoseek.com/Home?pg=Home.html&sv=IT | ||||
|
Lycos Italia |
http://www.lycos.it/ | ||||
|
Virgilio |
http://www.virgilio.it/ | ||||
|
Yahoo Italy |
http://www.yahoo.it/ | ||||
|
Grecia |
|||||
|
The Greek Explorer And Indexer |
http://www.hiway.gr/ | ||||
|
Webindex Internet Search - Greece |
http://www.webindex.gr/ | ||||
|
España |
|||||
|
BIWE |
http://www.biwe.es | ||||
|
Lycos Spain |
http://www.es.lycos.de/ | ||||
|
Suiza |
|||||
|
Lycos Switzerland |
http://www.lycosch.ch/ | ||||
|
Swiss Search |
http://search.ch/ | ||||
|
The Blue Window Search |
http://sear.ch/ |
Interface disponible en alemán, francés, inglés e italiano. |
|||
|
Reino Unido e Irlanda |
|||||
|
Excite UK |
http://www.excite.co.uk/ | ||||
|
GOD (Global Online Directory) |
http://www.god.co.uk/ |
Directorio sobre el Reino Unido, que también cubre el resto del mundo. |
|||
|
Lycos UK |
http://www.lycos.co.uk/ | ||||
|
SearchUK |
http://www.searchuk.com/ |
Tiene más de 2 millones de páginas. |
|||
|
UKMax |
http://www.ukmax.com/ | ||||
|
UK Plus |
http://www.ukplus.co.uk/ |
Revisa los principales sitios del Reino Unido, preparados por un equipo de periodistas. |
|||
|
Yahoo UK & Ireland |
http://www.yahoo.co.uk | ||||
|
Rusia |
|||||
|
Russian Search Engines |
http://www.zhurnal.ru/search/engines.shtml | ||||
|
Ex-USSR Search Engines |
http://www.zodchiy.ru/links/search/ |
Información acerca de buscadores, directorios y enlace a páginas de los países de la URSS, excepto Tajikistan y Turkmenistan. |
|||
|
Asia
|
|||||
|
AltaVista Asia |
|
Interface en inglés |
|||
|
AltaVista One World Index |
http://www.altavista.digital.com/av/oneweb/ | ||||
|
Orientation Asia |
|
||||
|
Yahoo in Asia |
|
||||
|
Sinanet.com (powered by Excite) |
http://www.sinanet.com/ |
Indiza más de 1 millón páginas chinas. Interface en chino. |
|||
|
Richina Search Engine - China |
http://www.richsurf.com/ | ||||
|
Yahoo Chinese |
http://chinese.yahoo.com http://gbchinese.yahoo.com (simplificado) | ||||
|
Japón |
|||||
|
Japanese Search Engines |
http://www.atrium.com/search.html | ||||
|
Excite Japan |
http://jp.excite.com | ||||
|
Infoseek Japan |
http://japan.infoseek.com/ | ||||
|
Lycos Japan |
http://www.lycos.co.jp | ||||
|
Yahoo Japan |
http://www.yahoo.co.jp/ | ||||
|
Korea |
|||||
|
Lycos Korea |
http://www-kr.lycos.com/ | ||||
|
Yahoo Korea |
http://www.yahoo.co.kr/ | ||||
1.6 BUSCADORES ESPECIALIZADOS
Los metabuscadores realizan, en una sola interface, búsquedas simultáneas a los buscadores y sus bases de datos de páginas web. Aunque no ofrecen el mismo nivel de control sobre las interfaces de búsqueda, ya que cada buscador tiene su propia lógica de búsqueda, son bastante rápidos.
Los metabuscadores no poseen ninguna base de datos de páginas web. Actúan como agentes intermediarios inteligentes que traspasan la búsqueda y entregan un solo resultado obtenido a través de diferentes motores de búsqueda.
Recientemente las capacidades de los metabuscadores han aumentado y pueden extraer resultados por sitio, por tipo de recurso, o por dominio, la opción de seleccionar los buscadores a incluir en una búsqueda y la posibilidad de modificar los resultados. Esa ha permitido aumentar la eficiencia y utilidad de los metabuscadores.
|
Metabuscadores |
Control de búsqueda |
Resultados |
|||
|
Debriefing www.debriefing.com |
|||||
|
** ***Versión en inglés: AltaVista, Excite, HotBot, Infoseek, Lycos, WebCrawler, y Yahoo! |
** ***Búsqueda básica por keyword o búsqueda avanzada, que ofrece opciones de especificar tiempo de espera para obtener resultados (time out), limitar el número de resultados desplegados y buscar por dominios específicos. |
** ***Respuestas exactas . Alinea todas las respuestas por importancia y dice qué motor las extrajo. Elimina duplicados. Ofrece palabras claves relacionadas para refinar la búsqueda. |
|||
|
Dogpile www.dogpile.com |
|||||
|
**** *AltaVista, Excite, Excite Guide, GoTo.com, Infoseek, Lycos, Lycos’s A2Z, Magellan, PlanetSearch, Thunderstone, What-U-Seek, WebCrawler, Yahoo! |
*** **Se puede escoger 2 áreas para buscar juntas (como sitios Web y FTP) y definir el tiempo para esperar los resultados. Pregunta a los 25 motores utilizados. Una búsqueda avanzada le deja escoger los motores que usted desea emplear. |
* ****Los resultados de búsqueda no están integrados. Los agrupa por buscador, por dominio o palabra clave. |
|||
|
Highway 61 www.highway61.com |
|||||
|
** ***Excite, Infoseek, Lycos, WebCrawler, Yahoo!, y categorías Yahoo! |
** ***Incluye operaciones booleanas, definir el tiempo para esperar los resultados (time out) y escoger el volumen de resultados a desplegar. No tiene búsqueda por frase. |
*** **Resultados alineados e integrados, con información del nombre del buscador. |
|||
|
Metabuscadores |
Control de búsqueda |
Resultados |
|||
|
Mamma www.mamma.com |
|||||
|
**** *AltaVista, Excite, HotBot, Infoseek, InfoSpace’s Ultimate Directory, Lycos, WebCrawler, y Yahoo! |
*** **Permite seleccionar un área dada (tal como Web o sonidos) por cualquiera o todas las palabras claves, o por todas las palabras claves como frase. Deja escoger los motores que usted desea emplear (Power search). |
** ***La calidad de los resultados es media, a veces correcta y otras con exceso de sitios.
No suprime sitios duplicados.
|
|||
|
MetaCrawler www.metacrawler.com Recomendado |
|||||
|
*** **AltaVista, Excite, Infoseek, InfoSpace’s Ultimate Directory, Lycos, Thunderstone, WebCrawler, y Yahoo! |
**** *Páginas similares a Mamma, pero se pueden personalizar y guardar las preferencias para futuras búsquedas. |
**** *Buenos resultados. Integra los resultados. Verifica enlaces desactivados. |
|||
|
ProFusion www.profusion.com |
|||||
|
*** **AltaVista, Excite, GoTo.com, Infoseek, Lycos, Magellan, Snap, WebCrawler, y Yahoo! |
***** Búsqueda booleana, por frase, o keyword. Se puede escoger el motor de búsqueda. |
*** **Entrega resultados integrados pero no aparece la fuente de los aciertos. |
|||
|
SavvySearch www.savvysearch.com |
|||||
|
**** *AltaVista, Excite, HotBot, Infoseek, Lycos, Open Text, WebCrawler. Busca también en directorios, índices, personas, y otros. |
*** **Se puede elegir la búsqueda por áreas: directorios (13), buscadores (12). Busca por keywords, frases y determina los números de aciertos de cada buscador. |
*** **Buena calidad en la entrega de resultados. Estos pueden ser integrados o agrupados por buscador.
|
|||
Fuente: PC Magazine, diciembre 1, 1998.
Según la revista PC magazine,
MetaCrawler es el mejor para hacer búsquedas múltiples en más de un buscador. No intenta encontrar cada sitio que existe, pero resulta ser el mejor en buscar en varios buscadores a la vez, ya que obtiene buenos resultados de búsqueda. Se puede personalizar la página de búsqueda y entrega los resultados bien organizados y sin duplicados.Limitaciones: Cuando el procesamiento de una búsqueda toma mucho tiempo, tienen la limitación de no poder recuperar toda la información, ya que están sujetos al time-out. En esos casos pueden recuperar entre los 10 a 50 primeros hits de cada buscador.
El total de hits recuperados es considerablemente menor que si la búsqueda se hiciera en un solo buscador.
Ninguno de ellos busca en Northern Light y pocos buscan las bases de datos de Inktomi, tales como Hotbot.
3. DIRECTORIOS O BUSCADORES TEMÁTICOS
Son una guía jerárquica de directorios que va de los temas más generales a los más particulares y permite buscar sitios webs por tema . Listan lugares (URLs) y los clasifican en categorías temáticas.
Objetivo:
Encontrar los documentos que pertenezcan al área temática seleccionada.
¿ Cómo son ?
Están compuestos por dos partes :
¿ Cómo funcionan ?
Al conectar con algún buscador nos encontramos con una página que contiene una estructura jerárquica de temas, es decir, hay un grupo de temas generales, al seleccionar uno de ellos se despliega otro grupo de temas dependiente (cada vez mas específico) del que nos llevó allí, y podemos seguir así hasta que localicemos el tema de nuestro interés o se acaben las categorías creadas por el autor del buscador.
Existen dos tipos de directorios:
Estas colecciones se crean para mejorar el proceso de investigación y ayudar a los usuarios a encontrar sitios de interés de alta calidad. Se aplica un proceso de selección cuidadoso, y los enlaces a los sitios web incluyen por lo general información descriptiva.
Estos sitios son generalmente de acceso libre y no incluyen publicidad. Un ejemplo de directorio académico es Infomine (http://infomine.ucr.edu/), de la Universidad de California.
Algunos directorios están incorporados a los buscadores: AltaVista ofrece el directorio LookSmart; Infoseek comparte la pantalla con el directorio Go Network; Excite tiene su propio directorio; y Lycos ofrece el de Netscape Open Directory.
Consideraciones:
3.1 Características de los principales directorios
| Directorios |
Tipo |
Editores |
Categorías |
Enlaces |
Enlaces /día |
Fecha de obtención del dato |
|
Yahoo |
Directorio |
80 |
? |
1.200.000 |
750 |
4/99 |
|
LookSmart |
Directorio |
160 |
24.000 |
800.000 |
8.000 |
4/99 |
|
Infoseek |
Buscador |
? |
50.000 |
500.000 |
? |
12/98 |
| Open Directory |
Directorio |
10.200 |
70.000 |
500.000 |
2.000 |
5/99 |
|
Snap |
Directorio |
60 |
50.000 |
400.000 |
? |
5/99 |
|
eBLAST |
Directorio |
? |
? |
125.000 |
? |
7/98 |
|
Librarian’s Index to the Internet |
Directorio |
70 (bcarios.) |
919 |
5.000 |
5/99 |
|
|
AskJeeves |
AS |
30 |
n/a |
7 millones respuestas |
? |
11/98 |
|
AltaVista |
Buscador |
Véase LookSmart |
||||
|
Excite |
Buscador |
Unknown for all categories. Excite's directory also powers WebCrawler and portions of Netscape's channels. |
||||
|
HotBot |
Buscador |
Véase Open Directory |
||||
|
Lycos |
Directorio |
Véase Open Directory |
||||
|
MSN Search |
Buscador |
Véase LookSmart |
||||
|
Netscape |
Buscador |
Véase Open Directory |
||||
|
|
||||||
|
Fuente: http://searchenginewatch.com/
|
||||||
Yahoo!
(http://www.yahoo.com/)Estructura: en directorios de una forma ejemplar y con dos opciones de búsqueda:
Use la segunda opción si tiene definido lo que busca.
En los resultados de la cualquier búsqueda, Yahoo! da tres diferentes tipos de información:
De esta manera puede ir directamente a los sitios encontrados, o ver alguna la categorías Yahoo! relativas a su búsqueda.
En las categorías podemos encontrar estos símbolos que significan:
Enclyclopedia Britannica's Internet Guide (
http://www.eblast.com)
Infomine: Scholarly Internet Resource Collections (
http://lib-www.ucr.edu/)
Argus Clearinghouse (
http://www.clearinghouse.net)
WWW Virtual Library Group http://www.vlib.standford.edu/overview.html
4. ESTRATEGIA DE BUSQUEDA
Para obtener un mejor resultado de búsqueda es importante tomar un tiempo para determinar el tipo de palabra clave que utilizaremos y seleccionar la mejor alternativa de búsqueda. Es conveniente considerar los siguientes etapas.
Definir en una dos palabras lo que se quiere buscar, por ejemplo:
Quiero buscar información acerca de estadísticas de bibliotecas y construcción de indicadores
Quiero buscar información acerca de informes sobre estadísticas de bibliotecas y construcción de indicadores
Informe memoria report
estadísticas estadístico statistic statistics statistical
bibliotecas biblioteca library libraries
indicadores
estandares standard standards
Combinar sinónimos con operador booleano OR.
(informe or memoria or report)
(estadísticas or estadístico or statistic or statistics or statistical)
(bibliotecas or biblioteca or library or libraries)
(indicadores or estandar estandares or standard or standards)
Use la truncación con asterisco (*) para combinar las palabras.
(informe or memoria or report)
(estadístic* or statistic*)
(biblioteca* or librar*)
(indicadores or estandar* or standard*)
Combine las palabras claves con AND.
(informe or memoria or report) and
(estadístic* or statistic*) and
(biblioteca* or librar*) and
(indicadores or estandar* or standard*)
5. REFERENCIAS
http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/FindInfo.html http://searchenginewatch.internet.com/webmasters/features.html http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/FindInfo.html http://www.rice.edu/Fondren/Netguides/reviews.html http://www.albany.edu/library/internet/choose.htmlhttp://home.sprintmail.com/
http://www.indiana.edu/~librcsd/search/ http://www.sci.ouc.bc.ca/libr/connect96/search.htm#exercises http://home.earthlink.net/~fpearce/engines.html
Lógica de búsqueda
Opciones de Búsqueda
|
Si quiere... |
Elija... |
Dirección... |
|
Sensibilidad a mayúscula / minúscula |
AltaVista Infoseek | www.altavista.com www.infoseek.go.com |
|
Truncación |
AltaVista
Lycos
Northern Light Northern Light Power Search |
www.altavista.com
www.lycos.com
w ww.nlsearch.com |
|
Truncación Automática |
Excite HotBot HotBot SuperSearch Infoseek Lycos Northern Light Northern Light Power Search |
www.excite.com
www.hotbot.com
www.infoseek.go.com www.lycos.com w ww.nlsearch.com |
|
Traducción de páginas recuperadas, o cualquier texto, a distintos idiomas. |
AltaVistaBabelfish (text & page translator) |
babelfish.altavista.digital.com
|
|
Una frase exacta dentro de formulario |
Excite (Power Search) HotBot HotBot SuperSearch Infoseek Advanced Search MetaBug Yahoo! Search Options |
www.excite.com
www.hotbot.com
www.infoseek.go.com www.metabug.com search.yahoo.com/search/options
|
Resultados de búqueda
|
Si quiere |
Elija... |
Dirección... |
|
Resultados agrupados por tema o tipo de sitio |
Inference Find Northern Light |
www.infind.com
w ww.nlsearch.com |
|
Respuestas sobre ubicación de información (almanaque) |
Ask Jeeves |
www.askjeeves.com
|
|
Resultados basados en la popularidad, ej., selecciones de otras personas |
Direct Hit |
www.directhit.com
|
|
Resultados basados en N° de links desde páginas web más consultadas. |
Google! | www.google.com |
|
Búsqueda dentro de los resultados desplegados |
AltaVista Refine Excite HotBot HotBot SuperSearch Infoseek Infoseek Advanced Search Lycos |
www.altavista.com
www.excite.com
www.hotbot.com
www.infoseek.go.com
www.lycos.com |
|
Búsqueda por téminos alternativos |
AltaVista Refine Excite | www.altavista.com www.excite.com |
|
Consultas registradas en el sitio y notificación de actualizaciones (email) |
The Informant Planet Search Search Alert Profusion's ProFilter TracerLock |
informant.dartmouth.edu/index.cgi www.planetsearch.com www.profusion.comwww.peacefire.org/tracerlock |
Características de la base de datos
|
Si quiere buscar... |
Elija... |
Dirección |
|
Una gran base de datos, con más de 110 millones de páginas |
AltaVista
Northern
Light
HotBot
|
www.altavista.com
w ww.nlsearch.com www.hotbot.com |
|
Multiples buscadores en forma simultánea, con eliminación de registros duplicados |
Cyber 411 Inference Find Mama MetaCrawler MetaFind ProFusion Savvy Search | www.cyber411.com www.infind.com www.mamma.com www.go2net.com/search.html www.metafind.com www.profusion.com www.savvysearch.com |
|
Un pequeño pero bien evaluado directorio de temas |
Argus Clearinghouse BUBL Link eBLAST INFOMINE Librarians' Index to the Internet Lycos Top 5% Scout Report Signpost WWW Virtual Library |
www.clearinghouse.net
bubl.ac.uk/link www.britannica.cominfomine.ucr.edu www.lii.org/InternetIndexpoint.lycos.com/categories www.signpost.org/signpostvlib.stanford.edu/overview.html |
|
Un gran directorio, pero sin evaluar |
Yahoo! |
www.yahoo.com
|
Fuente:
http://www.albany.edu/library/internet/choose.html (actualizado abril 1999) Click aqui para volver a inicio del documento