I. INTRODUCCIÓN
line

Los motores de búsqueda son la herramienta que permite al usuario encontrar, de una manera sencilla, cualquier tipo de información publicada en Internet. La información es clasificada de acuerdo a su relevancia o importancia. Los motores de búsqueda basados en crawlers toman una serie de criterios o parámetros incluidos en las páginas HTML para decidir que clasificación deben darle a las páginas que indexan en Internet. La clasificación es muy importante, ya que representa un mayor acercamiento con los clientes, lo cual genera un sitio más accesible y exitoso.

1.1 OBJETIVO

Comprobar si la utilización de ciertos criterios, a la hora de diseñar las páginas HTML de un sitio, realmente influyen en la clasificación y relevancia que les otorgan los motores de búsqueda basados en crawler, para con esto generar sitios más accesibles al usuario.

1.1.1 CRITERIOS
Cuando se crea un sitio es muy importante que este aparezca en los primeros 10 ó 20 resultados de los motores de búsqueda más populares. Existen criterios que al utilizarse en el diseño de las páginas del sitio, en especial en la página principal, mejoran la clasificación que les otorgan los motores de búsqueda basados en crawlers, los criterios son:

  1. Definir cuales serán las palabras claves con las que se quiere identificar al sitio, éstas palabras son los términos que el usuario utiliza para realizar la búsqueda.
  2. Las palabras claves deberán aparecer en el título de la página (este es el título que puede visualizarse en la parte superior derecha del navegador de Internet) y en su contenido.
  3. También deberán aparecer en la URL (Uniform Resource Locator) o en el nombre del dominio.
  4. Se deben incluir meta datos, que ayuden a los crawlers (programas que se encargan de indexar las páginas de Internet) a identificar la información relevante de las páginas del sitio, los meta índices principales son: las palabras claves con las que se identifica a la página, el contenido de la página, el nombre y la dirección de correo electrónico del autor y el nombre del software con el que se generaron las páginas.
  5. Las primeras líneas de la página son más relevantes, por lo cual, si las palabras claves aparecen ahí se obtendrá un estímulo en la clasificación.
  6. En algunos motores es muy importante el número de enlaces a la página desde otros sitios.
  7. La inclusión de un robots.txt (archivo de texto que indica a los crawlers que páginas no se desean indexar en un sitio) en el directorio raíz del sitio ayudará a restringir la información que no debe ser explorada e indexada por los crawlers.
  8. Finalmente se debe registrar el sitio en los motores de búsqueda más populares.
  9. Una vez que se adquiere una buena clasificación, algunos motores de búsqueda consideran los clics de los usuarios sobre los resultados, para determinar la calidad de la página y aumentar o disminuir el nivel alcanzado.

La implementación del proyecto está dividida en dos partes:


1.2 JUSTIFICACIÓN

Actualmente los negocios tienden a emigrar total o parcialmente al Internet (herramienta pública que permite compartir información y ofrecer productos y servicios en todo el mundo), esto se debe en parte al nivel de audiencia que dicha herramienta ha alcanzado. Las empresas siguen compitiendo por estar en la preferencia del cliente, en este sentido, no solo deben cuidar que el sitio sea funcional y atractivo, con un buen diseño y contenido, también deben preocuparse por llegar a la audiencia antes que su competencia.

En el mundo de Internet el cliente o usuario tiene una gama de posibilidades de elección, para la adquisición de productos o servicios, mucho más amplia que la que puede encontrar físicamente establecida. Los motores de búsqueda son herramientas especialmente diseñadas para ayudar al usuario a encontrar rápidamente lo que necesita, ya sea información, productos o servicios. Debido a esto, para garantizar el éxito de un negocio electrónico, éste debe aparecer entre las primeras posibilidades de elección, es decir, encabezar los listados en los motores de búsqueda más populares. Por lo tanto, como parte del desarrollo profesional en el área computacional y posible área de trabajo, no es suficiente con realizar un buen diseño y construcción de un sitio, o aplicar buenas medidas de seguridad, se debe ir más lejos y hacer que el sitio sea accesible y exitoso.

El tipo más común de motores de búsqueda es el basado en crawler, por lo cual, es a éste al que se enfoca primordialmente este documento. Entendiendo la forma como operan, y adquiriendo de este modo preferencia en los listados que generan las consultas en las cuales se desea que aparezcan. [SUBIR]


1.3 ALCANCE

El alcance de este proyecto, como se mencionó en el punto anterior, está limitado a los motores de búsqueda basados en crawlers. Sin embargo, el contenido presenta un estudio sobre los tres tipos de motores de búsqueda: los basados en crawlers, los basados en directorios y los meta motores de búsqueda, incluyendo además, un capítulo para los buscadores especializados y para los buscadores de imágenes. En el contenido se presentan temas que ayudan a comprender en que consiste cada uno de ellos, cual es su función y las técnicas que utilizan para realizar su trabajo. [SUBIR]


1.4 ESTRATEGIAS DE INVESTIGACIÓN

1.4.1 GENERAL
Se contempla un estudio sobre los motores de búsqueda a través de la recopilación y estructuración de la información, obtenida principalmente en Internet, así como un muestreo y análisis de resultados de búsquedas de información, finalmente se concluirá con la implementación de un sitio que incluirá los criterios planteados en el objetivo.

1.4.2 PARTICULAR
Los instrumentos a utilizar para la investigación son la revisión de documentos y artículos, la observación y el muestreo de páginas web (abreviación de World Wide Web, significa red mundial).

1.4.3 HERRAMIENTAS
Las herramientas utilizadas en este proyecto son las siguientes:


1.5 RESULTADOS OBTENIDOS

Existen muchos documentos en Internet que hablan sobre la importancia de considerar los criterios planteados en el objetivo de este documento, otros tantos les restan importancia. Lo cierto es que si son considerados por los motores de búsqueda como parte de su algoritmo de clasificación, la ponderación que le dan a cada criterio varia dependiendo del algoritmo que maneja cada uno. Los algoritmos son cada vez más sofisticados, debido a los intentos de los webmasters de colocar cualquier página en una buena clasificación. Ambos, motores y webmasters, están en una competencia que beneficia a los usuarios de Internet, ya que esto lleva a que los documentos mejor clasificados, cada vez sean más significativos al usuario. Aunque solo se contó con una referencia bibliográfica para la investigación, el vasto material que se encuentra en Internet permitió concluir satisfactoriamente la investigación.

El muestreo realizado confirma la relevancia de los criterios y deja ver cuales tienen más peso. Además se pudo observar que algunos motores también consideran las palabras contenidas en la meta descripción como parámetro de clasificación, esto se debe a que ahí se aloja un abstracto del contenido del documento (al menos así debería ser).

Las páginas registradas han presentado buenos resultados en los motores de búsqueda, que hasta el momento, las han indexado. Los motores de búsqueda, sobre todo los más populares, toman un tiempo de entre 4 y 6 semanas para realizar la indexación (en el servicio gratuito). Ofrecen paquetes de inclusión pagada que mejoran, por mucho, ese tiempo.

Puede probar la eficiencia de este sitio consultandolo en los siguientes motores de búsqueda
En google: meta motores de busqueda, crawlers directorios, etc.
En Altavista: "meta motores de busqueda", basados en crawlers, "meta datos" + motores, etc.
En Yahoo y websearch.com: meta motores, crawlers directorios, etc
Tambien se puede localizar con éxito en aike.com.ar, claymont.com, hispavista.com, yupimsn.com, etc.

[COMENTARIOS] [SUBIR] [INICIO] [SIGUIENTE]
Hosted by www.Geocities.ws

1