internet y bases de datos

LA WEB Y LAS BASES DE DATOS

Vladimir Alejandro Giraldo Duque
Diego Alexander Zuleta

Departamento de Ingenieria de Sistemas
Unviersidad de Antioquia

INTERNET BASES DE DATOS EN INTERNET

INTERNET:

CONTENIDO:

ir al inicio

LAS BASES DE DATOS Y LA INTERNET:

CONTENIDO:

ir al inicio

LA IMPORTANCIA DE INTERNET

El fenómeno Internet ha venido a alterar la forma de vida de millones de personas que hoy en día utilizan la red en diferentes actividades de su vida cotidiana. El correo electrónico es de las aplicaciones más utilizadas y de una gran utilidad para la comunicación entre amigos, investigadores y colegas. Sin embargo la World Wide Web es el servicio al que todo usuario puede acceder, buscar información en bibliotecas virtuales, universidades, centros de investigación o en páginas desarrolladas por personas aficionadas al tema. Existen otros servicios, como el utilizado para la transferencia de archivos, llamado FTP (File Transfer Protocol). Este está dirigido a quienes necesitan enviar grandes volúmenes de información a lugares distantes y que demandan seguridad y confiabilidad. Otro servicio es el de terminal virtual (TELNET) con el cual se pueden realizar tareas desde terminales remotas como si físicamente se estuviera trabajando en el equipo al cual se conecta. Existen otros servicios menos utilizados como Gopher (información de tipo texto) y su servicio de búsqueda llamado Veronica.
Sin duda alguna la aparición de la Web, y la implementación de navegadores o browsers con los cuales se podía desplazar de un sitio a otro a través de forma gráfica (iconos) utilizando como interfaz un ratón, dio el puntapié al fenómeno Internet.

Regresar

INTERNET Y ORGANIZACIONES INVOLUCRADAS

Durante el desarrollo del protocolo TCP/IP se incrementó notablemente el número de redes locales de agencias gubernamentales y de universidades, dando origen así a la red de redes más grande del mundo; las funciones militares que se pensaron en un inicio se separaron y se permitió el acceso a la red a todo aquel que lo requiriera sin importar de que país provenía la solicitud siempre y cuando fuera para fines académicos o de investigación.
Después de que las funciones militares de la red se separaron en una subred de Internet, la tarea de coordinar el desarrollo de la red recayó en varios grupos, uno de ellos la National Science Fundation quien promovió el uso de la red ya que se encargó de conectar cinco centros de supercómputo en todo Estados Unidos que podían ser accedidos desde cualquier nodo de la red. El grupo de mayor autoridad sobre el desarrollo de la red es la Internet Society, creado en 1992 y formado por miembros voluntarios, cuyo propósito principal es promover el intercambio de información global a través de la tecnología Internet. Puede decirse que esta sociedad es como un consejo que tiene la responsabilidad de la administración técnica y dirección de Internet, aunque no es el único.
Existen otros tres grupos que tienen un rol significativo, el Internet Architecture Board (IAB), esta organización toma las decisiones acerca de los estándares de comunicaciones entre las diferentes plataformas para que puedan interactuar máquinas de diferentes fabricantes sin problemas; este grupo es responsable de cómo se deben asignar las direcciones y otros recursos en la red, aunque no son ellos quienes se encargan de hacer estas asignaciones, para eso existe otra organización llamada NIC (Network Information Center), administrado por el departamento de defensa de los Estados Unidos. En 1989 se reorganiza la estructura de la IAB, un grupo subsidiario e importante de la IAB es el Internet Engineering Task Force (IETF) Fuerza de Tarea de Ingeniería, esta se concentra en problemas de ingeniería a corto y mediano plazo y la IRTF Fuerza de Tarea de Investigación Internet, la cual coordina las actividades de investigación relacionadas con los protocolos TCP/IP y con la arquitectura de la red de redes en general.

Regresar

INTERNET Y LOS PROTOCOLOS TCP/IP

La estandarización tecnológica de Internet dio origen a un nuevo conjunto de protocolos llamados TCP/IP (Transmission Control Protocol/Internet Protocol). Un sistema de comunicaciones muy sólido y robusto bajo el cual se integran todas las redes que conforman lo que se conoce actualmente como Internet, el cual no fue diseñado para ignorar o evadir estándares ya existentes. Estos surgen solamente porque ninguno de los protocolos existentes satisfacía la necesidad de un sistema de comunicación interoperable para el enlace de redes. Los protocolos TCP/IP, cuyo nombre proviene de sus dos protocolos principales fue desarrollado en la agencia de proyectos Avanzados de Investigación.
TCP/IP puede utilizarse para comunicarse a través de cualquier grupo de redes interconectadas. Muchas empresa utilizan TCP/IP para interconectar todas las redes dentro de una corporación, aún cuando las empresas no tengan una conexión hacia redes externas. Otros lo utilizan para comunicarse entre sitios geográficamente alejados unos de otros. El diseño de los protocolos TCP/IP proporciona una conexión universal entre máquinas independientes a las redes en particular a las que están conectadas, por este motivo TCP/IP realiza las conexiones de forma transparente al usuario sin importar la ruta que la conexión establezca, de esta forma se oculta al usuario la arquitectura de la red global
TCP/IP es un conjunto o suite de protocolos diseñados con una arquitectura en capas. Las capas permiten a los diseñadores del protocolo dividir en módulos las tareas y servicios que realizará el mismo. El diseño también especifica la manera en que un módulo interactua con los otros. La arquitectura en capas de los protocolos está diseñada como una pila en la que los protocolos de más alto nivel interactuan con los protocolos de niveles más bajos.

El modelo TCP/IP está formado por cuatro capas:

1. La capa de aplicaciones es la capa más alta de la pila, ésta provee servicios de alto nivel a los usuarios como transferencia de archivos, entrega de correo electrónico y acceso a terminales remotas, entre otros. Los programas de aplicación escogen entre diferentes protocolos de transporte dependiendo del tipo de servicio que requieran.
2. La principal tarea de la capa de transporte es proveer comunicación punto a punto entre las aplicaciones. Los protocolos de transporte (TCP y UDP) usan el servicio de entrega de paquetes que provee la capa de Internet .
3. La capa de Internet provee el servicio de entrega de paquetes de una máquina a otra, por medio del protocolo de Internet (IP). La integridad de los datos no se verifica en este nivel, por lo que el mecanismo de verificación es implementado en capas superiores (Transporte o Aplicación).
4. La capa de acceso al medio acepta datagramas de la capa de Internet y los envía físicamente. El modulo para el acceso al medio es con frecuencia un controlador de dispositivo (device driver) para una pieza particular de hardware, y la capa de acceso al medio puede consistir de múltiples módulos.

Para que la información fluya a través de las capas, esta pasa por un proceso de encapsulamiento. Los mensajes e información recibida por la capa de TCP es encapsulada con un encabezado de TCP en un paquete llamado "Segmento de TCP", este es entregado a la capa de IP, en el que se le agrega un encabezado de IP y se crea el paquete llamado "Datagrama de IP". El paso final incluye el encapsulamiento del datagrama de IP en paquetes creados para la capa de acceso al medio.

Regresar

EL MODELO CLIENTE SERVIDOR

Cuando se utiliza un servicio de Internet, se establece un proceso, en el cual entran en juego dos partes. Por un lado, el usuario ejecuta una aplicación en la computadora local, que es el denominado programa cliente, este programa se pone en contacto con el host remoto para solicitar la información deseada. El host remoto a su vez, responderá al pedido realizado por el programa cliente, a través de otro programa de aplicación, el programa servidor.
Los términos cliente y servidor se usan tanto para referirse a los programas que cumplen estas funciones, como a las computadoras donde son ejecutados dichos programas.
El programa cliente cumple dos funciones distintas, por un lado gestiona la comunicación con el servidor, solicita un servicio y recibe los datos enviados por servidor; por otro maneja la interfaz con el usuario, presenta los datos en el formato adecuado y brinda las herramientas y comandos para que el usuario pueda utilizar las prestaciones del servidor de forma sencilla.
El programa servidor, en cambio, acepta atenciones recibidas a través de la red, realiza el servicio y regresa el resultado al cliente, de esta forma un mismo servidor puede atender a varios clientes al mismo tiempo, sin embargo el servidor procesa una petición a la vez, después de aceptar una petición, el servidor forma una respuesta y la manda antes de volver a ver si ha llegado otra petición, se asume que el sistema operativo hace una cola de peticiones que llegan al servidor mientras este esta ocupado, los servidores tienen dos partes importantes, un programa maestro sencillo, el cual es responsable de aceptar nuevas peticiones, y un conjunto de esclavos, los cuales son responsables de manejar las peticiones individuales, como el maestro ejecuta un esclavo para cada nueva petición el procesamiento procede de manera concurrente, de este modo las peticiones que requieren de poco tiempo para completarse pueden terminar antes que las peticiones que llevan más tiempo, independientemente del orden en que hayan comenzado.
Sin embargo esto que parece sencillo es aún más complejo, ya que necesita acomodar varias peticiones concurrentes, con esto los servidores deben de reforzar las reglas de autorización y protección, los programas servidor suelen requerir una ejecución de alta prioridad, pues tienen que leer archivos, mantenerse en línea y tener acceso a los datos, cada servidor toma la responsabilidad para reforzar el acceso al sistema y las políticas de protección.
En las aplicaciones cliente-servidor es importante minimizar las interacciones entre un cliente y la información, es por eso que las máquinas se valen del protocolo ARP de TCP/IP para mantener una memoria intermedia (caché) de respuestas para mejorar la eficiencia de las búsquedas redundantes que surjan después. El proceso de memoria intermedia (caching) mejora el desempeño del modelo, un ejemplo real de esta aplicación se da en el caché del browser utilizado para navegar, en donde se alojan todos los gráficos y de más archivos de las páginas que han sido visitadas, de forma que si en una sesión se vuelve a visitar el sitio no es necesario que el servidor vuelva a enviar esa información pues esta se tiene en el caché y puede ser recuperada de forma inmediata, el browser es un programa cliente.

Regresar

SERVICIOS DE INTERNET

Regresar

EL SERVICIO DE HTTP Y LA WORLD WIDE WEB

La idea de la World Wide Web nació en Marzo de 1989, cuando Tim Berners-Lee del Laboratorio Europeo de Física de Partículas (conocido como CERN, un centro de investigadores de física europeos de alta energía) propuso el proyecto para ser usado como medio para difundir investigaciones e ideas a lo largo de la organización y a través de la red.
Para fines de 1990, la primera versión de la WWW se presentó sobre una máquina NeXT . Tuvo la capacidad de inspeccionar y transmitir documentos de hipertexto. El hipertexto se refiere al texto que contiene vínculos (Hyperlink) a otros documentos. Dichos documentos pueden estar en la misma computadora o en cualquier otra que se encuentre conectada a la red, sin importar su situación geográfica.
Un vinculo (Hyperlink) se puede definir como "Get the address asociated with this link and go there", Obtiene la dirección asociada a este vinculo y ve a ella. La World Wide Web se define oficialmente como una "iniciativa global de recuperación de información hipermedia con acceso universal al inmenso conjunto de documentos en Internet". Lo que el proyecto World Wide Web ha hecho, es proveer a los usuarios de las redes de computadoras el acceso a la información a través de un medio uniforme de manera simplificada. Lo anterior significa que, después de varios intentos, en Internet surge un programa de fácil manejo que puede obtener información de cualquier computadora conectada a la red.
Las primeras visiones de los sistemas como la WWW tuvieron como meta el adelanto de la ciencia y la educación, aunque el proyecto World Wide Web tiene la potencialidad para generar un impacto importante en el comercio, la política, y la sociedad.
Hasta hace algunos años el uso de Internet estuvo en manos de los expertos, dada la cantidad de conceptos y comandos que el usuario debía conocer para poder entrar al mundo cibernético. En los últimos años, los expertos comenzaron a desarrollar sistemas que pudieran ser usados por personas con pocos conocimientos y experiencia en sistemas de cómputo. Estos sistemas han incorporado el uso del ratón (mouse) y pantallas gráficas, que reducen al mínimo el uso de comandos. De esta manera nació la World Wide Web: un sistema que permite tener acceso a la información de las máquinas conectadas a Internet.

Otros servicios

CONCEPTOS BÁSICOS DE LA WEB

El protocolo que los servidores y clientes Web usan para comunicarse se llama Protocolo de Transferencia de Hipertexto (HTTP, HyperText Transfer Protocol). Todos los servidores y clientes Web deben ser capaces de entender este protocolo a fin de enviar y recibir documentos hipermedia. Por esto, a los servidores Web se les llama frecuentemente servidores HTTP. El lenguaje estándar que "entiende" la WWW para crear y reconocer documentos de hipertexto es el HTML (Hypertext Markup Language), utilizado para crear páginas de Web.
La World Wide Web utiliza los Localizadores de Uniformes de Recursos (URL, Uniform Resource Locators) para conectarse a otros servicios de la red.
Es posible representar cualquier archivo o servicio en Internet con un URL, de esta manera, las ligas pueden hacerse no solamente a otros textos y medios, sino también a otra red o servicios. El éxito de la World Wide Web es la facilidad que se tiene para navegar sin la necesidad de aprender comandos complicados, únicamente se necesita conocer el manejo de un ambiente gráfico de ventanas y del ratón .
Algunos servidores WWW incluyen encriptación y capacidades de autenticación de cliente, esto significa que el servidor es capaz de enviar y recibir los datos seguros, es decir, que sólo la persona que envía los datos y el que los recibe conocen la información transmitida. Lo anterior permite tener un control entre servidores y clientes con el fin de mantener seguros y privados los datos que se transfieran. Por ejemplo, si un banco desea instalar un servidor Web para que sus clientes realicen operaciones financieras, debe asegurar que la transferencia de información sea segura y que únicamente el usuario y el banco la conozcan.

Otros servicios

EL SERVICIO DE FTP

FTP es una aplicación que permite transferir archivos de una computadora a otra. Es una de las más antiguas herramientas de Internet, pero también una de las más utilizadas. Un servidor de FTP permite a los clientes navegar por la estructura de su directorio y transportar archivos en cualquiera de las dos direcciones. No importa el tipo de máquina ni su sistema operativo, la conexión es "transparente".
Existen dos formas distintas de compartir archivos, el acceso en línea y el copiado de archivo completo, el acceso compartido en línea significa que se permite a varios programas acceder de manera concurrente a un solo archivo, los cambios que se realizan al archivo se efectúan inmediatamente y están disponibles para todos los programas que accedan al archivo, el copiado de archivo completo significa que, cada vez que un programa quiera acceder a un archivo, este obtendrá una copia local, el copiado se utiliza para datos de solo lectura.
Un mecanismo de acceso remoto debe manejar nociones de propiedad, autorización y noción de acceso para seguridad de la información. La forma de establecer una conexión con un servidor FTP desde la línea de comandos de una sesión FTP, es especificarla escribiendo open y el dominio correspondiente del servidor a conectarse o la dirección IP correspondiente, al establecerse la conexión el servidor despliega una pantalla para que el usuario pueda identificarse. El uso más importante de FTP se conoce como FTP anónimo, y permite acceder bases de información o de software sin tener una cuenta en la computadora remota.
FTP ofrece muchas facilidades que van más allá de la función de transferencia misma como:

Acceso interactivo: La mayor parte de las aplicaciones ofrecen al cliente una interfaz interactiva, la cual permite interactuar fácilmente con los servidores remotos.
Especificación de formato : El FTP permite al cliente especificar el tipo y formato de los datos almacenados.
Control de autenticación: el FTP requiere que los clientes se identifiquen ante el servidor con un nombre de conexión y una clave de acceso antes de pedir la transferencia de archivos.

FTP puede utilizarse para diversos servicios como bases de datos o librerías de programas, transferencia selectiva de archivos o como un canal de información privado.

Otros servicios

El SERVICIO DE TELNET

El conjunto de protocolos TCP/IP incluye un protocolo de terminal remota sencillo, llamado TELNET, este permite al usuario de una localidad establecer una conexión TCP con un servidor de acceso a otro No importa si la computadora está en el mismo cuarto o al otro lado del mundo. TELNET transfiere después las pulsaciones del teclado del usuario a la computadora remota como si hubiesen sido hechos desde un teclado unido a la computadora remota. TELNET transporta la salida de la computadora remota de regreso a la pantalla del usuario en un servicio transparente y da la impresión de que teclado y monitor están conectados físicamente a la computadora remota. Cada pulso de teclado viaja del teclado del usuario a través del sistema operativo hacia el programa cliente, el programa cliente regresa a través del sistema operativo y a través de la red de redes hacia la máquina servidor. Después de llegar a la computadora destino, los datos deben viajar a través del sistema operativo del servidor al programa de aplicación del servidor en un punto de entrada de pseudoterminal, finalmente el sistema operativo remoto entrega el caracter al programa de aplicación que usuario está corriendo.
El software de cliente TELNET permite que el usuario especifique una computadora remota dando su nombre de dominio o la dirección IP, esto permite que se realicen conexiones remotas aunque el software de nombres de dominio no este depurado.
TELNET ofrece tres servicios básicos, el primero define una terminal virtual de red, que proporciona una interfaz estándar para los sistemas remotos. los programas clientes no tienen que comprender los detalles de todos los sistemas remotos, se construyen para ocuparse con la interfaz estándar, el segundo incluye un mecanismo que permite al cliente y al servidor negociar opciones, asimismo proporciona un mecanismo de opciones estándar (una de las opciones controla si los datos que se transfieren se valen del conjunto de caracteres ASCII estándar de siete bits o de un conjunto de caracteres de ocho bits). Por último TELNET trata con ambos extremos de la conexión de manera simétrica. En particular TELNET no fuerza la entrada de cliente para que esta venga de un teclado ni al cliente para que muestre la salida en su pantalla. De esta manera TELNET permite que cualquier programa se convierta en cliente, además de que cualquier extremo puede negociar las opciones
Cuando un usuario invoca a TELNET, un programa de aplicación en la computadora del usuario se convierte en cliente. el cliente establece una conexión TCP con el servidor por medio de la cual se comunicarán, una vez establecida la conexión el cliente acepta los pulsos de teclado del usuario y los manda al servidor, al tiempo que acepta caracteres de manera concurrente que el servidor regresa y despliega en la pantalla del usuario. El servidor debe aceptar una conexión TCP del cliente y después transmitir los datos entre la conexión TCP y el sistema operativo local. En práctica el servidor es más complejo, pues debe manejar diversas conexiones concurrentes. Normalmente un proceso de servidor maestro espera nuevas conexiones y crea un nuevo esclavo para manejar nuevas conexiones.

Otros servicios

EL SERVICIO DE CORREO ELECTRONICO

E-mail es el servicio de aplicación utilizado más ampliamente, ofrece un método rápido y conveniente de transferencia de información privada, puede adaptarse al envío de pequeñas notas y grandes y voluminosos documentos mediante un mecanismo sencillo, de echo hay más usuarios que envían archivos por correo electrónico que por el protocolo de transferencia de archivos. La entrega de correo difiere de otros usos de redes, los protocolos de red envían paquetes directamente a sus destinos utilizando límites de tiempo y retransmisión para los segmentos individuales si no se devuelve un acuse de recibo. Sin embargo, en el caso del correo electrónico el sistema debe proporcionar los medios cuando la máquina remota o las conexiones de la red han fallado. El emisor no desea esperar a que la máquina remota este disponible para continuar trabajando, ni el usuario quiere que se aborte la transmisión solo por que las comunicaciones con la máquina remota no están disponibles temporalmente.
Para manejar las entregas con retraso, el sistema de coreo utiliza una técnica conocida como spooling. Cuando el usuario envía un mensaje de correo, el sistema coloca una copia en su área de almacenamiento privado spool junto con la identificación del emisor, recipiente, máquina destino y hora de depósito. El sistema indica entonces la transferencia hacia la máquina remota como una actividad subordinada o secundaria, permitiendo al emisor que continúe con otras actividades computacionales.

Otros servicios

EL SERVICIO DE IRC

El servicio de IRC (Internet Relay Chat) es un lugar virtual, donde las personas pueden reunirse y conversar. Para utilizar este servicio lo único que se debe hacer es conectarse a un servidor IRC, entrar a un canal y conversar. Para esto existen diferentes servidores situados alrededor del mundo que son accedidos por personas diariamente con el único fin de conocerce y entablar maravillosas conversaciones. Con el avance de JAVA ahora esos servidores también se encuentran en la red. Por ejemplo, usted puede conocer gente de todas las edades desde www.planetatierra.com y conversar directamente desde un applet JAVA.

Otros servicios

LOCALIZADORES UNIFORMES DE RECURSOS (URL)

El URL contiene los segmentos de información que un navegador necesita para localizar una página Web. Este busca en un URL para encontrar una página principal. La página principal es la página Web primaria (index.html), que sirve como punto de partida.
Existen direcciones que incluyen la tilde (~) la cual indica que es el directorio base del usuario.
El index.html indica al navegador el nombre del archivo a buscar, la extensión .html indica que es un documento de hipertexto. En muchos de los servidores Web, index.html es el nombre del archivo predeterminado a buscar, incluso si el URL no tiene el nombre de la página principal, este automáticamente busca y visualiza el archivo index.html.
En sistemas Unix como en muchos otros, no es necesario que la extensión de las páginas Web sea .html, por el número de caracteres de la extensión, estas pueden ser extensiones .htm
Para que un navegador pueda visualizar una página Web necesita el URL o en su defecto una dirección IP, el URL es la forma de representar direcciones para que un usuario pueda recordar fácilmente una dirección Internet, una dirección Internet es una dirección IP. Ya hemos hablado de la función de los servidores DNS, que prácticamente tienen la función de asociar direcciones URL a direcciones IP.

Sin duda alguna la infraestructura de Internet a dado cabida a nuevos tipos de aplicaciones y servicio a los usuarios desarrollados por empresas, organizaciones y gobiernos. Parte fundamental de estos servicios son la implementación de bases de datos accedidas a través de la World Wide Web. El alcance y el fácil acceso a ellas, así como la reducción de costos y la popularidad que ha cobrado la Web, son los principales atractivos que ofrece una aplicación de esta naturaleza.
Este trabajo pretende dar un panorama amplio sobre el funcionamiento e implementación de bases de datos en Internet, accediendo a sus datos a través de la Web.

Regresar

UTILIZAR BASES DE DATOS EN LA WEB

La Web es un medio para localizar/enviar/recibir información de diversos tipos, aun con las bases de datos. En el ámbito competitivo, es esencial ver las ventajas que esta vía electrónica proporciona para presentar la información, reduciendo costos y el almacenamiento de la información, y aumentando la rapidez de difusión de la misma.
Internet provee de un formato de presentación dinámico para ofrecer campañas y mejorar negocios, además de que permite acceder a cada sitio alrededor del mundo, con lo cual se incrementa el número de personas a las cuales llega la información.
Alrededor de 14 millones de personas alrededor del mundo hacen uso de Internet, lo cual demuestra el enorme potencial que esta red ha alcanzado, con lo cual se puede decir que en un futuro no muy lejano, será el principal medio de comunicación utilizado para distintos fines.
Pero, no sólo es una vía para hacer negocios, sino también una gran fuente de información, siendo éste uno de los principales propósitos con que fue creada.
Una gran porción de dicha información requiere de un manejo especial, y puede ser provista por Bases de datos.
En el pasado, las Bases de datos sólo podían utilizarse al interior de las instituciones o en redes locales, pero actualmente la Web permite acceder a bases de datos desde cualquier parte del mundo. Estas ofrecen, a través de la red, un manejo dinámico y una gran flexibilidad de los datos, como ventajas que no podrían obtenerse a través de otro medio informativo.
Con estos propósitos, los usuarios de Internet o Intranet pueden obtener un medio que puede adecuarse a sus necesidades de información, con un costo, inversión de tiempo, y recursos mínimos. Asimismo, las Bases de datos serán usadas para permitir el acceso y manejo de la variada información que se encuentra a lo largo de la red.