BIENVENIDOS A MI PRMERA PAGINA WED

QUE ES LA BIOINFORMATICA

La bioinform�tica, seg�n una de sus definiciones m�s sencillas, es la aplicaci�n de tecnolog�a de computadores a la gesti�n y an�lisis de datos biol�gicos.1 Los t�rminos bioinform�tica, biolog�a computacional y, en ocasiones, biocomputaci�n, utilizados en muchas situaciones como sin�nimos,2 3 hacen referencia a campos de estudios interdisciplinares muy vinculados que requieren el uso o el desarrollo de diferentes t�cnicas estudiadas universitariamente en la Ingenier�a Inform�tica como ciencia aplicada de la disciplina inform�tica.4 Entre estas pueden destarcarse las siguientes:matem�tica aplicada,5 estad�stica,6 ciencias de la computaci�n,7 inteligencia artificial,8 qu�mica9 y bioqu�mica10 con las que el Ingeniero Inform�tico soluciona problemas al analizar datos, o simular sistemas o mecanismos, todos ellos de �ndole biol�gica, y usualmente (pero no de forma exclusiva) en el nivel molecular.11 El n�cleo principal de estas t�cnicas se encuentra en la utilizaci�n de recursos computacionales para solucionar o investigar problemas sobre escalas de tal magnitud que sobrepasan el discernimiento humano. La investigaci�n en biolog�a computacional se solapa a menudo con la biolog�a de sistemas.12 Los principales esfuerzos de investigaci�n en estos campos incluyen el alineamiento de secuencias, la predicci�n de genes, montaje del genoma, alineamiento estructural de prote�nas, predicci�n de estructura de prote�nas, predicci�n de la expresi�n g�nica, interacciones prote�na-prote�na, y modelado de la evoluci�n.13 Una constante en proyectos de bioinform�tica y biolog�a computacional es el uso de herramientas matem�ticas para extraer informaci�n �til de datos producidos por t�cnicas biol�gicas de alta productividad, como la secuenciaci�n del genoma. En particular, el montaje o ensamblado de secuencias gen�micas de alta calidad desde fragmentos obtenidos tras la secuenciaci�n del ADN a gran escala es un �rea de alto inter�s.13 14 Otros objetivos incluyen el estudio de la regulaci�n gen�tica para interpretar perfiles de expresi�n g�nica utilizando datos de chips de ADN o espectrometr�a de masas.15

HISTORIA

En lo que sigue, y adem�s de los hechos relevantes directamente relacionados con el desarrollo de la bioinform�tica, se mencionar�n algunos hitos cient�ficos y tecnol�gicos que servir�n para poner en un contexto adecuado tal desarrollo.20 Arrancaremos esta breve historia en la d�cada de los 50 del pasado siglo XX, a�os en los que Watson y Crick proponen la estructura de doble h�lice del ADN (1953),21 se secuencia la primera prote�na (insulina bovina) por F. Sanger (1955),22 o se construye el primer circuito integrado por Jack Kilby en los laboratorios de Texas Instruments (1958).23 Las primeras d�cadas: a�os 60 y 70 del siglo XX [editar] En los a�os 60, L. Pauling elabora su teor�a sobre evoluci�n molecular (1962),24 y Margaret Dayhoff, una de las pioneras de la bioinform�tica, publica el primero de los Atlas of Protein Sequences (1965), que tendr� continuidad en a�os posteriores, se convertir� en una obra b�sica en el desarrollo estad�stico, algunos a�os m�s tarde, de las matrices de sustituci�n PAM, y ser� precursor de las actuales bases de datos de prote�nas.25 En el �rea de la tecnolog�a de computadores, se presentan en el ARPA (Advanced Research Projects Agency, agencia de proyectos de investigaci�n avanzados) los protocolos de conmutaci�n de paquetes de datos sobre redes de ordenadores (1968), que permitir�n enlazar poco despu�s varios ordenadores de diferentes universidades en EE.UU.:26 hab�a nacido ARPANET (1969), embri�n de lo que posteriormente ser� Internet. En 1970 se publica el algoritmo Needleman-Wunsch para alineamiento de secuencias;27 se establece el Brookhaven Protein Data Bank (1971),28 se crea la primera mol�cula de ADN recombinante (Paul Berg, 1972),29 E. M. Southern desarrolla la t�cnica Southern blot de localizaci�n de secuencias espec�ficas de ADN (1976),30 comienza la secuenciaci�n de ADN y el desarrollo de software para analizarlo (F. Sanger, software de R. Staden, 1977),31 32 y se publica en 1978 la primera secuencia de genes completa de un organismo, el fago F-X174 (5.386 pares de bases que codifican 9 prote�nas).33 En �mbitos tecnol�gicos vinculados, en estos a�os se asiste al nacimiento del correo electr�nico (Ray Tomlinson, BBN, 1971),34 al desarrollo de Ethernet (protocolo de comunicaciones que facilitar� la interconexi�n de ordenadores, principalmente en redes de �mbito local) por Robert Metcalfe (1973),35 y al desarrollo del protocolo TCP (Transmission Control Protocol, protocolo de control de transmisi�n) por Vinton Cerf y Robert Kahn (1974), uno de los protocolos b�sicos para Internet.36

BUSCES DE DATOS BIOLOGICOS

Una base de datos biol�gica es un volumen grande y consistente de datos, generalmente persistente; asociado a herramientas computacionales dise�adas para actualizar, consultar y devolver una parte o la totalidad de tales datos. Una base de datos simple puede ser un fichero de texto que contiene varias entradas delimitadas por un formato espec�fico. Por ejemplo, una entrada o registro en una base de datos de secuencias nucleot�dicas puede incluir, adem�s de la secuencia como tal, informaci�n acerca del organismo a partir del cual esta fue aislada, del tipo de mol�cula y del grupo de investigaci�n que obtuvo la secuencia, as� como las citas a el(los) art�culo(s) en que se public� la investigaci�n original que demand� la obtenci�n de esa secuencia. Para un buen aprovechamiento de las bases de datos biol�gicas, las mismas deben cumplir dos requerimientos b�sicos: (1) la informaci�n debe ser f�cilmente accesible y (2) debe estar implementado un m�todo que permita extraer s�lo la informaci�n requerida para responder una pregunta biol�gica espec�fica. En el �mbito biol�gico las bases de datos suelen clasificarse en primarias o secundarias. Las bases de datos primarias son aquellas que almacenan secuencias de �cidos nucleicos y prote�nas, estructuras de biomol�culas y perfiles de expresi�n g�nica. Las bases de datos secundarias almacenan informaci�n derivada de las bases de datos primarias, o sea, el resultado de la aplicaci�n de diversas t�cnicas anal�ticas sobre estas fuentes primarias de datos. Los motivos y patrones de secuencia o los marcadores g�nicos asociados a enfermedades son algunos ejemplos de los tipos de datos almacenados en bases de datos secundarias. Un grupo especial de bases de datos son las que almacenan informaci�n relativa a la literatura, conocidas como bibliogr�ficas. Uno de los retos actuales de los investigadores que trabajan en este campo es la b�squeda de m�todos para extraer, de forma autom�tica, conocimiento biol�gico concreto a partir de este �ltimo tipo de bases de datos, que abarca un volumen incalculable de conocimiento acumulado durante d�cadas.

LA NUEVA ERA DE LA BIOLOGIA DE LOS SISTEMAS

La biolog�a ha evolucionado de un enfoque meramente descriptivo, en sus inicios, a un enfoque din�mico basado en evidencias obtenidas en el laboratorio. En los albores del presente siglo, gracias al desarrollo alcanzado en el campo de la bioinform�tica, la biolog�a est� transform�ndose paulatinamente, adem�s, en una ciencia de informaci�n. M�s all� de definiciones y conceptos formales, lo realmente importante en el momento actual es lograr la integraci�n de la informaci�n, que puede obtenerse por muchas v�as diferentes, para formar un cuadro completo de la actividad en la c�lula y as� poder estudiar su comportamiento fisiol�gico y las posibles alteraciones en procesos no fisiol�gicos o patol�gicos. La meta de los investigadores del presente siglo implica el an�lisis e interpretaci�n de los datos de muy diversa naturaleza, de los que disponemos o dispondremos en un futuro inmediato; as� como la obtenci�n de modelos computacionales para los procesos biol�gicos, que se acerquen cada vez m�s al comportamiento real. Todo esto insertado en una disciplina general conocida como biolog�a de los sistemas, que es el producto combinado de disciplinas integradoras a los diferentes niveles de organizaci�n biol�gica, tales como la gen�mica, prote�mica, transcript�mica, metabol�mica y fisi�mica.

SITEMAS OPERATIVOS

A pesar de que se puede hacer bioinform�tica en cualquier estaci�n de trabajo, muchas veces es necesario hacer uso del procesamiento paralelo, debido a la complejidad de las operaciones y c�lculos. El procesamiento paralelo implica varias computadoras que funcionan, acopladas entre s� en clusters, como si se tratara de una sola estaci�n de trabajo. En cuanto al software, el sistema operativo que se ha usado como plataforma para el desarrollo de la bioinform�tica es Linux; por el excelente rendimiento en el procesamiento de datos nativos, por el aprovechamiento �ptimo de los recursos de hardware y sobre todo, por ser distribuido en forma gratuita bajo la filosof�a de c�digo abierto. Varios investigadores concuerdan en que alguien que piense dedicarse a la bioinform�tica debe dominar a fondo: (1) el sistema operativo Linux, (2) un lenguaje de compilador, preferiblemente C que es el que mejor se integra con Linux y (3) un lenguaje de int�rprete como Perl, que permite escribir r�pidamente guiones y es f�cilmente extensible.

CONTACTO

FERNADA ASPRILLA

telefono

3217091773