Barral & v d Becke- VIII-- Temas previos

50.

teorizar sobre el aprendizaje perceptual, el aprendizaje cognitivo y el aprendizaje de acciones motoras, como emergiendo de una explicaci�n mecan�stica �nica, explicaci�n que copia lo modelizado de la causa del reconocimiento en K, tambi�n para C y para D. La causa del reconocimiento en K, que resulta por el modelo com�n tambi�n a C y a D, es el troceado (Ap�ndice 8).

En la Fig 15 se ilustra la arquitectura del espacio de problema, referido al caso del mundo de los dos baldes.

Todas las tareas imaginables pasan (en este modelo Soar) por sus diferentes estados y sus asociados espacios de problema. Los sentidos informan la condici�n inicial. El listado de metas u objetivos permite generar conductas. Los subobjetivos se crean autom�ticamente a partir de la aparici�n de impasses.

En la Fig 16 se observa un detalle de la tarea de flujo de informaci�n subsimb�lica entre la memoria de largo alcance (especializada aqui en su tarea de memoria asociativa) y la memoria de trabajo.

-------------------------------------------------------------------------
       MEMORIA ASOCIATIVA (una parte de la memoria de largo alcance)
                * Ejecuci�n de producciones Km  *** --> oo

K1             C1  y C2   y C3   --operador->  A1  , A2

K2                    C4  y C5   --operador->  A3

K3     C6  y  C3  y  C5  y  C7   --operador->  A1  , A4
-----------------------------------------------------------------------
                ! Ej !                              ! An !
------------------------------------------------------------------------
            MEMORIA DE TRABAJO (una parte de la memoria rapida)

                           E1  , E2  , E3  ,...
---------------------------------------------------------------------------

Fig 16. Como en figuras previas, la linea horizontal separa dos memorias distintas. La memoria de trabajo alberga una colecci�n de elementos de datos Ej. De esa colecci�n filtra pistas, similitudes o fragmentos de sus elaboraciones Ej, que envia a la memoria de largo alcance, como elementos que se codifican, Cl. Con la ayuda de estas pistas codificadas, Cl, la memoria asociativa las asocia con otras pistas Cl' an�logas, que alberga. Con algunas de ellas arbitra producciones codificadas Km (con aportes de los espacios de problemas) que se devuelven, descodificadas, An, como acciones motoras. Las producciones cognitivas Km, de las cuales se muestran tres ejemplos, pueden ser miles en dos segundos. Tienen la forma de un estado inicial u operando inicial C, que mediante un operador se transforma en una acci�n descodificada A. N�tese que por analog�a con lo que se modeliza para espacios de problema, la transformaci�n de los operandos C codificado en A descodificado, de nuevo se realiza con operadores. D (omitido en este esquema) ocurre entre K y A. Queda claro que las alarmas tienen componentes alarmantes y componentes neutros. Ej los abarca a ambos. Las producciones de la memoria asociativa se generalizan con estos s�mbolos abreviados:

*** ---> oo
y largos:
x + x' + x" ---operador---> y + y'.

Esta t�pica tarea intelectual no ocurre sin inconvenientes. Lo habitual es que el proceso se trabe. En el sistema cognitivo K, el mecanismo para la conclusi�n a extraer necesita bioenerg�a. El motivo reside en que, en la experiencia previa, no hay registrada soluci�n

*** --> oo
exactamente

51.

igual a la planteada por los inputs Ej. Se debe proceder por analog�a. Es el momento cuando el sistema cognitivo aprende. No aprende durante la deliberaci�n ni durante la preparaci�n o CBR. Todo el resto se supone, ya sea aprendido, ya sea heredado (si se trata de un sistema cognitivo biol�gico) o precableado (si se trata de un sistema artificial). Esta etapa se denomina impasse de Newell y consiste en aplicar al caso la creaci�n de un espacio de problema con la meta de salir de la impasse (Apendice 8). De esto se deduce la necesidad de un listado de objetivos o metas asociados con impasses, adelantada en la Fig 12.

Queda explicado que la acci�n A es funci�n de los datos aportados por los sentidos fisiol�gicos y por el reservorio de experiencias.

   
A= f(datos externos con sus pistas, experiencias previas con sus pistas)

f ocurre en P-C-K-D-M, aunque en especial en el espacio de problemas conectado a K y su receta es fuertemente educable, en C-K-D.

Allen Newell define como alto nivel de inteligencia, al que caracteriza a un sistema que, antes de actuar, intenta reconocer, si las hubiera, todas las pistas similares a las reci�n ingresadas, barriendo las experiencias, reglas y metarreglas previas registradas.

Biologicamente muchas alarmas o aun tareas no asociadas con alarmas, exigen un proceso *** ---> oo urgente de ciertas señales alarmantes del ambiente. Esto es explicable con la misma cascada P-C-K-D-M, aunque la version r�pida (CBR) de dicho proceso no siempre llega a satisfacer la totalidad de lo requerido para resultar una respuesta inteligente (racional). Es innata (irracional), o resultante de un entrenamiento.

Soar, el primer modelo importante de inteligencia artificial compite con otros modelos que van apareciendo, de los cuales el ACT-R (Anderson, Lebiere) es excelente (Johnson TR). Soar muestra numerosos logros en su lista de parecidos con la actividad cognitiva humana. Por ejemplo: * Es un sistema simb�lico capaz de abstracciones.

* Segun las circunstancias, muestra conducta ya sea autom�tica, ya sea controlada, ya sea adaptiva. Se adapta a las contingencias sin plan previo.

* Est� basado en un comparador generador de alarma por reconocimiento de pistas. El reconocimiento es fuertemente asociativo, sin mostrar de antemano un acceso deliberado a todo lo que conoce. Eso limita su inteligencia, definida en p�rrafos previos.

* Aprende de la experiencia (usando su registro de pistas). Recordar puede ser un problema, que se puede encarar con la t�cnica del espacio de problema.

* Es de r�pida lectura de est�mulos del mundo externo y, en general, de lenta respuesta.

* Est� orientado a metas y objetivos, no s�lo porque aprende metas, sino porque las metas se autogeneran por interacci�n con el ambiente.

* Est� guiado por interrupciones, con b�squeda local que primero se introduce en alguna rama del �rbol decisional y luego profundiza en ella. Contrariamente al General Problem Solver, carente de distracciones, aparecen distracciones naturales en el circu�to decisional. No sabe como va realizando su tarea, aunque es capaz de reconstruir lo que acaba de hacer.

* Es un proceso en serie en el medio de un paralelismo generalizado.

* Su conducta por defecto es fundamentalmente adaptiva; se adapta a las contingencias sin un plan previo.

Muchas de estas caracter�sticas ser�n notables en el modelo de arquitectura cerebral que se ha de proponer a partir del paragrafo 21.

52.

14. MODELO DE COMPUTACION COLECTIVA DE UNA RED

Antes de emprender la lectura de este par�grafo, conviene que el lector experimente con

* un OCR (optical character recognizer) como el que usan los escaners de lectura de textos, de los cuales es muy did'actico el programado por The Visible Neural Network, Inc, denominado Optical Character Recognition Demo, del cual el principal mensaje resulta ser que con cada ciclo de entrenamiento que pasa, el OCR va acertando un n�mero creciente de patrones que en realidad son letras may�sculas y d�gitos, evidencia que aprende; y

* algun simulador tipo robot bidimensional, de la conducta de un invertebrado o de un batracio, entre los cuales es muy recomendable el programado por Beer y ofrecido con el nombre de Nervous System Construction Kit para PC, por los Williams, del cual el principal mensaje es que cambiando los par�metros de algunas de las casi 80 "neuronas" computacionales, similares cada una de ellas a las dos que se grafican en b de la Fig 17, cambia la conducta del robot bidimensional. El robot opera como un conjunto autoorganizado del cual se observa en el monitor c�mo se desplaza, c�mo retrocede en callejones sin salida y como bordea obst�culos que lo separan de la fuente de bioenerg�a, mostrando transiciones de fase del desequilibrio cuando enfrenta obst�culos preparados por el estudioso o cuando detecta dicha comida y se harta de ella. En este caso La inteligencia del robot no requiere memoria y se basa en la adaptabilidad del circuito neural a las condiciones externas. En ese circu�to no existe un agente que dirija el tr�fico ni un reglamento innato que rija la conducta: la principal explicaci�n reside en la tendencia termodin�mica hacia un espont�neo y cambiente equilibrio de Kirchoff, que oculta el respeto al principio de Le Chatelier.

En el primer caso el diseño se parece a la Fig 19, cuyo texto es un resumen de lo que se puede observar con el ORC.

En el segundo caso se est� empleando el bastante reciente acierto de Hopfield (1982) con el reemplazo de las neuronas biol�gicas por amplificadores operacionales anal�gicos, diseño que alcanza, en principio, para explicar muchas propiedades trascendentes del cerebro humano a nivel subsimb�lico y subcognitivo, sobre todo algunas de la memoria asociativa y de la interpretaci�n de la informaci�n. Los amplificadores operacionales anal�gicos, las resistencias, los condensadores y el cableado de Hopfield son dispositivos electr�nicos, aptos - como es el caso - para ser simulados con programas computacionales digitales. La computaci�n colectiva que alli se logra se basa en

* partir de condiciones iniciales alejadas del equilibrio y que representan un problema f�sico a resolver a nivel subsimb�lico, de interpretaci�n de la informaci�n y de memoria asociativa; y

53.




















Fig 17.- Circu�to biestable o flip flop, con tomas a tierra bater�a - resistencia para cada uno de los dos amplificadores operacionales. El amplificador simula a una neurona y la toma a tierra simula a la membrana de la neurona, por la cual se pierde actividad. (a) Cada amplificador operacional de (b) se puede saturar con valores l�mite o asint�ticos cualquiera que sea la tensi�n de entrada de alguna de las dos maneras indicadas por linea llena (normal, excitatriz) o de rayas (invertida, inhibitoria). Esta �ltima se usa en el ejemplo. (b) La evoluci�n del circuito biestable depende del cociente entre los pesos de las resistencias centrales. Los dos circulitos blancos Va y Vb son los sitios para introducir las excitaciones externas o inputs. Los otros dos a la izquierda son posiciones adicionales para el ingreso de corrientes. Los dos llenos o negros son sitios usados para la medici�n de los potenciales Va y Vb de output registrados en las graficas siguientes. (c) Si el proceso recibiese Va = Vb a la entrada y tuviese iguales valores para las dos resistencias centrales de (b), evolucionar�a ya sea hacia (Va Vb) valiendo (-1 +1) o bien a (+1 -1), los dos atractores existentes. La trayectoria superior comienza con Va = Vb, puesto que esta sobre la diagonal que actua de separatrix (lugar geometrico separador) entre ambos atractores. Se orienta hacia uno de los atractores en lugar del otro por algun desbalance circunstancial que no aparece explicito, pudiendo ser asimismo una trayectoria hacia el otro atractor motivado por otro desbalance. La segunda

54.

trayectoria marcada se explica porque el punto inicial est� del mismo lado de la separatrix que el atractor. (d) Trayectoria en el caso cuando las resistencias centrales de (b) son iguales. (e) Lo mismo, pero aqu� desiguales: desaparece la biestabilidad y pasa a haber un atractor �nico asim�trico con rotura de la simetr�a previa. De un ordenamiento inicial biestable (d) hubo una transici�n de fase hacia otro ordenamiento distinto monoestable (e) causado por el cambio desde un cociente entre los pesos de las resistencias centrales con valor, por ejemplo, 1, hacia otros valores apartados. (Tank y Hopfield, Investigaci�n y Ciencia, feb 1988, p. 47).


* terminar en un equilibrio de Kirchhoff para la red interconectada, equilibrio detectado por una energ�a de computo E que se debe minimizar (como hubo que minimizar el potencial V en el Ap�ndice 3). En un problema de interpretaci�n de la informaci�n hay posibilidad de encontrar diversas soluciones tentativas. Se reconoce como la mejor la que satisface dicha minimizaci�n de E en un circu�to de amplificadores/neuronas. Cada uno de estos �ltimos "vota" con un signo +1 (descarga sinaptica) o -1 (pasividad).

El signo o voto s ingresa en una f�rmula que contabiliza todas las interacciones de ida y de vuelta de todos los amplificadores operacionales (neuronas) de la red. Ella es, justamente, la f�rmula para la energ�a E a minimizar, energ�a an�loga a la que aparece al alterar los espines del vidrio de espin y que se ha denominado energ�a de c�mputo: 

              E = -(Sigma) Vij. si.sj => MIN                      (5)
                         i�j

energ�a que evoluciona hasta que todos los signos si(t) de los amplificadores coincidan con este otro signo:
        sgn (Sigma) {Vij(sj(t))+1]/2 - Voi }                     (5a)

En el caso infrecuente de obtenerse cero con esta expresi�n, convencionalmente se reemplaza dicho cero por +1.

V es el potencial, la actividad o el est�mulo para la descarga
i es el sumidero
j es la fuente
o se refiere al valor umbral necesario para que se produzca descarga
sgn indica el signo.

La expresi�n (5a) contabiliza el signo que surge de contrastar un minuendo - el estimulo actual - y de un sustraendo - el est�mulo umbral - y modificando el -1 de la nomenclatura de (5) por el cero en la nueva de (5a). Para s hay dos valores, +1 y -1; para el minuendo de (5a) esos dos valores son +Vij y cero. Todos los signos pueden ser positivos al final, o bien todos negativos. En cualquiera de ambos casos la energ�a de c�mputo es m�nima y el proceso termina. Mientras no coincidan los signos, el proceso sigue. A su vez, la expresi�n (5) invita a maximizar los diferentes Vij y a lograr que no haya diferencia de voto entre i y j. Como ejemplo consid�rese el circuito biestable con N=2 amplificadores saturables de la Fig 17.

Cualquiera que sea la zona de partida para las dos V posibles, convergen a que si la salida de Va tiene un signo, la de Vb tiene el opuesto, con lo cual se presentan dos atractores posibles. Corresponden a equilibrios de Kirchhoff, estables frente a pequeñas perturbaciones. La din�mica se

55.

















Fig 18. En este modelo esquem�tico de las neuronas fotorreceptoras del caracol, las zonas punteadas son modificaciones anat�micas resultantes de un aprendizaje antihebbiano (Daniel Alkon, Sci. Am., 261,1 (July 1989).


estabiliza con m�nima energ�a de c�mputo de la ec. (5) sujeto a la restricci�n (5a). Esto exige una actualizaci�n asincr�nica de los N amplificadores, ya que fracasa con actualizaci�n sincr�nica.

En 1982 este desarrollo signific� una gran novedad. Las redes con esta arquitectura pueden aprender. C�mo aprenden depende de muchos factores. Observando el robot bidimensional de Beer citado al principio de este par�grafo, el circu�to no aprende de manera alguna y corresponde a la situaci�n ideal "x" en el or�gen de coordenadas de la Fig 9. Observando la operaci�n del OCR, el circuito realmente aprende en la medida que los datos analizados a la entrada tengan estructura. Pueden encontrar relaciones en com�n de muestras a la entrada que se les proporcionan (aunque no es nada sencillo traducir esas relaciones, que usan muy bien las redes, a significados f�ciles de entender) y generalizar esas mismas relaciones a otras situaciones, como hacen muchos robots y animalitos (APENDICE 4).

15. MECANISMOS HEBBIANOS

La clave del aprendizaje reside en que los pesos de las diferentes conexiones neuronales (mostradas como resistencias en la Fig 17.b), pueden ser reajustados de una manera incremental, ya sea cuando los datos b�sicos tienen estructura (lo cual se reinterpreta como un "maestro oculto" que ayuda a aprender), o bien cuando existe un maestro expl�cito que indica si la tarea intentada fue correctamente ejecutada o no.

�C�mo saben los pesos hacia d�nde y con qu� paso de avance cambiar? En los chips que aprenden, son algoritmos que detectan el signo del vector que

56.

apunta hacia la m�nima energ�a de computo. En los animales son los mecanismos hebbianos o antihebbianos de alteraci�n de neuronas con el aprendizaje, que algunos autores visualizan como el tipo mostrado por la Fig 18. Existen otras hipotesis alternativas, como la danesa descripta en el APENDICE 4.

La regla de Hebb señala que si las descargas entre dos neuronas i y j conectadas entre s�, son transmitidas por una conexi�n en forma repetida y persistente, algun mecanismo de crecimiento o cambio metab�lico sucede a uno y a otro lado de la hendidura sin�ptica, resultando como consecuencia de ese refuerzo, que entre j e i aumenta el potencial o actividad Vij. Otros autores acuñaron el t�rmino de antihebbiano para referirse al mecanismo de disminuci�n por inhibici�n. Excitaciones e inhibiciones, en conjunto, podr�an responder a un imperativo de b�squeda de m�nima energ�a, si bien Francis Crick (en The Astonishing Hypothesis, p. 102) concreta de esta otra manera c�mo aparecen excitaciones e inhibiciones:

"Aunque algunos modelos te�ricos suponen que la excitaci�n es sim�trica a la inhibici�n, en el neoc�rtex no lo es. Las conexiones a larga distancia de una zona cortical a otra, surgen solamente mediante neuronas piramidales. Son todas excitatorias. Los axones de la mayor�a de las neuronas inhibitorias son, en cambio, bastante cortos y solamente influyen sobre neuronas del vecindario. Las neuronas excitatorias e inhibitorias difieren morfol�gicamente entre s� (con una posible excepci�n menor)... Todas las neuronas reciben tanto excitaciones como inhibiciones, presumiblemente para evitar que queden siempre silenciosas o que se vuelvan salvajes."

Hopfield se basa en Hebb para formular la segunda expresi�n relacionada con los signos, donde aparece Vo, par�metro tipicamente hebbiano pues puede cambiar.

Como resumen, se puede afirmar que hay una serie de conceptos secuenciales que se refuerzan mutuamente y que est�n fuertemente correlacionados: coherencia y coevoluci�n interna entre subsistemas biol�gicos en un sistema complejo en condiciones de sujetarse a una transici�n, y decisi�n conjunta reforzada o inhibida hebbiana o antihebbianamente, aparentemente para acceder a atractores caracterizados por m�nima energia. Resta por considerar que en la mente (no as�, a lo que se aprecia, en los actuales chips inform�ticos) los fen�menos importantes ocurren, ya sea en la zona intermedia entre el orden y el caos, o bien en plena zona de caos, lo cual parece quedar evidenciado por el estudio de las ondas electroencef�licas.

Siguiendo las mismas lineas precedentes, Donald O. Hebb fue el primero en probar, en su Organization of Behavior, que los pensamientos o ideas y sus mecanismos de generaci�n tienen una base f�sica tan firme como los movimientos musculares. A partir de esa verificaci�n, se fue elaborando un as� llamado modelo darwiniano del pensamiento (Calvin, Investigaci�n y Ciencia, Dic. 1994, p. 81-85.)


Temas siguientes

Actualizado 20 de Octubre, 1998

(P�gina en preparaci�n) Adios.

Hosted by www.Geocities.ws

1