CvdB

    Sentado, Herbert Simon y de pi� Allen Newell, en un tablero de ajedrez de 4x4

    AJEDREZ SIMPLIFICADO.

    C.H.von der Becke (1993)

    1. TOMA DE DECISIONES BAJO INCERTIDUMBRE.

    En el ajedrez simplificado buscamos sacar el m�ximo provecho de una dada situaci�n en presencia de incertidumbre. El m�ximo provecho es volcar el juego a nuestro favor con la juqada que elijamos. La dada situaci�n son las req1as del ajedrez y la posici�n de las cuales partimos. La incertiduabre se refiere a nuestra ignorancia acerca de c�mo nos va a replicar el adversario, lo cual �ste tampoco sabe porque no lo pens� todav�a. Ser�a bajo certidumbre si el oponente juega lo mejor posible, porque en ese caso yo (con ayuda computacional) sabr�a lo que va a jugar. El problema del mejor movimiento de las negras, que aparece en el art�culo de Waltz referido al ajedrez siaplificado, en tablero de 4x4 en lugar de 8x8, con la posicion inicial que se resume as�:


    1000 x -1000 x
    x x x 3
    1 x x x
    x x x -5

    Notas: 
    * El tablero de 4x4 es el del ajedrez simplificado 
    * Las cifras de esta lista son los puntajes al hacer el inventario
             1000 significa rey negro (nuestro)
            -1000 significa rey blanco 
                3 significa caballo negro
                1 pe�n negro a punto de ser coronado
               -5 torre blanca
               10 dama negra
                x casillero vac�o de tablero 4x4
               PUNTAJE                 -2,5 (posici�n perderdora)
               SENTIDO DE AVANCE Negras hacia abajo,
        

    Se puede analizar en forma tipificada mediante una matriz decisional donde las cinco acciones que pueden encarar las fichas negras (nosotros) aparecen como columnas al a a5, donde la letra a simboliza la palabra acci�n, las filas son por lo menos dos. La primera corresponde a la soluci�n trivial en que las blancas (el opositor) juegan lo peor posible (nivel de juego p�simo) y la segunda a la soluci�n singular en que las blancas juegan lo mejor posible (nivel de juego �ptimo), jugadas medidas a trav�s del sistema de puntaje (la funci�n de evaluaci�n) explicado en el art�culo, despu�s de la respuesta de las blancas a nuestra jugada. En casos pr�cticos las blancas pueden jugar con un nivel intermedio entre el peor y el mejor, lo cual se aplica a otras filas (a otros niveles de juego diferentes de los dos anteriores) que aqu� no analizamos.


    MATRIZ DECISIONAL DESPUES DE LA RESPUESTA DE BLANCAS A NUESTRA JUGADA al...a5
    suce-
    sores
    a1- caballo negro al centro a2- caballo negro abajo a3- caballo negro arriba a4- rey negro abajo a5- pe�n coronado
    H� blancas juegan p�simo
    1000 x x x
    x x -1000 x
    1 3 x x
    x x x -5
    1000 x -1000 -5
    x x x x
    1 x x x
    x x 3 x
    1000 3 x x
    x x -1000 x
    1 x x x
    x x x -5
    x x -1000 x
    1000 x x 3
    1 x x x
    x x -5 x
    1000 x -1000 x
    x x x -5
    x x x x
    10 x x x
    puntaje 1000-1000+1+3-5 -1,5+2,5=
    0
    1000-1000-5+1+3=
    -1
    1000+3-1000+1-5=
    -1
    -1000+1000+3+1-5 -1.5=
    -2,5
    1000-1000-5 +10=
    5
    H1 blancas juegan �ptimo
    1000 x x x
    x x -1000 x
    1 3 x x
    x x x -5
    1000 x -1000 x
    x x x x
    1 x x x
    x x -5 x
    1000 3 -1000 x
    x x x x
    1 x x x
    -5 x x x
    x x -1000 x
    1000 x x -5
    1 x x x
    x x x x
    1000 x -1000 x
    x x x 3
    x x x x
    -5 x x x
    puntaje 1000-1000+1+3-5 -1,5+2,5=
    0
    1000-1000+1-5=
    -4
    1000-1000+3+1-5 -0,5 =
    -1,5
    1000-1000+1-5 -10=
    -14
    1000-1000+3-5-10-1,5=
    -13,5
    H� -
    M�ximo de puntaje
    no no no no
    elegir a5,opt
    H1 -
    M�ximo de puntaje
    elegir a1,opt
    no no no no


  • H� significa la hip�tesis nula o trivial "las blancas juegan p�simo";
  • H1 es la hip�tesis alternativa "las blancas juegan �ptimo".

    El puntaje es el explicado en el art�culo de Waltz y abarca el inventario con los signos y las amenazas, pregunt�ndole una sola vez a cada pieza de ajedrez, si est� amenazada. Si as� fuera el puntaje de la amenaza, con su signo adecuado, ser� la mitad del valor de inventario de la pieza amenazada. La excepci�n es la amenaza al rey (jaque) que vale 10 puntos y no 500.

    La acci�n nuestra a�ptima depender� de si el opositor juega en forma �ptima para �l o en forma p�sima (o casos intermedios).

    Usaremos las palabras bonificaci�n y penalidad para caracterizar con la primera lo que nos conviene (cifras altas son favorables) y con la segunda lo que n� (cifras muy negativas resultan as� favorables).

    Hay una sola manera de juqar lo mejor posible, H1, y hay una sola manera de jugar lo peor posible, H�, aunque hay muchas maneras de jugar mal.

    La teor�a de la toma de decisiones ense�a que bajo incertidumbre sobre c�mo juega el opositor, conviene imaginar que dicho opositor lo hace de la mejor manera posible en su inter�s, lo cual est� asociado con una escuela determinada de resoluci�n de problemas bajo incertidumbre: la as� llamada estrategia minimax.

    En la matriz decisional se anotan penalidades para nosotros, con signo positivo, Si se anotan bonificaciones para nosotros, la estrategia se invierte y se denomina maximin. En la tabla previa para los puntajes se aplican bonificaciones con signo positivo para nosotros y negativos para el oponente: la tabla es maximin.

    Maximin se denomina buscar cu�l acci�n est� asociada con el m�ximo de los m�nimos por columna (columnas son acciones o decisiones). En la primera columna debemos seleccionar el m�nimo, que corresponde a la fila del oponente jugando bien (filas son estados de la natura). Esto mismo se repite en cada una de las restantes cuatro columnas, con el mismo significado. Tenemos entonces cinco valores, de los cuales buscamos no solamente el valor m�ximo, sino tambien queremos identificar en qu� columna est�.

    La acci�n asociada con esa columna, acci�n que figura en el titulo que la encabeza, ser� la acci�n �ptima, funci�n de haber seleccionado maxim�n como estrategia a seguir.

    La soluci�n Maxim�n es la del pesimista perfecto, pues imagina que el oponente jugar� siempre bien, lo cual va en contra de los intereses de quien est� tomando la decisi�n, pero simula una situaci�n que bien puede ser real.

    Repetimos que esto es para bonificaciones desde nuestro punto de vista (las negras). En los textos habitualmente no se anotan las bonificaciones sino las penalidades. Cuando se hace esto �ltimo, corresponde decir que el pesimismo se asocia con la estrategia minimax.

    3. CRITERIO PARA MEDIR UN DADO ESTADO EN EL TABLERO DE AJEDREZ.

    Waltz nos explica que hay tres criterios que, combinados, ayudan a saber quien va ganando.

    1. Un inventario o suma algebraica de las fichas del tablero y de la suma algebraica de las amenazas que est�n sufriendo cada una de las fichas, en respuesta a la pregunta individual: �est�s amenazado? La suma algebraica de sumandos con signo positivo se usa para lo que nos ayuda y negativo para lo que nos frena,

    2. Una evaluaci�n de qui�n tiene el dominio del centro del tablero.

    3. Una consideraci�n de la factibilidad que un pe�n pueda llegar a coronarse.

    Como hace Waltz, solamente nos fijamos en 1. Sin embargo privileqiasos con el orden de prioridad uno aquella jugada nuestra (nos toca jugar a nosotros, las negras) que mejore nuestro dominio del centro del tablero, criterio 2. Esto resultar� muy importante para resolver con rapidez la mejor jugada.

    4. COMENTARIOS SOBRE LA DECISION OPTIMA CON LOS ESTADOS RESULTANTES CUANDO LAS BLANCAS HAN REPLICADO NUESTRA JUGADA, LA INDICADA CON al, a2, a3, a4 o a5.

    Como se ha visto, el puntaje corresponde a bonificaciones para las negras.

    Seleccionamos los m�nimos de cada columna, lo cual est� asociado con nuestra actitud pesimista con respecto a c�mo ha de jugar el oponente, que buscar� que nuestras bonificaciones sean m�nimas. la tarea se explica en la ant�ltima fila o estado de la natura de la matriz decisional.

    Como resultado de esa tarea, tenemos cinco valores m�ximos, que volvemos a anotar en la �ltima fila de la matriz. Con ellos debemos elegir nuestra nuestra jugada m�s racional, habida cuenta de nuestro pesimismo. Si fuesemos optimistas, la racionalidad nos lleva a a4 o a5. Nos damos cuenta que, contrastando entre s� las distintas escuelas, una la pesimista o Maxim�n para bonificaciones y otra la optimista o Maximax para bonificaciones, llevan a soluciones distintas. Esta falta de coherencia preocupa a muchos te�ricos, que piden entonces que uno se esfuerce por cuantificar sus incertidumbres. Se dice que siempre sabemos algo, tenemos alguna pista, de c�mo es la aparente incertidumbre que enfrentamos. Si cuantificamos aunque sea borrosamente esa incertidumbre, el problema pasa a ser de toma de decisiones bajo riesgo, soluble matematicamente, lo cual conforma a los te�ricos. Se ha sugerido que el optimista es quien conoce m�s de la situaci�n que lo que normalmente saben los dem�s, por lo cual cuando piensa que la suerte va a estar de su lado, lo hace basado en antecedentes que no pone sobre la mesa.

    Desde cierto punto de vista, nuestro conocimiento durante la partida de ajedrez es conoc�miento borroso, "fuzzy knowledge'. No vemos claro qu� hacer, sino a medias. No sabemos exactamente c�mo jugar�n las blancas despues de la jugada nuestra que estamos ponderando.

    La defensa habitual del pesimismo es bastante intuit�va, Si suponemos que el opositor juega bien, estamos preparando nuestra jugada de tal forma, que si juega bien ya lo hab�amos previsto de antemano y si juega mal, alguna ventaja adicional vamos a poder sacarle a su falta de pericia.

    En cualquier caso, una mayor seguridad en el an�lisis deriva de tener m�s informaci�n valiosa, que en este caso es f�cil de interpretar. Habr� que avanzar a un nivel m�s abajo, o sea calcular la contrarr�plica nuestra a cada r�plica opositora. Esto se vuelve en un �rbol tan ramificado que en general no alcanza el tiempo si se sigue con la misma actitud, bajando m�s y m�s de nivel. Una partida de ajedrez tiene en promedio 52 niveles, como anota Waltz. Debemos conformarnos con un descenso de nivel lo suficientecente bueno para los fines pr�cticos (principio de racionalidad restringida de Herbert Simon).

    N�tese que aunque nosotros (las negras) no hemos ganado a�n, hemos salido de una posici�n perdedora con puntaje -2,55, para remontar a una posici�n cuyo puntaje es 0, segun el m�todo aqu� explicado.

    Obs�rvese que el programa consiste en un cierto manejo de listas y que la asignaci�n de puntajes es de la forma de un polinomio lineal.

    A la asignaci�n de puntajes ('para sacar el m�ximo provecho') la llamamos funci�n de evaluaci�n del criterio o de la funci�n objetivo,

    S. El JUEGO DEL AJEDREZ COMO VECTORES Y MATRICES.

    Como en otros ejemplos, una secuencia de jugadas se puede descomponer en un estado inicial registrado en un vector fila, que premultiplica a un operador que es una matriz cuadrada, dando como resultado de nuevo un vector fila que simboliza al sucesor del estado inicial. Interesa pensar si no se puede hacer algo an�logo con el ajedrez. Efectivamente, con un vector fila de 16 elementos se puede simbolizar el estado inicial, o sea, para el caso analizado,

    1000 x -1000 x x x x 3 1 x x x x x x -5
    que multiplicado por el operador caballo al centro origina
    1000 x -1000 x x x x x 1 3 x x x x x -5

    que seguido del operador rey blanco abajo, genera el vector resultado �ptimo para las negras y las blancas (maximin)

    1000 x x x x x -1000 x 1 3 x x x x x -5
    La matriz cuadrada de 16 x 16 que simboliza caballo negro al centro y la del otro tipo que representa rey blanco abajo, se pueden despejar a partir de la observaci�n que como al no haber ni disminuci�n ni aumento del n�mero de piezas, ambas deben ser estoc�sticas. La diagonal principal de las matrices cuadradas debe tener alta abundancia de 1.

    Combinando entre s� las dos matrices cuadradas individuales se obtiene otra tercera matriz cuadrada que permite saltar de la posici�n inicial a la posici�n final maximin. El significado de esa tercera matriz lineal, es el de mostrar esquematicamente el desarrollo de dos jugadas consecutivas como una sola operaci�n conjunta, por aplicaci�n del principio de superposici�n de matrices lineales. Se la compara con un macro.

    9. DOS COMPUTADORAS COMPITIENDO PARA AFINAR El CALCULO DE PUNTAJE.

    La aparente arbitrariedad de evaluar con 10 a un rey jaqueado o con un 3 a la presencia de un caballo, puede refinarse con un m�todo bastante intuitivo, Basta poner a competir miles de veces a dos computadoras, programadas de manera que los par�metros o cifras de cada una de las m�quinas difieran de las de la otra. La que gane m�s veces estar� m�s cerca de la verdad. As�, los par�metros se ponen experimentalmente a prueba, quiz�s a trav�s de un programa maestro de dise�o de experimentos del cual son esclavas esas dos computadoras. Por supuesto, esta tarea no necesita de dos computadoras, ya que una sola, ingeniosamente programada, puede satisfacer muy bien la misma funci�n.

    • ajedrez simplificado, introducci�n

    • b�squeda

    • b�squeda primero en profundidad

    • b�squeda minimax

    • teor�a de juegos y comportamiento econ�mico

    • podas alfa y beta

    • estructura de �rbol

    • funci�n de evaluaci�n

    Hosted by www.Geocities.ws

    1