lunes, 6 de junio de 2011

Juegos bipersonales de suma cero


En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante.

La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j.

Estrategia mixta, Valor esperado


Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si a cada turno escoge al azar un acción para que cada acción se está usado una fracción determinada del tiempo.
Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):
R = [a   b   c  . . . ]
con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1.

Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.
El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por
e = RPC
El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificado por R y C después de un gran número de turnos.

Criterio minimax, Principios fundamentales de la teoría de juegos

Criterio Minimax
Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante.

Encontrar la estrategia se llama solucionar el juego.  Para juegos general, se puede usar el método simplex Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado".
Principios fundamentales de la teoría de juegos Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:
  1. Cada jugador hace la acción mejor posible.
  2. Cada jugador sabe que su contrincante está también haciendo la acción mejor posible.
Reducir por predominio
Una acción domina a otra si todos sus pagos son por lo menos tan provechoso al jugador que los pagos correspondientes de la otra. En términos de la matriz de pagos, podemos decirlo como sigue:
  1. Renglón r en la matriz de pagos domina a renglón s si cada pago en renglón r ≥ el pago correspondiente en renglón s.
  2. Columna r en la matriz de pagos domina a columna s si cada pago en columna r ≤ el pago correspondiente en columna s.
Observe que si dos renglones o columnas son iguales, cada uno domina al otro. Un renglón o columna domina estrictamente a un otro si el uno domina al otro y son desiguales.
Siguiendo el primero principios de la teoría de juegos, la acción que corresponde a un renglón o columna estrictamente dominado nunca será jugado, y ambos jugadores son conscientes de esto por el segundo principio. Entonces cada jugador quien sigue los principios de la teoría de juegos eliminará repetidamente renglones y columnas dominadas como podría ser el caso. (En el caso que son iguales dos renglones o columnas, no hay razón para elegir uno sobre el otro, entonces cualquiera de los dos puede ser eliminado.) Este proceso se llama reducción por predominio.

Punto de silla, juego estrictamente determinado
Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja los máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.
Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinado:
  1. Todos los puntos de silla en un juego tienen los mismos valores de pago.
  2. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.

El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial.
 
REFERENCIA BIBLIOGRAFICA: consultas Medardo Gonzales

No hay comentarios:

Publicar un comentario