Una introducción a la teoría de juegos, el dilema del prisionero , los juegos de dos personas con suma cero, y una aplicación de la programación lineal para hallar la estrategia óptima.
2. INTRODUCCIÓN
La teoría de juegos es una herramienta matemática orientada a predecir cual será el resultado más
probable o el resultado más cierto de una disputa entre dos individuos, grupos, firmas o cualquier
combinación de ellas. Fue diseñada y elaborada en un trabajo realizado por John Von Neumann y
Oskar Morgenstern a comienzos de la década de 1940, llamado “Theory of Games and Economic
Behaviour”.
3. DEFINICIONES
Juego: Un juego es un proceso en el que dos o más personas toman decisiones y acciones, la
estructura de las cuales está inscrita en un conjunto de reglas.
Matriz de pagos o Payoff : Es la importancia que le asignamos al resultado del juego. La matriz de
pagos no es más que una forma de resumir los pagos esperados de los jugadores en forma
matricial, donde los elementos de la matriz pueden tener cualquier tipo de unidades siempre que
representen con exactitud la utilidad de un jugador para el resultado correspondiente.
Racionalidad: Un jugador es racional si busca maximizar su utilidad.
Reglas: Las reglas definen el conjunto de instrucciones de como hacer algo. En un juego los
jugadores parten del conocimientos de una serie de reglas que les permita desarrollar el juego. Las
reglas definen la terminación del juego, la cantidad que cada jugador paga o recibe y el objetivo de
cada jugador.
4. DEFINICIONES
Estrategia: Se trata de una posible acción de un jugador.
-Estrategia pura: Es aquella decisión que se toma con certeza, es decir, con probabilidad del 100%.
-Estrategia mixta: Es una combinación de decisiones tomada de acuerdo a una serie de
probabilidades.
Juego de dos personas con suma cero: cuando la suma de la matriz Payoff de los jugadores igual
a cero, un jugador gana lo que el otro pierde. En este juego participan dos o más jugadores. Los
jugadores pueden ser representados por una o más personas.
Juego de dos personas con suma constante: Es aquel que, para cualquier selección de
estrategias de ambos jugadores, la recompensa de ambos jugadores se suma para dar un valor, k,
constante.
5. OBJETIVO DE LA TEORÍA DE JUEGOS
El objetivo de la teoría de juegos es determinar la mejor estrategia para un jugador dado, bajo la
consideración de que el oponente es racional, inteligente y está bien informado.
6. ESTRATEGIA MAXIMIN
Adoptar una estrategia maximin es adoptar aquella estrategia en la que se maximiza la ganancia
mínima que puede obtenerse. Por ejemplo, el siguiente juego es de suma cero. Cada jugador
dispone de tres estrategias posibles a las que designaremos como A,B y C. Los pagos consisten en
la distribución de 10 monedas que se repartirán según las estrategias elegidas por ambos
jugadores y se muestran en la matriz de pagos.
La segunda matriz muestra todos los posibles resultados. De todos esos posibles resultados
mínimos, el que prefiero es el máximo de los mínimos.
7. ESTRATEGIA MINIMAX
Es un método de decisión para minimizar la pérdida máxima esperada en juegos con adversarios y
con información perfecta. El funcionamiento de minimax puede resumirse como elegir el mejor
movimiento para ti mismo suponiendo que tu contrincante escogerá el peor para ti.
Máximo
9
6
8
8. EL DILEMA DEL PRISIONERO
Es un modelo de conflictos muy frecuentes en la sociedad que ha sido profundamente estudiado
por la teoría de juegos.
Dos delincuentes son detenidos y encerrados en celdas de aislamiento diferentes de forma que no
pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo de un banco,
cuya pena es de 10 años de cárcel, pero no tienen pruebas. Solo tienen pruebas para culparlos de
un delito menor, es decir, tendencia ilícita de armas, cuyo castigo es de dos años de cárcel.
Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona información para
culpar al otro del robo del banco.
Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos (Payoff).
La estrategia “lealtad” consiste en permanecer en silencio y no proporcionar pruebas para acusar al
compañero. Llamaremos “traición” a la estrategia alternativa.
9. EL DILEMA DEL PRISIONERO
Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel al que es condenado
el preso X o el preso Y, respectivamente según las estrategias que hayan elegido cada uno de ellos.
10. EL DILEMA DEL PRISIONERO
La aplicación de la estrategia maximín conduce en este juego a un resultado subóptimo. Al
no conocer la decisión del otro preso, la estrategia más segura es traicionar. Si ambos
traicionan, el resultado para ambos es peor que si ambos hubieran elegido la lealtad. Este
resultado es un PUNTO DE EQUILIBRIO DE NASH.
El punto de equilibrio de Nash es una situación en la que ninguno de los jugadores siente la
tentación de cambiar de estrategia ya que cualquier cambio implicaría una disminución en
sus pagos.
11. El duopolio en la Teoría de Juegos
Supongamos que dos empresas, Hipermercados Xauen y Almacenes Yuste,
constituyen un duopolio local en el sector de los grandes almacenes.
Cuando llega la época de las tradicionales rebajas de enero, ambas
empresas acostumbran a realizar inversiones en publicidad tan altas que
suelen implicar la pérdida de todo el beneficio. Este año se han puesto de
acuerdo y han decidido no hacer publicidad por lo que cada una, si cumple
el acuerdo, puede obtener unos beneficios en la temporada de 50
millones. Sin embargo una de ellas puede preparar en secreto su campaña
publicitaria y lanzarla en el último momento con lo que conseguiría atraer
a todos los consumidores. Sus beneficios en ese caso serían de 75 millones
mientras que la empresa competidora perdería 25 millones.
12. El duopolio en la Teoría de Juegos
Cada almacén tiene que elegir entre dos estrategias: respetar el
acuerdo ¿Cooperar¿ o hacer publicidad ¿Traicionar¿. Los beneficios o
pérdidas mostrados a la izquierda de cada casilla son los que
obtiene Xauen cuando elige la estrategia mostrada a la izquierda y
Yuste la mostrada arriba.
13. El duopolio en la Teoría de Juegos
Veamos cuál debe ser la decisión a adoptar por esos almacenes. El director de la
división de estrategia de Xauen pensará: "Si Yuste no hace publicidad, a nosotros
lo que más nos conviene es traicionar el acuerdo, pero si ellos son los primeros en
traicionar, a nosotros también nos convendrá hacerlo. Sea cual sea la estrategia
adoptada por nuestros competidores, lo que más nos conviene es traicionarles".
14. EJEMPLO DE UN JUEGO DE DOS PERSONAS Y
SUMA CERO
Considere la matriz de pagos para el siguiente juego. Se trata de un juego donde compiten dos
políticos en la campaña por un lugar en el senado. Están en los dos últimos días de campaña.
Quieren pasar estos dos días en dos ciudades: Cali y Bogotá.
Los dos jugadores son los dos políticos:
Estrategia 1 = pasar un día en cada ciudad.
Estrategia 2 = pasar los dos días en Cali.
Estrategia 3 = pasar los dos días en Bogotá.
15. VARIACIÓN 1 DEL JUEGO:
Para la siguiente matriz de pagos, se usa el concepto de estrategia dominada, para eliminar una
serie de estrategias inferiores hasta que quede solo una para elegir. Las unidades de los pagos
están dadas en miles de votos.
1 2 3
1 1 2 4
Político1 2 1 0 5
3 0 1 -1
Político2
Estrategia
Para el jugador 1, la estrategia 3 está dominada por la estrategia 1, ya que tiene pagos más altos
(1>0, 2>1, 4>1) independientemente de lo que haga el jugador 2.
16. VARIACIÓN 1 DEL JUEGO:
El jugador 2 es también racional, por tanto, él también puede eliminar estrategias dominadas. Al
final obtenemos la siguiente matriz de pagos:
1 2
Político1 1 1 2
Político2
Estrategia
Ahora la estrategia 2 del jugador 2 está dominada por la estrategia 1 por lo que debe eliminarse. En
consecuencia ambos jugadores deberán elegir su estrategia 1. Con esta solución el jugador 1
recibirá mil votos por parte del jugador 2.
17. VARIACIÓN 2 DEL JUEGO:
Supongamos que se tiene la matriz de pagos siguiente para el mismo juego:
Mínimo
1 2 3
1 0 -2 2 -2
Político1 2 5 4 -3 -3
3 2 3 -4 -4
5 4 2
Político2
Estrategia
Máximo
Valor minimax
Valor maximin
El resultado es que no hay punto de silla. Esto es una solución inestable. Cuando un juego no tiene
punto de silla, la teoría de juegos aconseja a cada jugador asignar una distribución de
probabilidades sobre su conjunto de estrategias.
18. VARIACIÓN 2 DEL JUEGO:
Considere que después de que el jugador 1 elimina la estrategia 3, sus estrategias mixtas son (X1,
X2) y X2 = 1–X1. La estrategia 3 es dominada. Ahora tenemos la tabla:
Y1 Y2 Y3
X1 0 -2 2
Político1 1-X1 5 4 -3
Político2
Probabilidad
Ahora lo resolveremos usando programación lineal. Las variables son X1 y X2. El modelo que
obtenemos, (tomando como el valor del juego v) , es el siguiente:
19. VARIACIÓN 2 DEL JUEGO:
Maximizar 𝑉,
Sujeto a:
5𝑋2 − 𝑉 ≥ 0
−2𝑋1 + 4𝑋2 − 𝑉 ≥ 0
2𝑋1 − 3𝑋2 − 𝑉 ≥ 0
𝑋1 + 𝑋2 = 1
𝑋1 ≥ 0, 𝑋2 ≥ 0, 𝑉 ≥ 0
La aplicación del algoritmo de Dantzig o método simplex a este problema da como resultado 𝑋1=
7
11 , 𝑋2 = 4
11 y 𝑉 = 2
11 . Como solución óptima. La estrategia mixta óptima del jugador 1 es 𝑋1=
7
11 , 𝑋2 = 4
11.
Y1 Y2 Y3
X1 0 -2 2
Político1 1-X1 5 4 -3
Político2
Probabilidad