You are on page 1of 77

MASTER EN INGENIERÍA DE LA

DECISIÓN

ANÁLISIS DE NEGOCIACIONES.

2 CONCEPTOS BÁSICOS DE TEORÍA DE JUEGOS (NO


COOPERATIVOS)
EQUILIBRIOS DE NASH

David Ríos Insua y Roman Efremov


Objetivo
En esta sesión introducimos los dos
conceptos básicos de la teoría de juegos no
cooperativos:

„ dominacia (tal vez iterada),


„ equilibrio de Nash

Tiempo esperado: 4 horas (incluida la


actividad).
Plan

El plan para esta sesión es el siguiente

„ Descripción básica de juegos


„ Conceptos de dominancia
„ Concepto de equilibrio de Nash no cooperativo
„ Cálculo de equilibrios de Nash
„ Aplicaciones
Contexto básico

El tipo de problemas que consideramos tienen estos rasgos:


„ Hay varios decisores
„ El pago que recibe cada decisor depende no sólo de su decisión,
sino también de las de los demás
„ Puede tener lugar tanto en situación de conflicto como de
cooperación
„ Los participantes o decisores se denominan jugadores
„ Los pagos a los jugadores en función de sus acciones se
denominan las funciones de pagos

Un juego es un conjunto de reglas conocidas por los


jugadores que determinan qué pueden hacer y las
consecuencias y los pagos asociados a sus decisiones
Posibilidades
Hay varios tipos de juegos en función de:
„ Número de jugadores: 2, 3, …, n,… ∞

„ Número de estrategias disponibles: Finitas,


Infinitas
„ Función de pagos: Juegos de suma nula,
(Juegos bipersonales de suma nula), Juegos de
diferencia constante. Juegos de suma no nula
„ Situación previa al juego: Cooperativos, no
cooperativos
Las iremos viendo a lo largo del curso…
Ejemplos. Posibilidades.
„ El conocido juego Piedra-papel-tijera es un ejemplo de

„ Juego bipersonal
„ Juego de suma nula (si uno gana el otro pierde)
„ Finito (cada uno tiene 3 alternativas para elegir: piedra, papel,
o tijera)
„ Es un juego no cooperativo
Ejemplos. Posibilidades.

„ Partir una herencia de 500000 pesos en tres partes (x,


y, 500000-x-y) con x, y entre 0 y 500000, y x+y menor
que 500000

„ Es un juego tripersonal
„ Es un juego de suma constante
„ Con un número de estrategias infinito
„ Es un juego no cooperativo, si no se permite la comunicación.
Podría ser cooperativo si hay sintonía entre los herederos.
Conceptos básicos de Teoría de Juegos

Vamos a introducir brevemente los


conceptos de la Teoría de Juegos. Para
ello:
„ Juntaos por parejas!!!!

„ Presentamos varias situaciones que nos

ayudarán a introducir algunos conceptos


básicos…
„ Luego introducidos más rigurosamente
Conceptos básicos de Teoría de Juegos

Las reglas serán:

„ Tienes que actuar


„ Tus consecuencias dependen de lo que
hagas tú y los demás
„ No sabes lo que harán, pero sabes lo que
podrían hacer
„ No saben lo que tú harás
Reglas básicas
Dos jugadores, dos alternativas

• Estrategias fijas

• Información perfecta

• Selección simultánea, salvo que se indique lo contrario

• No hay discusión previa


Matriz del juego
„ La forma normal de un juego es una matriz
que muestra Izda. Dcha.
„ los jugadores,
„ las estrategias,
„ y las recompensas (ver el ejemplo a la
Arriba A,I A,D
derecha).
„ Hay dos jugadores:
Debajo D,I D,D
„ uno elige la fila
„ y otro la columna.
„ En el ejemplo, cada jugador tiene dos
estrategias:
„ las estrategias del jugador 1 (o sea, el jugador
de las filas) se denominan “Arriba” y “Debajo”,
„ las del jugador 2 (o sea, el jugador de las
columnas) se denominan “Izda.” y “Dcha.”
Matriz del juego
„ Las recompensas se especifican en el interior: Izda. Dcha.
„ el primer número es la recompensa recibida por
el jugador 1 (fila);
„ el segundo es la recompensa del jugador 2.
(columna)
Arriba 3,2 1,5
„ Por ejemplo, si el jugador 1 elige “arriba” y el
jugador 2 elige “izda.” entonces sus recompensas
son 3 y 2, respectivamente. Debajo 4,7 3,1
„ Cuando un juego se presenta en forma normal,
se presupone que todos los jugadores actúan
simultáneamente, o sea, sin saber la elección
que toma el otro.
„ Cada jugador desea maximizar su ganancia.
Matriz del juego: suma nula
„ En los juegos de suma nula el Izda. Dcha.
beneficio total para todos los
jugadores del juego, en cada
Arriba 3,-3 -2,2
combinación de estrategias,
siempre suma cero (en otras
palabras, un jugador se Debajo -4,4 1,-1

beneficia solamente a expensas


del otro).
Matriz del juego: suma nula

„El juego del ejemplo anterior tiene Izda. Dcha.


información redundante (siendo de
suma nula). Puede simplificarse y Arriba 3 -2
transformarse en esta otra que
representa tan solo las ganancias Debajo -4 1
del jugador 1, teniendo en cuenta
que las ganancias del opositor son
cantidades opuestas.
Ejemplo. Juego suma nula.
Tenéis aquí representado el juego de
Piedra-papel-tijera en forma normal.
(Lee el material adicional de la Wikipedia)

Piedra Papel Tijera


Piedra 0 -1 1
Papel 1 0 -1
Tijera -1 1 0
Considera este juego…

„ Piensa que harías si fueras el jugador Izda. Dcha.


de las filas. ¿Que estrategia elegirías?
„ ¿Y si fueras el jugador de columnas?
Arriba 4,5 10,-6
„ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra


Debajo 12,7 5,9
interpretación…
Indeterminación
„ Denominemos Izda. Dcha.

„ J1 al Jugador de las filas (J1) y


„ J2 al Jugador de las columnas. Arriba 4,5 10,-6
Podría ocurrir la siguiente situación…
„J1 ha elegido “Debajo”, porque ha pensado que Debajo 12,7 5,9
„ J2 elegirá “Izda.” para evitar la posibilidad de “ganar” -6.
„ Supongamos que J2 ha elegido “Dcha.”, porque ha pensado que
„ J1 ha pensado que J2 elegiría “Izda.” y, por eso,
„ J1 elegirá “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2
será “Dcha”, pues gana 9.
„ Pero podría ocurrir que J1 pensase que J2 elíjese “Dcha”, porque
„ J2 habría pensado que J1 habría pensado que
„ J2 elegiría “Izda.” y, por eso,
„ J1 elegiría “Debajo”… y cuando J1 elige “Debajo”, la mejor respuesta de J2 será
“Dcha”, pues gana 9.
Indeterminación
„ El problema es que:
„ “Debajo” (para J1) es la mejor respuesta contra Izda. Dcha.
“Izda” (de J2)
„ “Izda” es la mejor respuesta contra “Arriba”
„ “Arriba” es la mejor respuesta contra “Dcha.” Arriba 4,5 10,-6
„ “Dcha.” es la mejor respuesta contra “Debajo”

Conclusión: Ninguna estrategia simple y fija es Debajo 12,7 5,9
mejor que otra… Si el juego se repitiese, los
jugadores cambiarían aleatoriamente sus
estrategias en cada jugada…
Para algunos juegos no existen prescripciones simples...
Esto es, necesitamos suponer no sólo que los jugadores son racionales, sino también
que todos los jugadores saben que todos los jugadores son racionales, y que todos
los jugadores saben que todos los jugadores saben que todos los jugadores son
racionales, y así ad infinitum…

Este juego tal y como está formulado queda indeterminado… lo podremos resolver
más adelante
Indeterminación
„ El problema es que:
„ “Debajo” (para J1) es la mejor respuesta contra Izda. Dcha.
“Izda” (de J2)
„ “Izda” es la mejor respuesta contra “Arriba”
„ “Arriba” es la mejor respuesta contra “Dcha.” Arriba 4,5 10,-6
„ “Dcha.” es la mejor respuesta contra “Debajo”

Conclusión: Ninguna estrategia simple y fija es Debajo 12,7 5,9
mejor que otra… Si el juego se repitiese, los
jugadores cambiarían aleatoriamente sus
estrategias en cada jugada…
¿por qué no simplemente suponer que todos los jugadores saben que todos los
jugadores son racionales? Cuando un jugador conoce las reglas no emprende o
asume algunos comportamientos. Sin embargo, si ese mismo jugador no está seguro
de que los demás jugadores saben que él conoce las reglas, no estará seguro de que
los demás jugadores sepan que él no emprenderá ni asumirá dichas
comportamientos. Este tipo de incertidumbre genera dudas en la mente de los
jugadores y modifica dramáticamente lo que cada uno termina por hacer. De aquí la
importancia de suponer información de dominio público en todos los niveles (ad
infinitum).
Considera este juego…
Izda. Dcha.
„ Piensa que harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
„ ¿Y si fueras el jugador de columnas?
Arriba 4,3 3,0
„ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra


interpretación…
Debajo 12,8 5,4
Dominancia
„ Una estrategia domina estrictamente a otra cuando es mejor elección
independiente de la elección del otro jugador.
„ Un jugador siempre elige estrategia no dominada y tacha las
estrategias dominadas.

„ Para el jugador 1 la estrategia “Debajo” domina


la “Arriba” (tachada) porque 12 > 4 y 5 > 3. Izda. Dcha.
„Para el jugador 2 la “Izda.” domina “Dcha.”
(tachada) porque 3 > 0 y 8 > 4.
„La única celda no tachada es la que corresponde a Arriba 4,3 3,0
las estrategias “Debajo” y “Izda.” Entonces, las
recompensas de los jugadores son 12 y 8
respectivamente.
Debajo 12,8 5,4
Considera este juego…

„ Piensa que harías si fueras el jugador Izda. Dcha.


de las filas. ¿Que estrategia elegirías?
„ ¿Y si fueras el jugador de columnas?
Arriba 0,2 5,4
„ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra


interpretación… Debajo 10,3 3,8
Dominancia iterada
„Cada jugador predice que el otro seguirá
estrategias no dominadas

„ Es fácil comprobar que el jugador de las filas Izda. Dcha.


no tiene estrategia no dominada
„ La estrategia dominante del jugador de las
columnas es “Dcha.” Arriba 0,2 5,4

Debajo 10,3 3,8


Dominancia iterada
„Cada jugador predice que el otro seguirá
estrategias no dominadas

„ Es fácil comprobar que el jugador de las filas Izda. Dcha.


no tiene estrategia no dominada
„ La estrategia dominante del jugador de las
columnas es “Dcha.” Arriba 0,2 5,4
„ Sin embargo, el jugador de las filas elegirá
“Arriba” ya que el sabe que “Dcha.” es la
estrategia dominante del jugador de las Debajo 10,3 3,8
columnas, y así maximizará su ganancia
Considera este juego…

„ Piensa qué harías si fueras el jugador Izda. Dcha.


de las filas. ¿Que estrategia elegirías?
„ ¿Y si fueras el jugador de columnas?

„ Una vez has hecho este ejercicio abre la


Arriba 4,3 10,6
siguiente transparencia y mira nuestra
interpretación…
Debajo 12,8 5,4
Equilibrio
„En este ejemplo ninguno de los dos
jugadores tiene una estrategia dominante: Izda. Dcha.
„ Si el jugador 1 uno elige “Arriba” es
conveniente al 2 eligir “Dcha.” y
viceversa: si el 2 elige “Dcha.” el 1 Arriba 4,3 10,6
tiene que eligir “Arriba”.
„ Si el 1 elige “Debajo” el 2 tiene que
eligir “Izda.” y viceversa. Debajo 12,8 5,4

„ Asimismo, “Debajo”- “Izda.” y “Arriba”-”Dcha.” son aquellas combinaciones de


estrategias en las cuales ningún jugador pueda mejorar cambiando de estrategia,
supuesto que el otro jugador elija su estrategia.
„ Por tanto, es probable que elijan los jugadores las combinaciones de estrategias.

„ Estas estrategias se llaman equilibrios (de Nash, no cooperativos).

„ Sin embargo, la estrategia “Debajo”-”Izda.” domina a la “Arriba”-”Dcha”


Considera este juego…

„ Hasta ahora hemos analizado los juegos bajo la Izda. Dcha.


condición de que ambos jugadores tomen sus
decisiones simultáneamente.
Arriba 0,0 1,2
„ Ahora supongamos que uno de los dos

elige primero.
Debajo 2,1 0,0
„Piensa qué harías si fueras el jugador
de las filas. ¿Que estrategia elegirías?
„ ¿Y si fueras el jugador de columnas?

„ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra


interpretación…
La ventaja de elegir primero

Izda. Dcha.
„ Hay dos equilibrios: {Arriba, Dcha.} y
{Debajo, Izda.}.
„ Cada jugador prefiere uno de estos Arriba 0,0 1,2
equilibrios:
„ El jugador de las filas prefiere “Debajo” y Debajo 2,1 0,0
„ El jugador de las columnas – “Dcha.”
„ El jugador que elige el segundo no tiene
otra elección salvo acceder a la elección
del jugador que ha elegido el primero…
Considera este juego…

„ Piensa qué harías si fueras el jugador Izda. Dcha.


por filas. ¿Qué estrategia elegirías?
„ ¿Y si fueras el jugador por columnas?
Arriba 5,5 -5,10
„ Una vez has hecho este ejercicio abre la

siguiente transparencia y mira nuestra


interpretación… Debajo 10,-5 -2,-2
Los peligros de la racionalidad

Izda. Dcha.

En este ejemplo,
„1, como jugador racional, tachará la
Arriba 5,5 -5,10

estrategia “Arriba” como dominada


Debajo 10,-5 -2,-2
„2 tachará como dominada la estrategia

“Izda.”
„Los jugadores acabarán con una solución

ineficiente, pues (5, 5) es mejor que (-2, -2)…


„Es este un ejemplo del dilema del prisionero
El dilema del prisionero
„ Dos delincuentes son detenidos y
encerrados en celdas de aislamiento de
forma que no pueden comunicarse entre No Conf
ellos. Conf
„ El alguacil sospecha que han participado en
el robo del banco, delito cuya pena es 10
años de cárcel, pero no tiene pruebas. No 2,2 10,0
„ Sólo tiene pruebas y puede culparles de un Conf
delito menor, tenencia ilícita de armas, cuyo
castigo es de 2 años de cárcel.
„ Promete a cada uno de ellos que reducirá su
condena a la mitad si proporciona las Conf 0,10 5,5
pruebas para culpar al otro del robo del
banco...

Mira a la derecha la tabla de decisión con el dilema que se le plantea a


cada uno de los prisioneros que, ahora, quieren minimizar la
consecuencia relevante, el número de años en la prisión.
El dilema del prisionero
„ Como en el ejemplo No Conf
anterior el juego resulta en Conf
una decisión socialmente
ineficiente, pues a los No 2,2 10,0
Conf
delincuentes les conviene
confesar. Cada uno busca
Conf 0,10 5,5
su bien de forma egoísta,
lo que les lleva a una mala
decisión social. Caen en
una trampa (una trampa
social o dilema social)
Dilemas sociales en contexto de riesgos
adversarios

„ Considerad un contexto en el que hay dos B invierte en B no invierte


seguridad IT en seguridad
compañías interconectadas que deben
decidir si invierten o no en seguridad IT. Compañía A Ambos A incurre en
La situación queda descrita invierte en incurren en costes
seguridad costes Riesgo
cualitativamente en la tabla adjunta. A
IT Bajo riesgo relativamente
escala global, las compañías prefieren no
alto
cooperar en las cuestiones de la
seguridad jugando sus estrategias A no B incurre en Equilibrio: A,B
egoístas. Es otro ejemplo de dilema del invierte en costes evitan costes
seguridad Riesgo Riesgo alto
prisionero.
relativament
e alto
La carrera de armamento (60-80)
Considerad la relación que se formó entre
la ex-URSS y EE.UU. en los años 60: URSS
Desarmar Armar
„ Cada país puede optar por continuar EE.UU.
armándose o reducir su armamento Desarmar 3,3 1,4
„ Ambos países se dan cuenta de que
las dificultades económicas
producidas por la carrera hacen más Armar 4,1 2,2
deseable el desarme conjunto a la
carrera 1. Inferioridad militar
„ Ambos países preferirían su 2. Carrera (igualdad, con penurias)
superioridad militar a su paridad 3. Desarme mutuo
militar… ordenando las cuatro
4. Superioridad militar
situaciones posibles (1 peor, 4 mejor)
La carrera de armamento (60-80)

De nuevo, el comportamiento racional URSS


egoísta llevará a la decisión (armar, Desarmar Armar
Armar) ie la carrera de armamento EE.UU.
Desarmar 3,3 1,4

Armar 4,1 2,2

1. Inferioridad militar
2. Carrera (igualdad, con penurias)
3. Desarme mutuo
4. Superioridad militar
Formalización de conceptos
Formalizamos ahora los conceptos anteriores suponiendo
que hay n jugadores en el juego:
„ Espacio de alternativas para cada jugador:
Si – el conjunto de estrategias con que cuenta el jugador i,
donde i ∈{1,…, n} y n es el número de los jugadores
„ Alternativas para cada jugador
Sea si ∈ Si una estrategia arbitraria del espacio de
estrategias del jugador i
„ Evaluación para cada jugador
Sea (s1,…, si ,…, sn) una combinación de estrategias, y sea
ui la función de ganancias para el jugador i :
ui (s1,…, si ,…, sn) es la ganancia del jugador i si los
jugadores eligen las alternativas (s1,…, si ,…, sn)
Formalización de conceptos

„ Juego en forma normal: La representación en


forma normal de un juego con n jugadores especifica
los espacios de estrategias de los jugadores S1, ... ,Sn
y sus funciones de ganancias u1, . . . ,un.
„ Denotamos este juego mediante G = {S1, ... ,Sn; u1,…
,un}.
Ejemplo de juego en forma normal
„ Consideremos el juego de la transparencia 12.
„ Hay 2 jugadores (F y C)

„ Los espacios de estrategias son

Sf={A,D}, Sc={I,D}
„ Las funciones de pago son

uf (A,I)=3, uf (A,D)=1,uf (D,I)=4, uf (D,D)=3


uc (A,I)=2, uc (A,D)=5,uc (D,I)=7, uc (D,D)=1
Ejemplo de juego en forma normal
„ Consideremos un juego en forma normal con tres
jugadores 1, 2, 3. Sus conjuntos estratégicos son
S1 =S2=S3=[0, 1].
„ Sus funciones de pago son:
u1(x,y,z)=x+y-z, u2(x,y,z)=x-yz, and u3(x,y,z)=xy-
z,
donde para simplificar s1 = x, s2 = y, s3 = z.
„ Si los jugadores anuncian las estrategias x = ½, y
= 0 y z=1/4, entonces sus ganancias serán:
Formalización. Estrategia no dominada
„ Solución no dominada:
En el juego en forma normal, sean si’ y si’’
posibles estrategias del jugador i . La estrategia si’ está
dominada por la estrategia si’’ si para cada combinación
(s1, ... ,si -1, si +1, ... ,sn) que puede ser construida a partir de
los espacios de estrategias de los otros jugadores S1, ... ,Si -1,
Si +1, ... ,Sn, la ganancia de i por utilizar si’ es estrictamente
menor que la ganancia de i por utilizar si’’ :
ui (s1, ... ,si -1, si’, si +1, ... ,sn) < ui (s1, ... ,si -1, si’’, si +1, ... ,sn)
„ Los jugadores racionales no utilizan estrategias estrictamente
dominadas, debiendo centrarse en las estrategias no
dominadas.
Formalización. Equilibrio de Nash
„ Equilibrio de Nash:
En el juego en forma normal de n jugadores las estrategias s1*, …, sn*
forman un equilibrio de Nash si, para cada jugador i, si* es la mejor
respuesta del jugador i (o al menos una de ellas) a las estrategias de los
otros n - 1 jugadores, (s1*, ... ,si*-1, si*+1, ... ,sn*):

ui (s1*, ... ,si*-1, si*, si*+1, ... ,sn*) ≥ ui (s1*, ... ,si*-1, si, si*+1, ... ,sn*)

para cada posible estrategia si ∈ Si ; esto es, si es una solución de


max ui (s1*, ... ,si*-1, si, si*+1, ... ,sn*)
s.a. si ∈ Si

Ningún jugador tiene incentivos para abandonarlo unilateralmente


Función de mejor respuesta

Un concepto clave aquí es el de mejor respuesta: Supuesto que conozco


las decisiones tomadas por las otras partes, cuál es mi mejor alternativa,
mi mejor respuesta?

La correspondiente función se denomina función de respuesta

Un equilibrio de Nash se corresponde al cruce de funciones de respuesta:


Una estrategia es un equilibrio si para cada jugador, toda estrategia en el
soporte del equilibrio es una mejor respuesta a la estrategia
complementaria.
Función de mejor respuesta

„ Considerad el ejemplo adjunto


„ Observad que ninguna estrategia de
ninguno de los jugadores es dominada C1 C2 C3
„ Calculad las mejores respuestas del F1 1,4 2,2 2,3
jugador de filas y del jugador de
columnas, antes de pasar a la siguiente F2 3,1 1,5 4,1
transparencia
F3 2,0 3,4 1,2

„ Para buscar los equilibrios de Nash


en juegos de forma normal se usan
las funciones de mejores
respuestas, construidas para cada
jugador. Hazlo antes de pasar
Función de mejor respuesta
„ Equilibrio de Nash. Otro
„ Observad que ninguna estrategia de ejemplo
ninguno de los jugadores es dominada
„ Denotamos la función de mejor respuesta C1 C2 C3
del jugador 1 cuando el jugador 2 elige Ci
F1 1,4 2,2 2,3
como r1(Ci), de manera que
„ F2 = r 1(C1) F2 3,1 × 1,5 4,1 ×
„ F3 = r 1(C2) × 1,2
F3 2,0 3,4
„ F2 = r 1(C3)
„ (las mejores respuestas del J1 marcamos
con ×)
„ Para buscar los equilibrios de Nash
en juegos de forma normal se usan
las funciones de mejores
respuestas, construidas para cada
jugador.
Función de mejor respuesta
„ Equilibrio de Nash. Otro
„ Análógamente, construimos la función de ejemplo
mejor respuesta del jugador 2:
„ C1 = r 2(F1) C1 C2 C3
„ C2 = r 2(F2) F1 1,4 2,2 2,3
„ C2 = r 2(F3) ×
F2 3,1 × 1,5 ×
„ (las mejores respuestas del J2 marcamos × 4,1
con ×) F3 2,0 3,4 × 1,2
„ Vemos que F3 = r 1(C2) y C2 = r 2(F3), es ×
decir (F3, C2) es el equilibrio de Nash. No
hay otras celdas con dos cruces ⇒ no hay
más equilibrios…
Función de mejor respuesta
„ Equilibrio de Nash

Considerad ahora este ejemplo. Calculad el


C1 C2
equilibrio de Nash y las funciones de
mejor respuesta
F1 -1,1 1,-1

F2 1,-1 -1,1
Función de mejor respuesta
„ Equilibrio de Nash

Consideramos otro ejemplo


C1 C2
„ Aquí, como en el ejemplo anterior las
mejores respuestas
„ del jugador “filas” marcamos con ×, F1 -1,1 1,-1 ×
×
„ y las del jugador “columnas” - con ×
F2 1,-1 × -1,1
„ No existe celda que contenga dos cruces,
×
así que no existe el equilibrio de Nash en
estrategias puras…
Estrategia pura, estrategia mixta

Hasta ahora nos hemos fijado sólo en estrategias puras: I, D, A, D,….


Pero es concebible (y en cierta forma necesario) considerar estrategias
mixtas que son distribuciones de probabilidad sobre las estrategias puras.
Por ejemplo, el jugador por filas podría considerar una estrategia mixta que
fuese (2/3, 1/3) que se interpreta como: Juego A con probabilidad 2/3 y
Juego D con probabilidad 1/3.
En particular la estrategia (1,0) del jugador por filas (Juego A con
probabilidad 1, Juego D con probabilidad 0) coincide con la estrategia A:
Las estrategias puras son casos particulares de las estrategias mixtas
Estrategia pura, estrategia mixta
„

A partir de la matriz de pagos,


C1 C2
construimos los pagos de las
estrategias mixtas, como ilustramos
en el ejemplo último. Consideramos F1 -1,1 1,-1 ×
las estrategias mixtas (p,1-p) para el ×
jugador por filas y (q,1-q) para el × -1,1
F2 1,-1
jugador por columnas. ×

Lo ilustramos para el jugador por filas:


•Con probabilidad p juega F1 y espera ganar ( q * (-1))+((1-q) *1)
•Con probabilidad (1-p) juega F2 y espera ganar (q* 1)+ ((1-q) * (-1))
En total espera ganar p*(1-2q)+(1-p)*(2q-1)=2p+2q-4pq-1
Calcula lo que espera ganar el jugador por columnas
Formalización de conceptos
„ Derivemos de forma más general la mejor respuesta del jugador i a la
estrategia mixta del jugador j.
„ Sea J el número de estrategias puras en S1 y K el número de estrategias puras
en S2
„ Escribimos S1= { s11, ... ,s1J} y S2 = { s21, ... ,s2K}, y utilizamos s1j y s2k para
denotar las estrategias puras s de S1 y S2 respectivamente.
„ Si el jugador 1 cree que el jugador 2 utilizará las estrategias (s21, ... ,s2K) con
probabilidades p2 = (p21, ... ,p2K), la ganancia esperada del jugador 1 por utilizar
la estrategia mixta p1 = (p11, ... ,p1J) es

donde p1j p2k es la probabilidad de que 1 utilice s1j y 2 utilice s2k.


„ Para que la estrategia mixta (p11, ... ,p1J) sea mejor respuesta del jugador 1 a la
estrategia mixta p2 del jugador 2, debe cumplirse que p1j > 0 sólo si
Formalización de conceptos
„ Hacemos el mismo análisis para el jugador 2, cuya ganancia
esperada por utilizar la estrategia mixta (p21, ... ,p2K) cuando el
cree que el jugador 1 utilizará la estratégia mixta (p11, ... ,p1J), es

„ Para que el par de estrategias mixtas (p1* ,p2*) forme un


equilibrio de Nash, p1* debe cumplir
(1)

para cada distribución de probabilidad p1 sobre S1, y p2 debe


cumplir
(2)
para cada distribución de probabilidad p2 sobre S2.
Formalización de conceptos. Resultados
„ En un juego en forma normal de con n jugadores
G ={S1, ... ,Sn; u1, ... ,un}, si n es un número finito y Si
es finito para cada i, existe al menos un equilibrio de
Nash, que posiblemente incluye estrategias mixtas.
Cálculo de equilibrio de Nash
Ilustramos los cálculos
C1 C2
Con el siguiente ejemplo
q 1-q
„ Supongamos que jugador F1 p 2,2 3,4
1 cree que jugador 2
elegirá C1 con F2 1-p 1,3 5,1
probabilidad q y C2 con
probabilidad 1-q.
„ y que jugador 2 cree que Calcula las funciones de pagos
jugador 1 elegirá F1 con
probabilidad p y F2 con
probabilidad 1-p.
Cálculo de equilibrio de Nash
Supongamos que jugador 1
„ C1 C2
cree que jugador 2 elegirá C1 q 1-q
con probabilidad q y C2 con
probabilidad 1-q. F1 p 2,2 3,4
„ y que jugador 2 cree que F2 1-p 1,3 5,1
jugador 1 elegirá F1 con
probabilidad p y F2 con
probabilidad 1-p.
„ La ganancia esperada del jugador 1 será:
„ u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),
„ La ganancia esperada del jugador 1 será:
„ u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),

Calcula las mejores respuestas de cada jugador


Cálculo de equilibrio de Nash
„Supongamos que jugador 1 C1 C2
cree que jugador 2 elegirá C1 q 1-q
con probabilidad q y C2 con
probabilidad 1-q. F1 p 2,2 3,4
„ y que jugador 2 cree que F2 1-p 1,3 5,1
jugador 1 elegirá F1 con
probabilidad p y F2 con
probabilidad 1-p.
„ La ganancia esperada del jugador 1 será:
„ u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),
„ o sea, la ganancia u1(p,q) es creciente en p si q > 2/3 y decreciente si q <2/3.
„ Así, la mejor respuesta del jugador 1 es F1 si q > 2/3 y F2 si q <2/3.
„ La ganancia esperada del jugador 1 será:
„ u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),
„ o sea, la ganancia u2(p,q) es creciente en q si p < 1/2 y decreciente p > 1/2.
„ Así, la mejor respuesta del jugador 2 es C1 si p < 1/2 y C2 si p > 1/2.
Cálculo de equilibrio de Nash
C1 C2
„ Las mejores
F1 2,2 3,4
respuestas se
F2 1,3 5,1
puede representar
gráficamente.
p

„ La estrategia del jugador 1 es


„ F1 si q > 2/3 y
„ F2 si q <2/3.
„ F1 o F2 (cualquiera estrategia) si q =2/3

2/3 1 q
Cálculo de equilibrio de Nash
C1 C2
„ Las mejores
F1 2,2 3,4
respuestas se
F2 1,3 5,1
puede representar
gráficamente
p

„ La estrategia del jugador 2 es 1/2


„ C1 si p < 1/2 ,
„ C2 si p > 1/2 y
„ C1 o C2 si p = 1/2.
1 q
Cálculo de equilibrio de Nash
„ Las mejores respuestas se C1 C2
puede representar
gráficamente. En esta F1 2,2 3,4
representación a los F2 1,3 5,1
equilibrios de Nash les
corresponden las cruces de
las funciones de respuestas p
„ La estrategia del jugador 1 es
„ F1 si q > 2/3 y
„ F2 si q <2/3.
F1 o F2 si q =2/3
1/2
„

„ La estrategia del jugador 2 es


„ C1 si p < 1/2 y
„ C2 si p > 1/2.
„ C1 o C2 si p = 1/2. 2/3 1 q
„ El punto (q, p) = (2/3, 1/2)
es el equilibrio de Nash en
estrategias mixtas
Cálculo de equilibrio de Nash

„ El razonamiento se podría
C1 C2
generalizar a este caso.
F1 a1,b1 a2,b2

F2 a3,b3 a4,b4

„ Calculamos utilidades esperadas para cada agente


„ Calculamos mejores respuestas para cada agente
„ Buscamos cruces de las funciones de respuesta

„ Pero para matrices 3x3 se empieza a complicar…


Test Equilibrio de Nash (para el caso
continuo)
Y si aprovechamos las condiciones de optimalidad
(Recuerda la asignatura de Métodos de Optimización)?

Sea G un juego en forma estratégica cuyos conjuntos de estrategias son


los intervalos abiertos con las funciones de pago dos veces
diferenciables.
Supongamos que el perfil estratégico (s1*, …, sn*) satisface:
∂ui ( s1* ,..., sn* )
= 0 para cada jugador i,
∂si
cada s1* es el único punto estacionario de la función
ui (s1*, ... ,si*-1, si, si*+1, ... ,sn*), si ∈Si . Si,
∂ 2ui ( s1* ,..., sn* )
< 0 para cada i.
∂ si
2

Entonces (s1*, …, sn*) es el equilibrio de Nash del juego G.


Ejemplo Test Equilibrio de Nash
„ Consideremos un juego en forma estratégica con tres jugadores 1,
2, 3.
„ Los conjuntos estratégicos son
S1 =S2=S3=[0, +∞].
„ Sus funciones de pago son:

„ Para encontrar el equilibrio de Nash debemos resolver el sistema


de ecuaciones:

„ Al calcular las derivadas obtendremos:


Ejemplo Test Equilibrio de Nash
„ De manera que tenemos que resolver el sistema de ecuaciones:

„ Resolviéndola, obtendremos x = y = z =1.


„ Al calcular las segundas derivadas obtendremos:

„ Para cualquiera elección x, y, z > 0.


„ Entonces, (1, 1, 1) es el equilibrio de Nash (único).
Ejemplo Test equilibrio de Nash
En nuestro ejemplo anterior
„Supongamos que jugador 1 C1 C2
cree que jugador 2 elegirá C1 q 1-q
con probabilidad q y C2 con
probabilidad 1-q. F1 p 2,2 3,4
„ y que jugador 2 cree que F2 1-p 1,3 5,1
jugador 1 elegirá F1 con
probabilidad p y F2 con
probabilidad 1-p.
„ La ganancia esperada del jugador 1 será:
„ u1(p,q) = p (2q+3(1-q)) + (1-p)(1q+5(1-q)) = (5 - 4q) + p(3q -2),
„ La ganancia esperada del jugador 1 será:
„ u2(p,q) = q(2p+3(1-p)) + (1-q)(4p +1(1-p)) = (3p +1) + 2q (1-2p),
„ El punto estacionario de la derivada primera de u1 es 2/3
„ El punto estacionario de la derivada segunda de u2 es ½
„ Y comprobáis que es equilibrio de Nash
Ejemplo Test Equilibrio de Nash

„ Aplicad el test introducido para calcular el


equilibrio de Nash en el ejemplo de la
transparencia 46. Podéis hacerlo por
parejas.
„ Envíanos la solución por email (puedes
hacerlo a mano y escanearlo) antes del
día 23 de Febrero a las 18.00 hora de
Madrid.
Aplicación Política

Puedes saltar esta sección, aunque es muy interesante. Ponemos uno de


los ejemplos de uso político del concepto de equilibrio de Nash: El
teorema del votante de la mediana. Viene a explicar por qué el
centro político es tan codiciado en unas elecciones.
Para más información véase
http://en.wikipedia.org/wiki/Median_voter_theory
Aplicación: Por qué el centro político es
tan codiciado

„ Supongamos que
„ las preferencias de los votantes se distribuyen uniformemnte en una sola
dimensión, a lo largo del espectro ideológico de izquierda (0) a derecha
(1).
„ Hay dos candidatos
„ Cada votante vota al candidato que esté más cercano a su posición
ideológica
„ Bajo estas condiciones, predeciremos la posición ideológica de los
candidatos…
„ Podemos ver la situación como un juego estratégico entre dos
jugadores – los candidatos
„ El conjunto de las estrategias de cada jugador es [0, 1]
„ Las función de pago para cada jugador es la parte del electorado que le
vota.
Aplicación: Por qué el centro político es
tan codiciado
„ Las funciones de pago de los jugadores son las siguientes:
⎧ a1 + a2 ⎧ a1 + a2
⎪ 2 si a1 < a2 ⎪1 − 2 si a1 < a2
⎪ ⎪
u1 (a1 , a2 ) = ⎨0.5 si a1 = a2 u2 (a1 , a2 ) = ⎨0.5 si a1 = a2
⎪ a +a ⎪a + a
⎪1 − 1 2 si a1 > a2 . ⎪ 1 2 si a1 > a2 .
⎩ 2 ⎩ 2
„ En efecto,
„ Consideremos el perfil estratégico (a1, a2), con a1 < a2
„ Las ideologías más cercanas a a1 que a2 se representan con el
intervalo [0, (a1+a2)/2]. Eso quiere decir que (a1+a2)/2 -ecima parte
del electorado votará por el candidato 1.
„ Análogamente, [ (a1+a2)/2, 1] representa las ideologías más cercanos
al a2 que al a1. Asimismo, 1 - (a1+a2)/2 -ecima parte votará por el
candidato 2.
Aplicación: Por qué el centro político es
tan codiciado

El teorema del votante de la mediana dice:

„ Se puede mostrar que el único equilibrio de Nash de este juego


es (1/2, 1/2).

„ De manera que, en las condiciones mencionadas, cada candidato


intenta atraer al votante que está en el centro de la distribución
del espectro ideológico.

El resultado se debe a Anthony Downs


http://en.wikipedia.org/wiki/Anthony_Downs
Aplicación: Duopolio de Cournot
Puedes saltar esta parte, aunque es interesante.
Explicamos una importante aplicación económica del
concepto de equilibrio de Nash

Cournot introdujo este ejemplo de mercado en 1838 y


descubrió su equilibrio, muchos años antes que Nash
introdujese su concepto.

Es un modelo fundamentl en teoría de la organización


industrial

Mira sobre el modelo del duopolio de


Cournot en Wikipedia
Aplicación: Duopolio de Cournot

Dos empresas producen un mismo producto y compiten


por un mercado. Sean
„ q1 y q 2 las cantidades producidas,
„ P(Q) = a – Q es el precio del producto, donde Q = q1 +
q 2.
„ ciqi el coste de producción por la empresa i, suponemos
que ci < a.
Las empresas eligen sus producciones de forma
simultánea.
Cuánto debe producir cada empresa para maximizar
beneficio
Aplicación: Duopolio de Cournot
„ Traducimos el problema a un juego en forma normal:
„ Dos jugadores – dos empresas
„ Espacio de estrategias: Si = [0,∞) (el producto es
continuamente divisible)
„ Las ganancias de las empresas son:
ui (q i, q j ) = q i (P(q i + q j ) – ci)= q i (a - (q i + q j ) – ci)
„ El par de estrategias (s1*, s2*) forma un equilibrio de
Nash si,
„ para cada jugador
ui (si*, sj*) ≥ ui (si , sj*)
para cada posible estrategia si de Si .

„ para cada jugador s*i es una solución del problema


max ui (si, sj) (*)
s.a. si ∈Si
Aplicación: Duopolio de Cournot
„ La condición de primer orden del problema (*) es
necesaria y suficiente ,con lo que se obtiene:
q 1* = 1/2(a-q2* - c1)
Y
q 2* = 1/2(a-q1* - c2)
de donde obtenemos:

q 1* = (a+c2-2c1)/3

q 2* = (a +c1-2c2)/3
Críticas
Indudablemente, el concepto de equilibrio de Nash es muy importante, ha
conllevado importantes aplicaciones políticas, económicas, biológicas,…. pero
tiene sus críticas
„ Hipótesis de conocimiento común:
„ la hemos formulado aquí.
„ Equilibrios múltiples
„ A veces hay más de un equilibrio y puede ser difícil elegir entre ellos.
„ Dilemas sociales
„ El dilema de prisionero tiene muchas “implicaciones prácticas” donde los
jugadores acaban con unas estrategias socialmente ineficientes.
„ No ‘sirven’ para dar consejo a una de las partes
„ En algunos juegos sería útil comunicarse antes de empezar el juego; en
otros no, para no estar amenazado; en algunos juegos mejor esperar al
otro jugador para que sea el primero, en otros mejor dar el primer paso…
En general, sirven más bien para hacer una predicción del juego,
supuesto que conocemos las preferencias de ambos participantes,…
Análisis asimétrico presc/desc
„ Este juego es “casi como” el juego de
la transparencia “Equilibrio”,
Izda. Dcha.
„ pero en este juego el jugador de las
columnas (J2) arriesga “ganar” -100.
„ Por eso, J2 podrá pensar elegir “Dcha”
Arriba 4,-100 10,6
para protegerse
„ J1 podrá intuir lo que piensa J2 y Debajo 12,8 5,4
elegir “Arriba”…
„ pero, ¿Hay alguna posibilidad de
cuantificar las dudas de los jugadores?

„ Podríamos intentar aplicar ideas del Análisis de Decisiones…


Análisis asimétrico presc/desc
„Consideremos el problema del jugador J2
desde el punto de vista del análisis de
decisiones Izda. Dcha.
„ Supongamos que J1 elige
„ “Arriba” con una probabilidad p, y Arriba 4,-100 10,6
„ “Debajo” con 1-p.
„ Entonces, la utilidad esperada del J2 es
„ -100p + 8(1-p) = 8 – 108p para “Izda.” y
Debajo 12,8 5,4
„ 6p + 4(1-p) = 4 – 2p para “Dcha.”
„ Así que, la probabilidad de equilibrio se encuentra al resolver la ecuación
8 – 108p = 4 – 2p, o p = 0.036.
„ Así que J2 debe elegir “Dcha.” si el piensa que la probabilidad de que J1 elija “Arriba”
es más que 0.036
„ Un análisis similar se puede efectuar para J1
„ J1 debe elegir “Abajo” si el piensa que la probabilidad de que J2 elija “Dcha.” es más
que 0.38
Actividad
„ Para el juego de piedra papel tijera en forma
normal
„ Calcula equilibrio de Nash.
„ Interpretar solución.
„ Podéis hacerlo por parejas.
„ Envíanos la solución por email (puedes hacerlo a
mano y escanearlo) antes del día 23 de Febrero
a las 18.00 hora de Madrid.
„ Pf haced un único envío con los dos ejercicios
planteados en este capítulo
Punto final
Alguna pregunta más?

Hacédnoslas mediante el correo electrónico interno del


Master.

Dos buenas fuentes para este capítulo son

Gibbons. Game Theory for Applied Economists (hay


versión en Español)
Aliprantis, Chakrabarti. Games and Decision Making

You might also like