La Singularidad Desnuda

Un universo impredecible de pensamientos y cavilaciones sobre ciencia, tecnología y otros conundros

El Juego del Ultimatum (o cómo la avaricia rompe el saco)

Posted by Carlos en noviembre 11, 2006

Una de las situaciones más interesantes que pueden darse al analizar matemáticamente cualquier proceso en el que haya interacción y toma de decisiones por parte de actores humanos, es encontrar estrategias óptimas que sean en cierto modo contrarias a nuestra intuición. El área de la Teoría de Juegos abarca precisamente este tipo de análisis, y nos proporciona joyas matemáticas continuamente. Por ejemplo, en un triple duelo (trielo) en el que los participantes A,B y C tienen diferentes punterias pA < pB < pC, y juegan (disparan) en orden de menor a mayor punteria, la decisión más racional (asumiendo claro que un duelo a tres bandas es racional, y que todos los participantes también lo son) de A es disparar al aire y dejar que B y C se maten entre ellos (Jordi nos explica aquí por qué).

Una de las maneras más comunes de abordar el análisis de este tipo de situaciones es representarlo en lo que se conoce como forma normal. Para n jugadores, se construye una matriz n-dimensional, siendo el tamaño a lo largo de la dimensión i el número de jugadas por las que el jugador i puede optar. Cada posición de la matriz corresponde pues a una cierta combinación de jugadas por parte de todos los jugadores, y contiene la recompensa (o el castigo) que cada jugador recibe. Un ejemplo muy típico para dos jugadores es el dilema del preso. En general, si todos los jugadores han elegido una estrategia, y ninguno se beneficiaría cambiándola (asumiendo en cada caso que los demás la dejan fija), se ha alcanzado lo que se conoce como equilibrio de Nash. John Nash (el mismo de la película Una Mente Maravillosa) demostró que existen puntos de equilibrio para cualquier juego finito con cualquier número de jugadores.

Un problema interesante para el que el punto de equilibrio parece contrario a la intuición (o mejor dicho, a la conducta que desarrollaríamos en el mundo real) es el juego del ultimatum: tenemos M euros para repartir, y el jugador A le hace una propuesta al jugador B (X para mí, y M-X para ti”) que éste puede aceptar o rechazar. En el primer caso, el trato se cierra en los términos acordados; en el segundo caso, nadie gana nada. Si la unidad mínima de reparto es 1 euro, el punto de equilibrio de Nash para M=100 euros es 99 euros para A y 1 euro para B, oferta que este último aceptará ya que menos da una piedra. Pero, ¿aceptaríamos nosotros una oferta así? El cuerpo nos pide castigar de alguna manera a alguien tan egoista, incluso si perdemos algo nosotros tambien. ¿Hay alguna razón para esto? En el número de octubre de Investigación y Ciencia, y en el de junio de Matematicalia se ocupan de este asunto. Parece que una vez más el motivo de la discrepancia nos la da la confrontación de una solución estática con un sistema dinámico.

Siguiendo el modelo que A. Sánchez y J.A. Cuesta han propuesto en un artículo publicado en el Journal of Theoretical Biology, he realizado una simulaciones de un sistema en el que los individuos interaccionan de acuerdo al juego del ultimatum. Cada individuo tiene una estrategia expresada como el valor mínimo que está dispuesto a aceptar. Tras un número de tales interacciones, el individuo con menor capital es eliminado del sistema, y sustituido por una variante del individuo con mayor capital (modificando en una unidad arriba o abajo su umbral de aceptación; también cabe la posibilidad de que no se modifique). Si se toman promedios sobre un cierto número de simulaciones del sistema se obtiene lo siguiente: en las primeras fases de la evolución del sistema, el umbral de aceptación decrece desde valores medios del 50% a valores entre un 40% y un 30%. Podemos interpretar esto como una estrategia de supervivencia: si se pone el umbral muy alto no se consiguen ganancias, y la extinción es segura; pero tampoco se puede poner muy bajo, o las ganancias serán despreciables. Esto último tiene como efecto asociado que los individuos muy avariciosos tiendan a desaparecer, ya que no tienen a nadie de quien aprovecharse. Tan pronto como la población se homogeiniza con individuos cuyas estrategias permiten repartos más o menos razonables, comienza a emerger la cooperación, llegándose a un estado más o menos estable en el que el reparto es casi equitativo. Y es que es normal que el que parte se lleve la mejor parte, pero sin abusar.

Anuncios

3 comentarios to “El Juego del Ultimatum (o cómo la avaricia rompe el saco)”

  1. daphoene said

    Lo primero, felicidades por el blog, me lo anoto ;).-

    Creo que existe un problema con el juego del ultimatum. Es evidente que en este tipo de juegos se supone la participación humana, una máquina aceptaría 1, pero un humano seguramente no, por los motivos más o menos evidentes que se explican aquí. Desde ese punto de vista, hay que contar con otras variables sociales, como la explicada en wikipedia como “expected utility” ( utilidad o beneficio esperado ) tomando la validez de toda acción operativa en un ámbito más estratégico, es decir, que las reglas de este juego sólo tienen sentido -para personas- si este se engloba en un juego mayor, que es la vida, y que es la que presenta esos resultados al principio contra-intuitivos de perder una ganancia irrisoria (pero ganancia) en pro de una descalificación de una conducta exageradamente avariciosa. Lo que trato de decir es que no incumple la teoría de Nash, siempre que se plantee el juego en los términos correctos. De todos modos, este 80/20 cuasi aceptable por todos, determina en gran medida el mundo que conocemos. Quizá la riqueza de los ricos tenga implicaciones que subconscientemente nos parezcan necesarias por algún motivo, y el resultado de multiplicar ese porcentaje a lo largo del tiempo, y extendiéndolo por la población arroja una diferencia notable que en algún punto contradice esa descalificación de la avaricia inicial, y este es el tema que me parece interesante: ¿ nos engañan los órdenes de magnitud, o tenemos un algoritmo incrustado que valora la avaricia de modo distinto en distintos órdenes de magnitud por algún motivo razonable ?

  2. Carlos said

    ¡Gracias Daphoene!

    Efectivamente, el problema está en realizar un análisis estático de un problema dinámico. En realidad, la clave es que implícitamente se juega también la variante inversa del juego: si A sabe que B no aceptará menos de N euros, la estrategia óptima para él es ofrecer precisamente N. Si el adversario es fijo, la dinámica del sistema moverá a la población hacia ese punto. En un entorno coevolutivo en el que el los adversarios son los propios miembros de la población, la estrategia N=M/2 es estable a nivel de población (y estable desde el punto de vista del equilibrio de Nash, pero sólo si todos juegan contra todos; en la práctica, las perturbaciones debidas a el tamaño finito de la población y a la limitación del número de enfrentamientos producen una oscilación en torno a ese punto).

  3. […] sociales, y esto es algo que tenemos grabado a muy bajo nivel en nuestras mentes. Por ejemplo, ya se comentó hace algún tiempo un trabajo que mostraba la evolución de las conductas altruistas. Recientemente ha salido […]

Sorry, the comment form is closed at this time.

 
A %d blogueros les gusta esto: