Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)

Table des matières:

Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)
Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)

Vidéo: Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)

Vidéo: Équilibre de Nash. Théorie des jeux pour les économistes (John Nash)
Vidéo: LA THEORIE DES JEUX (Nash,Pareto,etc...) 2024, Peut
Anonim

Dans les années 1930, John von Neumann et Oscar Morgenstern sont devenus les fondateurs d'une nouvelle et intéressante branche des mathématiques appelée "théorie des jeux". Dans les années 1950, le jeune mathématicien John Nash s'est intéressé à cette direction. La théorie de l'équilibre est devenue le sujet de sa thèse, qu'il a écrite à l'âge de 21 ans. Ainsi est née une nouvelle stratégie de jeu appelée "Nash Equilibrium", qui a remporté le prix Nobel de nombreuses années plus tard - en 1994.

équilibre de Nash
équilibre de Nash

Le long intervalle entre la rédaction d'un mémoire et la reconnaissance générale est devenu un test pour un mathématicien. Le génie sans reconnaissance a entraîné de graves troubles mentaux, mais John Nash a pu résoudre ce problème grâce à son excellent esprit logique. Sa théorie de l'équilibre de Nash a remporté un prix Nobel et sa vie a été filmée dans Beautiful mind.

En bref sur la théorie des jeux

Étant donné que la théorie de l'équilibre de Nash explique le comportement des personnes dans les conditions d'interaction, il convient de considérer les concepts de base de la théorie des jeux.

La théorie des jeux étudie le comportement des participants (agents) en termes d'interaction entre eux comme un jeu, lorsque le résultat dépend de la décision et du comportement de plusieurs personnes. Le participant prend des décisions basées sur ses prédictions sur le comportement des autres, ce qui s'appelle la stratégie de jeu.

Il existe également une stratégie dominante dans laquelle le participant obtient le meilleur résultat pour tout comportement des autres participants. C'est la meilleure stratégie gagnant-gagnant du joueur.

Dilemme du prisonnier et percée scientifique

Le dilemme du prisonnier est un cas de jeu où les participants sont obligés de prendre des décisions rationnelles, d'atteindre un objectif commun face à un conflit d' alternatives. La question est de savoir laquelle de ces options il choisira, réalisant l'intérêt personnel et général, ainsi que l'impossibilité d'obtenir les deux. Les joueurs semblent être emprisonnés dans un environnement de jeu difficile, ce qui les fait parfois penser de manière très productive.

Exemples d'équilibre de Nash
Exemples d'équilibre de Nash

Ce dilemme a été exploré par le mathématicien américain John Nash. L'équilibre qu'il a trouvé était révolutionnaire à sa manière. Cette nouvelle pensée a particulièrement influencé l'opinion des économistes sur la façon dont les acteurs du marché font des choix, en tenant compte des intérêts des autres, avec une interaction étroite et une intersection des intérêts.

Il est préférable d'étudier la théorie des jeux à travers des exemples concrets, puisque cette discipline mathématique elle-même n'est pas sèchement théorique.

Exemple du dilemme du prisonnier

Exemple, deux personnes ont commis un vol, sont tombées entre les mains de la police et sont interrogées dans des cellules séparées. Parallèlement, les policiers offrent à chaque participant des conditions favorables dans lesquelles il sera libéré s'il témoigne contre son partenaire. Chacun desles criminels ont l'ensemble de stratégies suivant qu'il considérera:

  1. Les deux témoignent en même temps et écopent de 2,5 ans de prison.
  2. Les deux se taisent en même temps et reçoivent 1 an chacun, car dans ce cas, la base de preuves de leur culpabilité sera faible.
  3. L'un témoigne et est libéré, tandis que l'autre se tait et écope de 5 ans de prison.

De toute évidence, l'issue de l'affaire dépend de la décision des deux participants, mais ils ne peuvent pas s'entendre, car ils sont assis dans des cellules différentes. Le conflit de leurs intérêts personnels dans la lutte pour un intérêt commun est également clairement visible. Chacun des prisonniers a deux options d'action et 4 options de résultats.

Chaîne d'inférences logiques

Ainsi, le délinquant A envisage les options suivantes:

  1. Je me tait et mon partenaire se tait - nous écoperons tous les deux d'un an de prison.
  2. Je dénonce mon partenaire et il me dénonce - on écope tous les deux de 2,5 ans de prison.
  3. Je me tais et mon partenaire me trahit - je vais écoper de 5 ans de prison et il sera libre.
  4. Je remets mon partenaire, mais il se tait - j'obtiens la liberté, et il écope de 5 ans de prison.

Donnons une matrice de solutions et de résultats possibles pour plus de clarté.

Tableau des issues possibles du dilemme du prisonnier.

Théorie de l'équilibre de Nash
Théorie de l'équilibre de Nash

La question est, que choisira chaque concurrent ?

"Tais-toi, tu ne peux pas parler" ou "Tu ne peux pas te taire, tu ne peux pas parler"

Pour comprendre le choix du participant, il faut parcourir la chaîne de ses pensées. Suivant le raisonnement du criminel A: si je garde le silence et que mon partenaire reste silencieux, nous recevrons une peine minimale (1 an), mais jeJe ne sais pas comment il va se comporter. S'il témoigne contre moi, alors c'est mieux pour moi de témoigner, sinon je peux m'asseoir pendant 5 ans. Je préfère m'asseoir pendant 2,5 ans que 5 ans. S'il garde le silence, alors j'ai d'autant plus besoin de témoigner, car ainsi j'obtiendrai ma liberté. Participant B.

équilibre de john nash
équilibre de john nash

Il n'est pas difficile de voir que la stratégie dominante pour chacun des auteurs est de témoigner. Le point optimal de ce jeu survient lorsque les deux criminels témoignent et reçoivent leur "prix" - 2,5 ans de prison. La théorie des jeux de Nash appelle cet équilibre.

Solution de Nash optimale non optimale

La nature révolutionnaire de la vision nashienne est qu'un tel équilibre n'est pas optimal lorsque l'on considère le participant individuel et son intérêt personnel. Après tout, la meilleure option est de garder le silence et d'être libre.

L'équilibre de Nash est un point de convergence d'intérêts, où chaque participant ne choisit l'option qui lui convient que si les autres participants choisissent une certaine stratégie.

Considérant l'option lorsque les deux criminels sont silencieux et ne reçoivent qu'un an, nous pouvons l'appeler une option optimale de Pareto. Cependant, cela n'est possible que si les criminels pouvaient s'entendre à l'avance. Mais même cela ne garantirait pas ce résultat, car la tentation de se retirer de l'accord et d'éviter la punition est grande. Le manque de confiance totale l'un envers l'autre et le danger d'être forcé pendant 5 ans à choisir l'option avec reconnaissance. Réfléchissez à ce à quoi les participants vont adhéreroption avec le silence, agissant de concert, est tout simplement irrationnel. Une telle conclusion peut être tirée si nous étudions l'équilibre de Nash. Les exemples ne font que vous donner raison.

Égoïste ou rationnel

La théorie de l'équilibre de Nash a donné des conclusions surprenantes qui ont réfuté les principes qui existaient auparavant. Par exemple, Adam Smith considérait le comportement de chacun des participants comme totalement égoïste, ce qui rééquilibrait le système. Cette théorie s'appelait la "main invisible du marché".

théorie de l'équilibre de john nash
théorie de l'équilibre de john nash

John Nash a vu que si tous les participants agissent dans leur propre intérêt, cela ne conduira jamais à un résultat de groupe optimal. Étant donné que la pensée rationnelle est inhérente à chaque participant, le choix offert par la stratégie d'équilibre de Nash est plus probable.

Expérience purement masculine

Un excellent exemple est le jeu du paradoxe de la blonde, qui, bien qu'apparemment déplacé, est une illustration claire du fonctionnement de la théorie des jeux de Nash.

Dans ce jeu, vous devez imaginer qu'une compagnie de gars gratuits est venue dans un bar. A proximité se trouve une compagnie de filles, dont l'une est préférable aux autres, disons une blonde. Comment les mecs agissent-ils pour avoir la meilleure petite amie pour eux-mêmes ?

état d'équilibre
état d'équilibre

Alors, le raisonnement des gars: si tout le monde commence à se familiariser avec la blonde, alors, très probablement, personne ne l'obtiendra, alors ses amis ne voudront pas se familiariser. Personne ne veut être la deuxième solution de repli. Mais si les garçons choisissent d'éviterblonde, alors la probabilité pour chacun des gars de trouver une bonne petite amie parmi les filles est élevée.

La situation d'équilibre de Nash n'est pas optimale pour les gars, car, ne poursuivant que leurs propres intérêts égoïstes, tout le monde choisirait la blonde. On peut voir que la poursuite des seuls intérêts égoïstes équivaudra à l'effondrement des intérêts de groupe. L'équilibre de Nash signifiera que chaque gars agit dans ses propres intérêts, qui sont en contact avec les intérêts de l'ensemble du groupe. Ce n'est pas la meilleure option pour tout le monde personnellement, mais la meilleure pour tout le monde, en fonction de la stratégie globale de réussite.

Toute notre vie est un jeu

La prise de décision dans le monde réel ressemble beaucoup à un jeu où vous attendez également certains comportements rationnels de la part des autres participants. En affaires, au travail, en équipe, en entreprise et même dans les relations avec le sexe opposé. Des grosses affaires aux situations de la vie ordinaire, tout obéit à une loi ou à une autre.

théorie des jeux de nash
théorie des jeux de nash

Bien sûr, les situations de jeu ci-dessus avec des criminels et un bar ne sont que d'excellentes illustrations qui démontrent l'équilibre de Nash. Des exemples de tels dilemmes surviennent très souvent sur le marché réel, et cela fonctionne particulièrement dans les cas où deux monopoleurs contrôlent le marché.

Stratégies mixtes

Souvent, nous ne sommes pas impliqués dans un, mais dans plusieurs jeux à la fois. Choisir l'une des options dans un jeu, guidé par une stratégie rationnelle, mais vous vous retrouvez dans un autre jeu. Après quelques décisions rationnelles, vous constaterez peut-être que votre résultat ne vous convient pas. Quoiprendre ?

Considérons deux types de stratégie:

  • La stratégie pure est le comportement du participant, qui vient de la réflexion sur le comportement possible des autres participants.
  • La stratégie mixte ou stratégie aléatoire est l' alternance de stratégies pures au hasard ou le choix d'une stratégie pure avec une certaine probabilité. Cette stratégie est également appelée randomisée.
Équilibre de Nash dans les stratégies mixtes
Équilibre de Nash dans les stratégies mixtes

Compte tenu de ce comportement, nous avons un nouveau regard sur l'équilibre de Nash. Si plus tôt il a été dit que le joueur choisit une fois une stratégie, alors un autre comportement peut être imaginé. On peut supposer que les joueurs choisissent une stratégie au hasard avec une certaine probabilité. Les jeux qui ne peuvent pas trouver les équilibres de Nash dans les stratégies pures les ont toujours dans les stratégies mixtes.

L'équilibre de Nash dans les stratégies mixtes est appelé équilibre mixte. Il s'agit d'un équilibre où chaque participant choisit la fréquence optimale de choix de ses stratégies, à condition que les autres participants choisissent leurs stratégies avec une fréquence donnée.

Penalités et stratégie mixte

Un exemple de stratégie mixte peut être trouvé dans le jeu de football. La meilleure illustration d'une stratégie mixte est peut-être une séance de tirs au but. Donc, nous avons un gardien qui ne peut sauter que dans un coin et un joueur qui tirera le pen alty.

Donc, si la première fois que le joueur choisit la stratégie de tirer dans le coin gauche, et que le gardien de but tombe également dans ce coin et attrape le ballon, comment les choses peuvent-elles évoluer la deuxième fois ? Si le joueurfrappera dans le coin opposé, c'est probablement trop évident, mais frapper dans le même coin n'est pas moins évident. Par conséquent, le gardien de but et le botteur n'ont d'autre choix que de s'appuyer sur une sélection aléatoire.

Ainsi, en alternant la sélection aléatoire avec une certaine stratégie pure, le joueur et le gardien essaient d'obtenir le résultat maximum.

Conseillé: