Notes sur la théorie de la décision et des jeux - 2° partie, Notes de Management
Sylvestre_Or
Sylvestre_Or10 January 2014

Notes sur la théorie de la décision et des jeux - 2° partie, Notes de Management

PDF (224.5 KB)
10 pages
199Numéro de visites
Description
Notes de gestion sur la théorie de la décision et des jeux - 2° partie. Les principaux thèmes abordés sont les suivants: Remarques, la forme normale d'un jeu, Exemples, Définitions, jeux répétitifs.
20points
Points de téléchargement necessaire pour télécharger
ce document
Télécharger le document
Aperçu3 pages / 10
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Aperçu avant impression terminé
Chercher dans l'extrait du document

Nous voyons donc que 54% du temps la société de conseil prévoit de la concurrence (quelque

soit l'issue réelle) et 46% du temps aucune concurrence (quelque soit l'issue).

Nous avons alors l'arbre de décision suivant dans un logiciel comme TreeAge:

(13)

Ce qui donne après calculs:

(14)

Nous nous retrouvons donc avec une espérance de gain de 13 millions moins les 1 million de

paiement pour la société de conseil cela fait 12 millions.

Ainsi la valeur de l'information imparfaite est de 2 millions par rapport aux 4.8 que rapporte

l'information parfaite. Ce résultat est donc tout à fait logique.

Remarques:

R1. Ce type d'arbre est souvent utilisé en pharmacoéconomie (analyse des coûts). Ainsi, la racine

sera une infection X dont il existe plusieurs antibiotiques (branche A/B) et dont chacun à deux

issues (traîtement réussi/raté) avec deux résultats possibles (effets secondaires oui/non). Pour

chaque noeud une probabilité est associée et pour les noeuds terminaux des coûts de traîtement.

Ainsi, en calculant l'espérance, il est possible de déterminer le choix économique du meilleur

antibiotique pour l'institut médical (évidemment c'est utile déontologiquement que lorsque le

taux de succès des deux antibiotiques est proche et que le taux d'effets secondaires oui/non l'est

aussi... sinon cette méthode ferait scandale!).

R2. Dans l'industrie, mes clients utilisent ces arbres avec des distribution de probabilités définies

sur chaque noeud. Ils font ensuite une simulation de Monte-Carlo sur l'ensemble et font une

analyse de la sensibilité (graphe Tornado) avec des suites décisionnelles comme celle de @Risk

de Palisade.

FORME NORMALE d'un jeu

Pour passer à la forme normale ou encore "forme stratégique", nous définissons une stratégie

comme un plan d'action complet pour chaque joueur, qui spécifie un choix pour chaque noeud

de l'arbre et donc pour chaque situation pouvant survenir au cours du jeu. La "matrice des

gains" représente la situation stratégique des joueurs et le gains qu'ils recevront pour chaque

stratégie.

Nous reprenons l'exemple précédent MAC/CAM et obtenons:

J1 / J2 CAM MAC

CAM 600 , 200 100 , 100

MAC 100 , 100 200 , 600

Tableau: 3 - Matrice des gains d'un jeu à somme non nulle

Il s'agit donc d'une simple forme tabulaire du jeu.

Remarques:

R1. Nous voyons dans cette matrice que les intérêts des deux entreprises ne sont pas

complètement opposées, elles progressent à chaque fois dans la même direction lorsque les

stratégies sont opposées (si un perd, l'autre perd aussi et inversement). Ainsi, le jeu MAC/CAM

est un jeu dont les gains ne progressent pas dans des directions (stratégies) opposées. Nous

parlons alors de "jeux non strictement compétitif" (nous définirons ce concept de manière

formelle un peu plus loin).

R2. Nous voyons également que quelque soit la stratégie choisie par un des joueurs, chaque

choix possible par l'autre joueur aménera toujours à des gains équivalents. Dès lors, nous disons

qu'il que c'est un "jeu sans tactique prudente".

Définition: Une stratégie donnée est dite à "tactique prudente" (c'est le choix du numéro de la

ligne pour le joueur ligne, ou le numéro de la colonne pour le joueur colonne) lorsque le gain

d'un des joueurs est tel que lorsque par rapport à une stratégie choisie, l'ensemble des choix

de son concurrent apporte un gain maximal à ce dernier. Le gain minimal assuré de est

appelé le "niveau de sécurité" de .

Exemple:

J1 / J2 b1 b2 b3 b4

a1 5 , 5 6 , 4 0 , 10 4 , 6

a2 1 , 9 7 , 3 5 , 5 6 , 4

a3 6 , 4 7 , 3 7 , 3 8 , 1

a4 4 , 6 8 , 1 0 , 10 2 , 8

a5 3 , 7 5 , 5 9 , 0 0 , 10

Tableau: 4 - Matrice des gains d'un jeu avec tactique prudente

Le joueur A peut penser que le joueur B est très perspicace, ou a beaucoup de chance, et est

ainsi en mesure de choisir la meilleure réponse possible à toute tactique de A.

Ainsi :

- Si A choisit a1, B le devinant choisirait b3, et A aurait gagné 0

- Si A choisit a2, B le devinant choisirait b1, et A aurait gagné 1

- Si A choisit a3, B le devinant choisirait b1, et A aurait gagné 6

- Si A choisit a4, B le devinant choisirait b3, et A aurait gagné 0

- Si A choisit a5, B le devinant choisirait b4, et A aurait gagné 0

Le choix prudent de A est donc a3, qui lui assure de gagner au moins 6. Ce gain minimal assuré

est le niveau de sécurité. En faisant de même pour B s'il redoute l'extrême perspicacité

de A est b1. Cette tactique lui assure un gain de 4, qui est aussi son niveau de sécurité.

Si nous étudions le jeu MAC/CAM par sa matrice de gains, nous pouvons nous rendre compte

qu'il y a deux issues remarquables où le gain des deux entreprises est maximum par rapport

aux autres stratégies. Ces deux issues sont intéressantes à plus d'un titre :

Effectivement, les deux entreprises n'ont aucun regret quant à leur choix de stratégie. S'ils

considèrent la stratégie de leur adversaire comme inéluctable, leur propre choix de stratégie est

le meilleur possible. Nous disons que les deux issues sont des "équilibres de Nash" (nous

définirons ce concept de manière formelle un peu plus loin). L'équilibre de Nash caractérise

ainsi en quelque sorte la rationalité individuelle!

Remarque: Le jeux MAC/CAM comporte deux équilibres de Nash. Dès lors, nous ne sommes

pas capables, sans aucune information complémentaire, de prédire quelle sera exactement la

solution du jeu. Les deux résultats sont également vraisemblables.

C'est ainsi que la théorie des jeux fait apparaître la stratégie sociale la plus favorable aux deux

joueurs : que les deux joueurs adoptent aux moins le même système. Quant à savoir lequel... le

jeu devra dès lors être non-coopératif.

Dans l'exemple précédent aussi, la conjonction des tactiques prudentes (a3,b1) constitue un

équilibre de Nash (dans le sens où chacun des joueurs n'a pas intérêt à changer unilatéralement

de stratégie s'il veut préserver le gain maximum). Cela tient à une particularité de ce jeu ! En

d'autres termes :

1. Il existe de nombreux jeux qui n'ont pas d'équilibre

2. Il existe de nombreux jeux qui ont des équilibres qui ne correspondent pas à la conjonction

des tactique prudentes.

Remarque: Si dans un jeu, un couple d'issues est telle qu'il est impossible d'améliorer le score de

l'un des deux joueurs sans diminuer le score de l'autre, nous disons que ces issues sont "pareto-

optimales" ou "pareto-efficientes" (nous définirons ce concept de manière formelle un peu plus

loin).

Exemple:

Dans ce jeu, deux joueurs s'affrontent à pierre, ciseaux, papier (PCP...). La forme

extensive de ce jeu est trivialement :

(15)

Pour faire apparaître la simultanéité du jeu sur la représentation, nous avons entouré les

ensembles d'informations. sait que a choisi un élément, mais il ne sait pas lequel, donc il

ne connaît pas le noeud exact où son propre choix va intervenir, et donc il est incapable de

déterminer l'issue du jeu qui va être atteinte. Le jeu est donc a "information imparfaite".

Sous forme normale, nous avons donc:

J1 / J2 Pierre Ciseaux Papier

Pierre 0 , 0 1 , -1 -1 , 1

Ciseaux -1 , 1 0 , 0 1 , -1

Papier 1 , -1 - 1 , 1 0 , 0

Tableau: 5 - Matrice des gains d'un jeu à somme nulle

Ce jeu est un jeu à somme nulle dans le sens où tout ce qui est gagné par l'un est perdu par

l'autre. En d'autres termes, nous avons déjà vu que nous pouvions parler dès lors de jeux

"strictement compétitifs".

Les jeux à somme nulle ont ceci de particulier en plus qu'il est toujours possible comme nous

l'avons déjà mentionné de les représenter par leur demi-matrice (par rapport à un seul joueur

donc) qui résume à elle seule tout le jeu puisque ce qui est gagné par ce joueur est perdu par

l'autre et inversement :

J1 / J2 Pierre Ciseaux Papier

Pierre 0 1 -1

Ciseaux -1 0 1

Papier 1 - 1 0

Tableau: 6 - Demi-matrice des gains d'un jeu avec tactique prudente

Au besoin, si les gains et pertes respectives du jeu n'ont pas le même "delta", il suffit de définir

une fonction d'utilité adéquate pour l'autre joueur tel qu'il soit toujours possible pour n'importe

quel jeu strictement compétitif où les gains ne sont pas opposés et égaux d'être mis sous la

forme d'une demi-matrice. Nous démontrerons qu'il existe une telle fonction d'utilité.

Remarque: Sur la demi-matrice d'un jeu à somme nulle, il est très facile de reconnaître s'il existe

un équilibre de Nash ou non. Par exemple :

2 0

1 3

Tableau: 7 - Demi-matrice sans équilibre de Nash

Dans ce jeu, la ligne 2 est la tactique prudente du joueur ligne et le joueur colonne choisira la

colonne 1 comme tactique prudent dans laquelle ne se trouve pas la plus grande. Dès lors, le

joueur ligne aura intrérêt à se déplacer en première ligne donc les tactiques prudentes conjointes

ne sont pas un équililibre et par ailleurs, il n'y pas d'équilibre de Nash!!

Dans le duel tactique ainsi défini, l'espérance du joueur ligne est le maximum des minimums de

lignes, c'est-à-dire le "maximin", tandis que l'espérance du joueur colonne est le minimum des

maximums de colonnes, c'est-à-dire le "minimax".

Définitions:

D1. Le "maximin", appelé aussi parfois "critière de Wald", est un critère pessimiste. Il s'agit

effectivement selon ce critère, de maximiser le résultat minimum. Pour le mettre ne oeuvre, il

convient :

- Pour chaque décision (ou stratégie), de retenir le résultat le plus faible

- Parmi, les moins bons résultats, choisir le plus élevé des moins bons résultats des différentes

stratégies.

Ce genre d'approche peut donc outre sous forme tabulaire être représentée sous la forme d'une

arbre de décision.

D2. Le "maximax", selon la même logique que le critère précédent consiste à retenir le meilleur

des résultats des différentes stratégies possibles, c'est donc un critère optimiste. Pour le mettre

ne oeuvre, il convient :

- Pour chaque décisions (ou stratégie), de retenir le résultat le plus attendu le plus élevé

- Parmi, les meilleurs résultats, choisir le plus élevé des meilleurs résultats des différentes

stratégies.

Ce genre d'approche peut donc outre sous forme tabulaire être représentée sous la forme d'une

arbre de décision.

Si et seulement si le maximin est égal au minimax, leur valeur commune, qui est l'espérance

commune aux deux adversaires, est appelée la "valeur du jeu" (nous le démontrons juste

quelques lignes en-dessous), et tout couple formé par une telle tactique prudente du joueur

ligne et une tactique prudente du joueur colonne défini un équilibre (pour cette raison

l'exemple précédent n'a pas d'équilibre).

Exemple:

2 4

1 3

0 4

Tableau: 8 - Demi-matrice avec équilibre de Nash

Dans ce jeu, la ligne 1 est la meilleure tactique prudente du joueur ligne et le joueur colonne

choisira la colonne 1 comme tactique prudente dans laquelle se trouvent les plus petites pertes.

Dès lors, la cellule supérieure gauche correspond aux tactiques prudentes conjointes et

correspond comme nous le voyons à un équilibre de Nash.

Définition: Dans un jeu à somme nulle, nous appelons "col" l'utilité (vue dans le sens du gain ou

de la perte) qui est à la fois minimum dans sa ligne et maximum dans sa colonne (ce qui est le

cas de l'exemple précédent où l'équilibre est un col).

Démontrons maintenant que dans tout jeu à somme nulle, si et seulement si les niveaux de

sécurité des deux joueurs sont opposés (le minimax est égal au maximin), la conjonction des

tactiques prudentes est toujours un équilibre.

Reprenons la définition d'un couple formé :

- d'une tactique prudente pour le joueur A, lui assurant de gagner au moins

- d'une tactique prudente pour le joueur B, lui assurant de gagner au moins

Dans le cas d'un jeu à somme nulle, nous pouvons toujours redéfinir la fonction d'utilité d'un

des joueurs de manière à obtenir comme nous l'avons vu afin de pouvoir écrire la demi-

matrice. Dès lors, observons ce qu'il ce passe (en se rappelant bien que dans un tel jeu, le gain

équivaut à la perte donc par extension quand le gain est minimal pour l'un la perte est

minimale pour l'autre) :

Le couple , comme tout couple qui contient , assure A de gagner au moins v et in

extenso assureB de gagner au moins -v (puisque ).

A n'a donc aucun intérêt à s'écarter unilatéralement de , puisque B s'est assuré de perdre au

plus v dans la stratégie de A. De même, B n'a aucun intérêt à s'écarter unilatéralement de la

tactique , puisque A s'est assuré de gagner au moins v.

Par conséquent, dans le cas où les niveaux de sécurité des deux joueurs sont égaux et opposés,

la conjonction des tactiques prudentes est un équilibre.

Nous avons déjà vu précédemment un exemple dans lequel les niveaux n'étaient pas

exactement opposés.

JEUX RÉPÉTITIFS

Supposons qu'un homme et une femme aillent au cinéma, Une fois sur place, ils doivent

choisir entre aller voir un documentaire ou une comédie. L'un des deux préfère les

documentaires et l'autre les comédies, mais tous deux préfèrent voir un film ensemble que

séparément : c'est... la guerre des sexes (GDS...)

Les stratégies disponibles pour chacun des deux joueurs, en considérant qu'ils font leur choix

simultanément (ce qui est peu vraisemblable dans un cas réel, la galanterie obligeant à

désynchroniser le jeu profit de la femme :-) ), sont alors :

- Aller voir un documentaire, ce que nous noterons Doc

- Aller voir une comédie, ce que nous noterons Com

La matrice des gains sera alors :

J1 / J2 DocCom

Doc 2 , 3 1, 1

Com 1 , 1 3 , 2

Tableau: 9 - Matrice pour jeu répétitif

D'abord, nous pouvons remarquer que GDS n'est pas un jeu strictement compétitif (donc inutile

d'essayer de le représenter sous la forme d'une demi-matrice) et qu'il s'aigt d'un jeu de

coordination. Deuxièmement, nous remarquons que les deux issues à gain maximum sont des

équilibres de Nash (nous ne pouvons donc prédirie l'issue du jeu).

Ce jeu à cependant de particulier par rapport aux précédent au fait qu'il est un jeu à une seule

étape. Supposons ainsi maintenant que le couple retourne au cinéma la semaine suivante, et

qu'il doive à nouveau faire ce choix. Nous pouvons de nouveau représenter cette situation par

un jeu, qui nn'est en fait que la répétition de GDS, notons le GDS2.

GDS2 a deux étapes. Si nous considérons que lors de la deuxième étape chacun des deux

joueurs sait ce que l'autre a choisi lors de la première étape, les stratégies disponibles sont

maintenant des stratégies conditionnelles : elle peuvent tenir compte des coups joués par

l'adversaire lors des étapes précédentes.

La description de ces stratégies suit le schéma suivant : nous jouons au premier coup, puis

si l'autre a choisi le documentaire lors de la première sortie, alors nous jouons , sinon ,

avec prenant leur valeur dans l'ensemble . Nous noterons cette

stratégie :

(16)

Nous pouvons lire cette notation de la manière suivante : nous jouons , puis si nous nous

retrouvons en alors nous jouons , et si nous nous retrouvons en alors

nous jouons . Dans le cas GDS2, nous avons donc 8 stratégies :

1. : nous choisissons toujours le documentaire :

2. : nous choisissons toujours le documentaire, sauf

si la première fois nous nous sommes retrouvé(e)s seul(e)s

3. : nous choisissons toujours le documentaire, sauf

si la première fois nous avons tous les deux choisi le documentaire

4. : la première fois nous choisissons le

documentaire et la seconde la comédie.

5. : la première fois nous choisissons la comédie et

la seconde le documentaire

6. : nous choisissons toujours la comédie, sauf si

la première fois nous nous sommes retrouvé(s) seul(e)s.

7. : nous choisissons la comédie sauf si la

première fois nous avons tous les deux choisi la comédie.

8. : nous choisissons toujours la comédie.

Pour chaque issue de GDS2, les vecteurs d'utilité sont déterminés en effectuant la somme des

vecteurs obtenus pour chacune des étapes considérées comme des issues de GDS. Nous dirons

que GDS2 est un "superjeu" dont GDS est le "jeu constitutif".

Définition: Un "équilibre parfait en sous-jeux" correspond à une combinaison stratégique dont

les actions choisies pour chaque sous-jeux sont des équilibres de Nash.

Remarque: Un "sous-jeu" est simplement un sous-arbre de l'arbre de jeu.

Voyons maintenant tous ces concepts de manière ensembliste (accrochez-vous un peu ;-) )

commentaires (0)
Aucun commentaire n'a été pas fait
Écrire ton premier commentaire
Ceci c'est un aperçu avant impression
Chercher dans l'extrait du document
Docsity n'est pas optimisée pour le navigateur que vous utilisez. Passez à Google Chrome, Firefox, Internet Explorer ou Safari 9+! Téléchargez Google Chrome