Adaptive learning and curb set selection
Résumé.
Nous considérons une classe générique de jeux finis à 2 joueurs. A chaque période, les agents forment des
anticipations sur les actions des autres joueurs en observant un échantillon de stratégies récentes. Puis
il joue une meilleur réponse à la distribution générée par son échantillon. En plus, les agents
expérimentent parfois avec des réponses non-optimales. En généralisant la notion d'équilibre
p-dominant, nous introduisons la notion de minimal p-curb set. Nous établissons que pour p
£1/2, au plus un minimal p-curb set existe. Nous prouvons que si un jeu
admet un minimal p-curb pour p £1/2 alors, les stratégies dans
cet ensemble seront jouées avec probabilité un dans le long terme.
Abstract.
We consider a generic class of fintie two-person games. At every period, each agent forms
expectations about his opponents play by inspecting a sample of recent strategy realizations. He
thereafter plays a best reply to the frequency distribution calculated from his sample. In addition,
the agents sometimes experiment with nonoptimal responses. Generalizing the notion of
p-dominant equilibrium, we introduce the notion of minimal p-curb set. We state that if p
£1/2 there exists at most one minimal p-curb set. We prove that
if a game admits a minimal p-curb set for p £1/2 then the
strategies in this set will be played with probability one in the long run.
JEL Classification :
C72, C73.
*CREUSET, Université de Saint-Etienne, 42023 Saint-Etienne, France. |