纳什均衡又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。
假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略 ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(StrategyProfile)。
纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。
上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。由博弈各参与人的上策所组成的均衡,称为上策均衡。
一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。这就是上策均衡。
上策就是无论对方选哪个策略 自己都会坚持的策略
但纳什均衡是对双方而言 当给定对方的策略时 自己的策略不会改变
最经典的例子当然是囚徒困境 存在两个NE 而仅有一个上策