专利一种基于异质性声誉回报的公共品博弈建模与仿真方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210666165.7 (22)申请日 2022.06.14 (71)申请人扬州大学地址 225009 江苏省扬州市大学南路88号 (72)发明人程喆　王愚　 (74)专利代理机构南京苏高专利商标事务所 (普通合伙) 32204 专利代理师柏尚春 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 50/26(2012.01) G06F 30/20(2020.01) (54)发明名称一种基于异质性声誉回报的公共品博弈建模与仿真方法 (57)摘要本发明公开了一种基于异质性声誉回报的公共品博弈建模与仿真方法，步骤如下：构建多人公共品博弈模型；依据建模后的公共品博弈规则，以主观博弈的学习理论更新个体策略；通过将个体声誉与博弈收益相联系，构建基于异质性回报的声誉监督机制；通过多轮次的重复博弈和主观学习，构建个体主观认知矩阵。本发明针对解决多人公共品博弈领域中合作困境的问题上结合了主观博弈理论、间接互惠机制，并且通过仿真实验证实了本发明所设计的基于异质性回报的声誉监督机制改善了主观博弈学习情境下个体主观认知的形成，促进了博弈系统合作水平的提升，有助于解决群体合作问题中的搭便车行为，为现实社会中激励机制的设计提供了相应的借鉴意义。权利要求书2页说明书4页附图3页 CN 115081849 A 2022.09.20 CN 115081849 A 1.一种基于异质性声誉回报的公共品博弈建模与仿真方法，其特征在于，包括以下步骤： (1)构建多人公共品博弈模型； (2)多人主观博弈下主体策略的更新； (3)构建基于异质性回报的声誉监督机制； (4)构建主观认知矩阵。 2.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法，其特征在于，所述步骤(1)具体为：个体在初始化时被随机分配在二维网格的任意位置；博弈开始时，个体在方格子网络上随机游走，依据moore型规则挑选出n ‑1个邻居组成一个博弈小组Gl；个体只参加一个群组的公共品博弈,并且在博弈过程中只能采取相同的策略s— —合作C或背叛D。 3.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法，其特征在于，所述步骤(2)具体为： (2.1)将公共品博弈局势建模为一种固定的规则，根据每一轮博弈后，组内采取合作C 背叛D的人数以及自身的策略，将博弈规则划分为2*n种局势，每一种局势都对应一个收益值 πi；个体能够从每一轮的收益得知当前的策略分布情况； (2.2)个体被赋予短期记忆m，即它能够记住最近m轮博弈中所选策略s对应的收益情况；个体根据当前的博弈局势以及自身的主观认知对所采取的策略s产生相应的刺激R，刺激R经过演化产生对策略s的吸引力A，依据改进的Logistic转换方程计算下一轮策略s被选择的概率：其中，表示t时刻个体i选择策略s的概率，参数λi反映了个体i对刺激的敏感程度，表示t时刻个体i关于策略s的吸引力，吸引力由个体过去关于策略选择的主观认知所形成。 4.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法，其特征在于，所述步骤(3)具体为： (3.1)系统中的个体在博弈开始时被定义一个相同的初始声誉值；在每一轮博弈结束后，系统中所有个体的收益受到异质性回报系数θ的影响；每一轮博弈结束后个体的收益为：其中， θ 由个体声誉Rx与系统的平均声誉决定，具体形式为：其中， α 为异质性回报调节系数，取值范围是[0,1]， Rmax为系统内个体的声誉最大差值，权　利　要　求　书 1/2 页 2 CN 115081849 A 2取值为100； (3.2)每一轮博弈结束后，各博弈群组从组内随机抽取2个个体进行配对；对于被抽取的个体j1和j2，根据其本轮采取的策略来更新声誉。 5.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法，其特征在于，所述步骤(4)具体为：个体主观认知矩阵的形成受到过往经历以及正在经历的博弈局势的影响，定义k为短期记忆阈值，个体需要经历k次相同的博弈局势才能将客观博弈局势作为长期记忆储存在自身的主观认知中；因此，定义长期记忆状态矩阵为为个体i在公共品博弈中的客观博弈矩阵，定义为个体i对博弈局势的主观认知矩阵；个体i学习客观博弈局势进而形成自身主观认知的过程需要长期记忆状态矩阵的辅助，即对与进行hadamard积运算： 6.一种计算机存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求 1‑5中任一项所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法。 7.一种计算机设备，包括储存器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求 1‑5中任一项所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法。权　利　要　求　书 2/2 页 3 CN 115081849 A 3

专利 一种基于异质性声誉回报的公共品博弈建模与仿真方法

专利一种基于异质性声誉回报的公共品博弈建模与仿真方法