行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210666165.7 (22)申请日 2022.06.14 (71)申请人 扬州大学 地址 225009 江苏省扬州市大 学南路88号 (72)发明人 程喆 王愚  (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 专利代理师 柏尚春 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 50/26(2012.01) G06F 30/20(2020.01) (54)发明名称 一种基于异质性声誉回报的公共品博弈建 模与仿真方法 (57)摘要 本发明公开了一种基于异质 性声誉回报的 公共品博弈建模与仿真方法, 步骤如下: 构建多 人公共品博弈模 型; 依据建模后的公共品博弈规 则, 以主观博弈的学习理论更新个体策略; 通过 将个体声誉与博弈收益相联系, 构建基于异质性 回报的声誉 监督机制; 通过多轮次的重复博弈和 主观学习, 构建个体主观认知矩阵。 本发明针对 解决多人公共品博弈领域中合作困境的问题上 结合了主观博弈理论、 间接互惠机制, 并且通过 仿真实验证实了本发明所设计的基于异质性回 报的声誉监督机制改善了主观博弈学习情境下 个体主观认知的形成, 促进了博弈系统合作水平 的提升, 有助于解决群体合作问题中的搭便车行 为, 为现实社会中激励机制的设计提供了相应的 借鉴意义。 权利要求书2页 说明书4页 附图3页 CN 115081849 A 2022.09.20 CN 115081849 A 1.一种基于异质性声誉回报的公共品博弈建模与仿真方法, 其特征在于, 包括以下步 骤: (1)构建多人公共品博 弈模型; (2)多人主观博 弈下主体策略的更新; (3)构建基于异质性回报的声誉监 督机制; (4)构建主观 认知矩阵。 2.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法, 其 特征在于, 所述 步骤(1)具体为: 个体在初始化时被随机分配在二维网格的任意位置; 博弈开始时, 个体在方格子网络 上随机游走, 依据moore型规则挑选出n ‑1个邻居组成一个博弈小组Gl; 个体只参加一个群 组的公共品博 弈,并且在博 弈过程中只能采取相同的策略s— —合作C或背叛D。 3.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法, 其 特征在于, 所述 步骤(2)具体为: (2.1)将公共品博弈局势建模为一种固定的规则, 根据每一轮博弈后, 组内采取合作C 背叛D的人数以及自身的策略, 将博弈规则划分为2*n种局势, 每一种局势都对应一个收益 值 πi; 个体能够从每一轮的收益得知当前的策略分布情况; (2.2)个体被赋予短期记忆m, 即它能够记住最近m轮博弈中所选策略s对应的收益情 况; 个体根据当前 的博弈局势以及自身的主观认知对所采取 的策略s产生相应的刺激R, 刺 激R经过演化产生对 策略s的吸引力A, 依据改进的Logistic转换方程计算下一轮策略s被选 择的概率: 其中, 表示t时刻个体i选择策略s的概率, 参数λi反映了个体i对刺激的敏感程度, 表示t时刻 个体i关于策略s的吸引力, 吸引力由个体过去 关于策略选择的主观认知所 形成。 4.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法, 其 特征在于, 所述 步骤(3)具体为: (3.1)系统中的个体在博弈开始时被定义一个相同的初始声誉值; 在每一轮博弈结束 后, 系统中所有个体的收益受到异质性回报系数θ的影响; 每一轮博弈结束后个体的收益 为: 其中, θ 由个 体声誉Rx与系统的平均声誉 决定, 具体形式为: 其中, α 为异质性回报调节系数, 取值范围是[0,1], Rmax为系统内个体的声誉最大差值,权 利 要 求 书 1/2 页 2 CN 115081849 A 2取值为100; (3.2)每一轮博弈结束后, 各博弈群组从组内随机抽取2个个体进行配对; 对于被抽取 的个体j1和j2, 根据其本轮采取的策略来更新声誉。 5.根据权利要求1所述的一种基于异质性声誉回报的公共品博弈建模与仿真方法, 其 特征在于, 所述 步骤(4)具体为: 个体主观认知矩阵的形成受到过往经历以及正在经历的博弈局势 的影响, 定义k为短 期记忆阈值, 个体需要经历k次相同的博弈局势才能将客观博弈局势 作为长期记忆储存 在自身的主观认知中; 因此, 定义长期记忆状态矩阵为 为个体i在公共品博弈中的客 观博弈矩阵, 定义 为个体i对博弈局势的主观认知矩阵; 个体i学习客观博弈局势进而形 成自身主观认知的过程需要长期记 忆状态矩阵的辅助, 即对 与 进行hadamard积运 算: 6.一种计算机存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被处理器 执行时实现如权利要求 1‑5中任一项 所述的一种基于异质性声誉回报的公共品博弈建模与 仿真方法。 7.一种计算机设备, 包括储存器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1‑5中任一项 所 述的一种基于异质性声誉回报的公共品博 弈建模与仿真方法。权 利 要 求 书 2/2 页 3 CN 115081849 A 3

.PDF文档 专利 一种基于异质性声誉回报的公共品博弈建模与仿真方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于异质性声誉回报的公共品博弈建模与仿真方法 第 1 页 专利 一种基于异质性声誉回报的公共品博弈建模与仿真方法 第 2 页 专利 一种基于异质性声誉回报的公共品博弈建模与仿真方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:46:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。