基于事件触发的大规模分布式纳什均衡搜索方法和系统
2025-02-25 14:44
No.1343956853377474560
技术概要
PDF全文
本技术公开了一种基于事件触发的分布式纳什均衡搜索方法和系统,旨在解决大规模动态非合作系统中的复杂决策问题。通过构造无向图模型,定义网络参与者及其通信关系,结合网络平均场博弈理论,实现个体与群体行为的宏观交互。该方法引入三个辅助变量,在线动态估计群体聚集行为,并通过自适应学习增益优化邻居间的通信权重,以降低计算和通信成本。本发明还采用事件触发机制,有效控制信息交换时机,避免不必要的通信开销。通过这种方式,玩家能够在不完全信息的情况下实现无领导者共识和局部目标函数的优化,显著提高决策效率和系统的可扩展性。适用于各类大规模复杂网络场景。
背景技术
在大规模动态非合作系统中,个体决策受到其他个体行为的显著影响,解决由此产生的复杂性一直是学术研究的挑战。平均场博弈(Mean Field Games,MFG)理论通过研究理性玩家的策略,旨在揭示系统的特征和演化趋势。该理论假设玩家为匿名个体,通过利用大量个体间的互动所产生的“平滑效应”来简化复杂性,从而有效解决大规模互动中的计算复杂度问题。近年来,MFG理论在经济、金融、工程和机器学习等领域得到广泛应用,为大规模复杂网络提供了有效的建模和求解方案。 在非合作博弈中,玩家需要同时在时间和空间上动态决策,以优化不可分割且非线性的累积奖励。然而,实时获取所有其他玩家状态信息并不现实,这导致了不完全信息博弈的挑战。为此,近年来提出了一些基于局部信息的分布式计算和学习方法,其中一种基于领导者-跟随者共识协议的分布式纳什均衡(NE)搜索算法被提出,以引导玩家趋向自身最优解。 此外,使用动态共识跟踪和投影梯度的方法为聚合博弈开发了离散时间NE搜索算法,但随着玩家数量的增加,动作和状态空间呈指数级增长,极大限制了多玩家学习的可扩展性。MFG理论通过压缩问题空间,有助于大型复杂系统中智能体的优化决策,因此研究网络化平均场博弈中的NE搜索方法显得尤为重要。 为了实现局部交互下对全局信息的准确估计,通常采用分布式共识控制理论。然而,在实际场景中,相邻玩家之间的信号传输会消耗大量网络资源,尤其在玩家的传感和通信能力有限时。为此,有研究提出了事件触发采样并扩展至多智能体系中,设计了与网络大小无关的分布式自适应事件触发协议,以规避对邻居状态的持续监测,同时通过权衡自身与邻居间的误差,增强了玩家的适应性。 因此,将事件触发机制整合到玩家策略设计中更符合实际需求,尤其是在涉及大量玩家的场景中,以降低网络化平均场博弈的通信成本。 在分布式共识协议中,关联权重用于描述玩家对邻居的信任。实际情况中,权重的确定依赖于玩家的目标函数、通信网络拓扑和参与博弈的玩家数量等。为此,自适应学习增益被引入,以控制置信度分配失衡引起的估计误差。在此背景下,研究人员根据共识误差动态调整权重,从而形成更灵活的完全分布式协调控制架构。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王震  龙佳  宁少驰  于登秀
技术所属: 西北工业大学
相关技术
一种服务开发方法、装置、设备及存储介质 一种服务开发方法、装置、设备及存储介质
一种高精度双层优化方法的神经网络搜索架构构建方法 一种高精度双层优化方法的神经网络搜索架构构建方法
跨总线域的设备对宿主机空间DMA访问方法及相关设备 跨总线域的设备对宿主机空间DMA访问方法及相关设备
一种客户信息定期维护方法及系统 一种客户信息定期维护方法及系统
代码发布方法、装置、计算机设备和可读存储介质 代码发布方法、装置、计算机设备和可读存储介质
一种基于统一管理平台的子应用数据获取方法及装置 一种基于统一管理平台的子应用数据获取方法及装置
利用深度学习的BIM模型错误自动检测系统 利用深度学习的BIM模型错误自动检测系统
一种基于智能反射面的室内T型走廊场景路径损耗的分析方法 一种基于智能反射面的室内T型走廊场景路径损耗的分析方法
模型评估任务处理方法及装置 模型评估任务处理方法及装置
基于大数据的异常信号智能识别方法 基于大数据的异常信号智能识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利