多玩家适配型游戏AI训练技术及系统
2025-01-08 13:09
No.1326538366317240320
技术概要
PDF全文
本技术介绍一种多玩家适配型游戏AI训练技术及系统,涵盖以下步骤:首先,基于对手类型M,构建AI的策略采样策略π<sub>s</sub>和奖励模型;其次,AI利用π<sub>s</sub>与对手互动,收集各类对手数据;然后,基于互动数据,计算M个对手的奖励模型,每个模型对应一类对手;最后,通过极大极小Q学习算法、游戏模型和奖励模型,学习每类对手的纳什均衡策略,形成应对策略,并重复此过程以掌握所有对手类型的策略。该技术旨在提升游戏AI对不同玩家类型的适应性,增强玩家满意度。
背景技术
近年来,由于人工智能技术的充分发展,人机交互博弈问题引起了人们广泛的关注和研究。其中,电子游戏(如星际争霸、王者荣耀等)作为一种经典的人机交互博弈形式,成为了人们重点研究的对象。然而,之前的研究主要聚焦于如何求解一个博弈的最优解或纳什均衡解,忽视了现实生活中的电子游戏还存在另一个问题——玩家的类型有多种且未知,例如在许多游戏中,玩家可以粗略分为多种类型:竞技型、娱乐型、混合型等多个大类,并且各大类也可以根据不同的特性再细分为若干小类。玩家类型决定了他们对游戏AI表现出的智能具有不同的期望,适合的AI智能能够有效提高玩家的满意度。站在游戏厂商的立场,开发的游戏AI应当让所有玩家的满意度均达到最高。然而,如果游戏AI只使用一种对战策略,必然难以满足所有类型的玩家。因此需要训练AI使得它可以分辨出对战玩家的类型,并采取使得玩家满意度最高的策略。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
朱进  王成意
技术所属: 中国科学技术大学
相关技术
一种游戏事件提示方法 一种游戏事件提示方法
语音生成方法、装置、设备、存储介质及产品 语音生成方法、装置、设备、存储介质及产品
深度学习辅助的枪声检测与定位方法 深度学习辅助的枪声检测与定位方法
一种基于多层神经网络的多声音事件检测方法 一种基于多层神经网络的多声音事件检测方法
一种基于模态自适应学习的多模态课堂情感识别方法及系统 一种基于模态自适应学习的多模态课堂情感识别方法及系统
一种基于BERT预训练语言模型的语音指令识别方法 一种基于BERT预训练语言模型的语音指令识别方法
复杂海洋环境下仿嘀嗒声水声仿生通信信号识别方法及系统 复杂海洋环境下仿嘀嗒声水声仿生通信信号识别方法及系统
基于梯度类激活映射的水下目标噪声源分类模型可解释性方法 基于梯度类激活映射的水下目标噪声源分类模型可解释性方法
语音交互方法、服务器及计算机可读存储介质 语音交互方法、服务器及计算机可读存储介质
一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质 一种语音识别模型的语料扩充方法、装置、电子设备及计算机可读存储介质
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利