扩散模型与文本描述结合的人体动作生成技术
2025-02-15 10:21
No.1340266705087373312
技术概要
PDF全文
本技术介绍了一种结合扩散模型和文本描述的人体动作生成技术。该技术通过大型语言模型将原始文本转化为针对不同身体部位的详细描述,并以此指导动作生成过程,实现精确的动作模拟。
背景技术
人体动作生成是计算机视觉和计算机图形学中的一个重要研究领域,旨在通过计算机模拟和生成逼真的人类动作。随着虚拟现实、增强现实和电影特效等技术的发展,对于高质量人体动作的需求不断增加。近年来,人体动作生成任务变得越来越具有挑战性,出现了相当多的创新方法和技术来应对这一挑战。其中,深度生成模型在人体动作生成领域发挥着重要作用,包括生成对抗网络、变分自编码器和扩散模型等。 然而,现有的人体运动生成方法仍面临一些挑战,尤其是在零样本生成方面的困难。具体来说,现有方法在生成训练数据分布范围之外的复杂运动时,效果不佳。此外,由于人体动作数据集的规模和多样性有限,使得生成数据集分布范围之外的复杂运动更具挑战性。因此,为了增强模型的泛化能力,实现零样本生成,有必要提出一种新的解决方案。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
孙运莲  石旭
技术所属: 南京理工大学
相关技术
变压器呼吸器变色检测方法、装置、系统及电子设备 变压器呼吸器变色检测方法、装置、系统及电子设备
基于机器视觉和AR的虫害检测与管理系统 基于机器视觉和AR的虫害检测与管理系统
一种电路板的故障快速检测方法、系统及存储介质 一种电路板的故障快速检测方法、系统及存储介质
遥感影像检测方法、装置、电子设备及存储介质 遥感影像检测方法、装置、电子设备及存储介质
一种基于在网计算的流表压缩方法 一种基于在网计算的流表压缩方法
一种基于分段信道估计的通感一体化系统干扰消除方法 一种基于分段信道估计的通感一体化系统干扰消除方法
一种基于上半身姿态的驾驶员情绪状态检测方法及系统 一种基于上半身姿态的驾驶员情绪状态检测方法及系统
一种引入RBU的轻量化皮革表面缺陷显著目标检测方法 一种引入RBU的轻量化皮革表面缺陷显著目标检测方法
一种基于金字塔的SAR图像相干斑抑制方法 一种基于金字塔的SAR图像相干斑抑制方法
一种考虑多层级特征的多类别点云异常检测方法及系统 一种考虑多层级特征的多类别点云异常检测方法及系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利