大模型辅助下的英语发音教学系统与方法
2025-01-18 11:00
No.1330130882190909440
技术概要
PDF全文
本系统和方法利用大模型技术,通过收集发音训练数据,分析得到音频和视频资料,并提取教学者三维面部图像。利用生成对抗网络进行图像和音频的知识蒸馏,提取面部和声音特征,并进行时间轴对齐。基于对齐结果,计算联合损失函数值,并更新模型参数,形成第二蒸馏模型,用于生成音视频教学动画,以提升英语学习者的发音学习体验。
背景技术
目前,现有的英语发音教学只能给用户提供标准发音,或者再提供单词场景例句,却不能提供单词场景例句的视频画面,需要用户自行查找,或者人工整理单词场景例句,然而整理单词发音需要抓取海量音视频,需要消耗大量存储空间资源和计算资源从中提取需要的出场景例句画面,使得传统的英语发音教学效率低,用户体验感差。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
孙维琪林景亮
技术所属: 广东海洋大学.
相关技术
培养儿童绘画能力的教学临摹涂鸦设备 培养儿童绘画能力的教学临摹涂鸦设备
音频处理方法、模型训练方法及装置、设备、存储介质、产品 音频处理方法、模型训练方法及装置、设备、存储介质、产品
一种助力柔性护具及其参数化生成方法 一种助力柔性护具及其参数化生成方法
一种康复训练装置 一种康复训练装置
一种松软泥壤环境中高牵引的仿生步行轮 一种松软泥壤环境中高牵引的仿生步行轮
摇臂滚珠抬升机构 摇臂滚珠抬升机构
一种用于展示机械臂机械原理的教具 一种用于展示机械臂机械原理的教具
拔罐器、拔罐训练装置及方法 拔罐器、拔罐训练装置及方法
一种基于触听融合的智能盲人象棋实现方法及装置 一种基于触听融合的智能盲人象棋实现方法及装置
基于虚拟现实场景的英文单词诵读记忆方法与系统 基于虚拟现实场景的英文单词诵读记忆方法与系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利