双融合机制:频域注意力与自注意力池化在整夜鼾声检测中的应用 双融合机制:频域注意力与自注意力池化在整夜鼾声检测中的应用
本技术公开了一种基于频域注意力和自注意力池化双融合机制的整夜鼾声检测方法,属于声音事件检测领域。本发明方法包括:设计了基于频域自注意力子模块的波形特征提取模块、基于可变形卷积残差子模块的梅尔倒谱特征提取模块、基于自注意力池化双融合模块、基于多层感知机的解码器;利用上述模块构建了基于频域注意力和自注意力池化双融合机制的深度学习鼾声事件检测模型。模型可通过加载训练后的参数,通过逐点分帧检测的方式对整夜睡眠声数据中鼾声进行检测和定位,获得整夜时间内中打鼾事件发生的起止时间和对应鼾声类型。该模型能够快速、准确检测到整夜睡眠期间的鼾声片段,有助于协助医护人员实现对睡眠呼吸障碍初期患者的快速筛查。
智能人机交互语言学习系统及其创新方法 智能人机交互语言学习系统及其创新方法
本技术公开了一种人机交互设备的语言学习系统,包括有人机交互设备的语言学习系统,所述人机交互设备的语言学习系统中包括有语音采集模块、预处理模块、语音分析模块、语音匹配模块、语义识别模块、情景交互模块、大数据库模块和系统辅助模块;一种人机交互设备的语言学习方法,包括有以下步骤:S1、使用者通过情景交互模块选择情景模式;S2、使用者语音交流;S3、预处理模块对语音信息进行预处理;S4、语音分析模块对音频信号进行处理;S5、对音频信号进行匹配;S6、对文本信息进行语义识别;S7、根据选定的模式情景进行回答。本发明具备对音频信号进行预处理,提高音频信号的精准度,便于分析匹配语义,根据语音进行人机交流的优点。
卫星网络语义通信技术、设备与方法 卫星网络语义通信技术、设备与方法
本技术提供了一种面向卫星网络的语义通信方法、装置及电子设备,涉及无线通信领域。包括:发送端通过预处理模块提取并记录原始语音信号中的用户特征及声音信息;通过降维模块对原始语音信号降维处理为文字信号;依次通过语义提取模块、语义表征模块将文字信号处理为语义特征;通过信道编码模块基于地面与卫星之间信道状态,将语义特征编码为语义特征向量;通过信道传输语义特征向量;接收端通过信道接收语义特征向量,通过信道解码模块,根据信道状态进行反向适配得到解码后的语义特征;通过语义解码模块得到解码后的文字信号;通过语义重建模块将文字信号与用户特征及声音信息合成得到重构后的语音信号,实现了面向卫星网络的语义通信。
光电模拟压缩器处理技术 光电模拟压缩器处理技术
本技术公开了一种基于光电技术的模拟压缩器处理方法,涉及压缩器领域,解决了模拟压缩效果器难以兼顾效率和视听体验的音频压缩效果的问题,方法步骤包括:在模拟压缩器接收到音频信号输入时,获取音频信号的音频特征数据;综合分析音频信号的信号质量,分析得到音频信号在各个周期的输入质量等级,对音频输入设备的信号质量进行综合评估,评估得到音频输入设备的信号质量等级;对模拟压缩器的补偿方案进行调节,选定补偿方案后模拟压缩器对输入信号进行压缩,而后获取输出音频的音频效果数据;对模拟压缩器的补偿效果进行综合评估,并对模拟压缩器的补偿力度进行调控,本发明实现模拟压缩器的智能压缩和智能释放控制。
全范围零吸引LMS算法在自适应滤波技术中的应用 全范围零吸引LMS算法在自适应滤波技术中的应用
本技术涉及一种基于全范围零吸引LMS算法的自适应滤波方法,属于数字信号处理领域。该方法包括:建立回声消除器系统模型;通过拾音设备采集若干组音频信号,构建信号矩阵,并引入信道噪声;将音频信号输入自适应滤波器中处理输出得到回声信号;将音频信号输入回声信道,并将回声信道的输出信号与信道噪声叠加获得期望信号;计算期望信号与回声信号之间的误差,并将其输入至自适应滤波器中对自适应滤波器的系数进行迭代更新,获得最优滤波参数;在最优滤波参数下,从获取的实时语音信号的期望信号中去除自适应滤波器产生的回声信号后,得到滤波处理后的语音信号。本发明有利于提高回声消除器的性能和稳定性,同时对算法的参数选择更具鲁棒性。
英语口语情感分析技术 英语口语情感分析技术
本技术提供一种英语口语情感诊断方法,该方法是一个由顺序连接的英语口语预处理模块、英语口语情感诊断模块组成的诊断方法。英语口语通过该诊断方法处理后,最后能够得到这条英语口语的情感诊断结果。本发明能够解决现有的英语口语情感诊断方法存在的情感诊断信度与效度差的问题。
智能语音控制技术:车载系统与设备 智能语音控制技术:车载系统与设备
本文公开了一种控制方法、装置、车载终端、车辆和存储介质。该控制方法包括:接收从客户端输入的第一语音控制指令;根据所述第一语音控制指令,确定发出所述第一语音控制指令的第一声源位置;在确定所述第一语音控制指令为第二语音控制指令的跟随指令,且所述第一声源位置与第二声源位置不相同的情况下,根据所述第一语音控制指令控制所述第一声源位置处的第一控制对象,所述第一控制对象为与所述第二语音控制指令中的第二控制对象是相同类型的对象;其中,所述第二声源位置为发出所述第二语音控制指令的声源所在的位置。采用本申请提供的控制方法,可以提高驾乘人员对之前操作过的同种类型的控制对象的二次操作的智能性、简便性和高效性。
带式输送机异常声音识别技术 带式输送机异常声音识别技术
本技术公开一种用于带式输送机故障诊断的异常声音检测方法,包括:构建训练集;所述训练集包括:正常声音和异常声音;利用所述训练集对预设的带式输送机故障诊断声音异常检测网络进行训练。预设的带式输送机故障诊断的声音异常检测方法主要包括:对数梅尔频谱图模块、谱时特征融合模块、基于流的自监督估计模块;将所述的带式输送机在嘈杂环境下的运行声音提取有效特征并进行故障诊断,判断是否发生故障以及发生故障类型。本发明在基于流的自监督密度估计模块上融合了对数梅尔频谱图模块以及谱时特征融合模块,实现了多尺度的特征融合,丰富了提取的特征,并取得极好的带式输送机故障诊断的异常声音检测效果。
多模态语音情感分析:预训练模型应用与系统构建 多模态语音情感分析:预训练模型应用与系统构建
本技术提供了一种基于预训练模型的多模态语音情感识别方法,包括如下步骤:步骤1、获取数据集,所述数据集中包括若干数据对,所述数据对包括相对应的文本的数据和音频数据,每个所述数据对设置有情感标签;步骤2、从文本数据中获取文本语义特征,从同一数据对中的音频数据获取音频声学特征和语音情感特征;步骤3、将文本语义特征、音频声学特征和语音情感特征进行特征融合,获得融合特征;步骤4、将融合特征输入至线性分类器当中,通过softmax层后将其输出作为每一种情感的得分,取得分最大值对应的情感标签所对应的情感作为识别结果。该方法并基于注意力机制提出了一种以语音情感为导向的融合策略,显著提高了语音情感的预测准确率。
语音识别测试系统:模拟不同距离识别效果 语音识别测试系统:模拟不同距离识别效果
本技术公开了一种模拟不同距离的语音识别成功率的测试系统及方法。本发明模拟不同距离的语音识别成功率的测试系统,包括:校准模块,用于校准以固定的发音源响度在不同距离的语音识别成功率;测试模块,用于根据在不同距离的语音识别成功率分别获得在固定距离的发音源的不同响度;模拟模块,用于根据得到的在固定距离发音源的不同响度,对应模拟固定发音源响度在不同距离的语音识别成功率。本发明在固定的位置改变发音源的响度,模拟不同距离的语音识别成功率,解决了现有技术中测试过程受空间限制的问题。
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工