123技术园

首页 / 信息集成数字服务

 本技术涉及语音信号处理技术领域，尤其涉及一种语音信号降噪方法、系统及设备。所述方法包括以下步骤:对待处理语音信号数据进行自适应分帧处理，得到分帧语音信号数据；根据分帧语音信号数据进行语义嵌入空间处理，得到语义嵌入空间数据；根据语义嵌入空间数据进行语义矢量场构建，生成语音语义矢量场数据；对语音语义矢量场数据进行语音噪声区域标记，生成语义噪声区域数据；根据语义噪声区域数据进行噪音帧修复处理，生成降噪语音信号数据；对降噪语音信号数据进行听觉掩蔽频谱修正，生成增强语音信号数据。本发明通过语义信息精准引导语音信号降噪，即使在低信噪比等复杂场景下，依然能够取得卓越的降噪效果，显著提升用户体验。

2025-02-26 20:30

说话人分割聚类方法、装置、存储介质及电子装置说话人分割聚类方法、装置、存储介质及电子装置

本技术公开了一种说话人分割聚类方法、装置、存储介质及电子装置。其中，该说话人分割聚类方法包括:使用语音识别引擎对输入语音进行分割，能够更准确的区分语音和非语言，改善了使用VAD对语音进行分割错误率高的问题，从而提高后面聚类模块的正确率，从而降低整个说话人分割系统的错误率，以至少解决现有技术中，说话人分割聚类准确率较低的技术问题。

2025-02-26 17:12

一种基于联邦学习的声纹识别方法一种基于联邦学习的声纹识别方法

 本技术涉及一种基于联邦学习的声纹识别方法，利用联邦学习分布式特性，基于服务器下发的起始参数组，待处理客户端生成本地个性化起始参数组，再联系模型记忆和动量增量，以基于本地音频数据样本集彼此独立取样的第一样本子集、第二样本子集，实现参数组的迭代训练更新，并最终联系服务器的全局聚合方式，获得声纹识别模型，用于针对音频实现关于预设各音频发出者标签的识别；设计声纹识别方法，有效解决音频数据在不同设备间的数据隐私保护和分布异质性问题，提升系统中声纹识别模型在实际应用中的鲁棒性和泛化能力。

2025-02-26 16:41

一种集成机器学习图像语音识别系统及设备一种集成机器学习图像语音识别系统及设备

 本技术提供了一种集成机器学习图像语音识别系统及设备，包括图像采集模块，用于采集图像数据；语音采集模块，用于采集语言数据；预处理模块，用于对采集的图像数据和语音数据进行预处理；特征提取模块，用于提取预处理后的图像数据和语音数据的特征；深度学习网络，用于对图像数据和语音数据的特征进行深度学习处理；特征融合模块，用于将深度学习处理后的图像和语音高维特征通过一融合层进行融合；分类器，用于对整合后的特征进行最终分类；输出模块，用于输出最终分类的识别结果；本发明通过集成机器学习能够同时处理图像和语音数据，利用深度学习网络对这两种数据的特征进行学习，并在特征融合模块中将它们结合起来，以增强识别能力。

2025-02-26 12:37

一种基于Transformer的中医声诊体质辨识模型及方法一种基于Transformer的中医声诊体质辨识模型及方法

 本技术提供了一种基于Transformer的中医声诊体质辨识模型及方法，其中方法包括采集受试者的语音数据，语音数据包括元音和关键字。对语音数据进行预处理，得到梅尔频谱图。将梅尔频谱图输入基于Transformer的中医声诊体质辨识模型进行体质辨识，得到体质类型。基于Transformer的中医声诊体质辨识模型为训练之后的神经网络模型，采用基于Transformer的中医声诊体质辨识模型来判断受试者的体质类型为平和质或湿热质，可以克服采用问答形式判定体质类型带来主观偏差的问题，在一个统一的标准下判断受试者的体质类型，使得本发明辨识受试者的体质类型具有较强的客观性。另外，本发明的语音数据基于元音和关键字，使得语音数据与体质辨识的相关性更强，可以增加识别体质类型的准确度。

2025-02-25 20:47

一种基于生成对抗网络的目标信号增强方法一种基于生成对抗网络的目标信号增强方法

 本技术涉及一种基于生成对抗网络的目标信号增强方法，属于信号处理技术领域，包括以下步骤:S1：使用训练集对生成对抗网络的生成器和鉴别器进行对抗训练，在训练过程中添加注意力机制和音频修复模块，得到训练后的目标信号增强模型；S2：使用训练后的目标信号增强模型对复杂信号样本进行识别、提取、去噪与修复处理，得到目标信号；S3：将训练好的目标信号增强模型进行模型剪枝与再训练，从而优化所述目标信号增强模型。本方法提高了复杂信号中目标信号处理的精度和效果，为复杂信号场景应用提供更实时可靠的信号数据处理能力。

2025-02-25 20:26

一种基于语音驱动人工智能的交互数字人合成方法一种基于语音驱动人工智能的交互数字人合成方法

本技术涉及数字人合成技术领域，具体公开了一种基于语音驱动人工智能的交互数字人合成方法，所述方法包括:S1：通过数据采集单元采集不同的渠道和平台提交的语音数据，并对输入的音频原始数据进行预处理，包括语音过滤、语音特征数值化，通过基于Audio2DHuman深度学习模型，通过输入的语音信号提取出音频特征，预测面部关键点运动权重和手势、头部动画参数，进而生成与数字人语言播报内容精确同步的面部表情及流畅手势、头部动作，实现对数字人的高效驱动与自然交互，从而实现将语音中蕴含的语义和情感表达同步映射到虚拟人3D模型面部、手势、肢体动作渲染中，从而极大地增强了数字人情感的真实性和专业性。

2025-02-25 19:47

电话卡冒用检测方法、系统、计算机设备及存储介质电话卡冒用检测方法、系统、计算机设备及存储介质

本方案涉及一种电话卡冒用检测方法、系统、计算机设备及存储介质。所述方法包括:获取包含有疑似被冒用电话卡的电话号码的嫌疑名单；获取与电话号码对应机主的电话录音，并通过重采样算法将电话录音的采集频率调整为目标采集频率；将含有目标采集频率的电话录音输入至声纹识别算法模型中，得到与电话录音对应的声纹特征；在注册录音底库中查找与电话号码对应的注册声纹特征；将声纹特征与注册声纹特征进行比对，得到比对结果，并根据比对结果确定电话号码对应的电话卡是否被冒用。通过对采集的电话录音以及数据库中的目标电话录音进行声纹识别，从而根据声纹识别结果确定电话录音对应的机主是否为注册机主，可以准确检测出电话卡是否被冒用。

2025-02-25 17:47

设备的唤醒方法设备的唤醒方法

本文实施例提供一种设备的唤醒方法，该方法包括:获取控制策略的标识；接收用户输入的唤醒语音，唤醒语音中包括预设范围内的多个智能设备的相同唤醒词，多个智能设备中包括目标设备；根据标识和唤醒语音，确定检测信息，并向服务器发送检测信息；接收服务器发送唤醒指示，并根据唤醒指示控制目标设备唤醒。本申请实施例提供的设备的唤醒方法用于解决多个设备同时被唤醒或者多个设备都无法被唤醒的问题，提高用户体验。

2025-02-25 13:27

一种语音识别的方法及装置、电子设备、存储介质一种语音识别的方法及装置、电子设备、存储介质

本文公开了一种语音识别的方法及装置、电子设备、存储介质，其中，所述方法包括:获取目标设备采集到的当前语音；提取所述当前语音的语音特征；基于所述当前语音的语音特征和预先确定的各个说话人类别对应的平均特征向量，计算得到所述当前语音属于各个所述说话人类别的评分；其中，各个所述说话人类别为基于降维后的多个历史语音的语音特征，对各个所述历史语音进行聚类得到的类别；每个所述说话人类别对应的平均特征向量由属于所述说话人类别的所述历史语音的语音特征进行计算得到；将各个所述评分中的最大值对应的所述说话人类别，确定为所述当前语音所属的说话人类别。

2025-02-25 13:24

技术分类

电信、广播电视和卫星传输服务电信、广播电视和卫星传输服务

互联网软件服务互联网软件服务

集成电路设计集成电路设计

信息集成数字服务信息集成数字服务

电气机械制造电气机械制造

计算机、通信、电子设备制造计算机、通信、电子设备制造

医药制造、生物基材料医药制造、生物基材料

石油煤矿化学用品加工石油煤矿化学用品加工

化学原料制品加工化学原料制品加工

非金属矿物加工非金属矿物加工

金属制品加工金属制品加工

专用设备制造专用设备制造

通用设备制造通用设备制造

通用零部件制造通用零部件制造

汽车制造业汽车制造业

铁路、船舶、航天设备制造铁路、船舶、航天设备制造

电力、热力生产和供应电力、热力生产和供应

燃气生产和供应燃气生产和供应

水生产和供应水生产和供应

房屋建筑、土木工程房屋建筑、土木工程

交通运输、仓储和邮政交通运输、仓储和邮政

农、林、牧、渔业农、林、牧、渔业

采矿业采矿业

农副、食品加工农副、食品加工

烟草、酒水加工烟草、酒水加工

纺织皮具居家制品纺织皮具居家制品

文教体娱加工文教体娱加工