本技术方案涉及语音信号处理领域,旨在提供一种适用于低速率通信环境的非侵入式窄带语音质量评估技术与系统。该方案通过利用语音数据对预先构建的语音质量评估模型进行训练,从而获得训练后的模型。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
与中、高比特率语音通信相比,低比特率语音通信在确保语音质量方面面临更大的挑战。这是因为低比特率语音编码通常会导致更高的信号失真和信息损失,从而直接影响语音信号的可懂度和自然度。传统的语音编码质量评估方法,如语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ)、短时间客观可懂度(Short-TimeObjective Intelligibility,STOI)、感知客观听力质量评估(Perceptual ObjectiveListening Quality Assessment,POLQA)和ITU-T P.563等,虽然能够有效评估语音信号质量,但它们需要原始信号作为参考,才能给出准确的评价。然而,在实际应用场景中,原始信号并不总是可获取,这使得这些算法的使用受到严重限制。
目前,已有研究人员基于深度学习技术设计了非侵入式的PESQ语音质量评估方法,但这些研究主要集中在宽带语音(16kHz或更高频率)上,而PESQ最初是为窄带语音信号设计的。对于低比特率通信中的窄带信号的研究相对匮乏,尤其是在真实通信环境中,常见的信道比特误码等因素对语音质量的影响尚未得到充分考虑。
实现思路