本技术涉及人工智能和语义通信技术领域,提出一种基于多目标对比学习的语义通信方法、系统及终端。语义通信方法基于经训练的自编码器模型完成,包括:配置不同长度的若干条文本,将不同长度的若干条文本依次输入语义通信编码器,获得语义编码序列;语义编码序列经信道传输成为模糊语义编码序列,将模糊语义编码序列输入语义通信解码器进行语义解码;基于多目标对比学习损失函数训练自编码器模型,当连续预设次数的训练中损失值未出现下降时,训练完成;将训练完成的自编码器模型部署至信道,进行语义通信。本发明不仅考虑了文本信息的精确重建,还考虑了噪声鲁棒性、特征均匀性和文本真实性,具有更强的抗噪声鲁棒性能。
背景技术
近年来,随着深度学习(Deep Learning,DL)和人工智能(ArtificialIntelligence,AI)的发展,机器逐渐具备了可以与人类相比的语义理解能力,一个重要的例子是GPT的出现。在深度学习的发展趋势下,基于深度学习的信源信道联合编码(DeepJSCC)成为一种很有前景的方法,并且成为语义通信的一种有效的解决方案。作为一种基于深度学习的生成模型,自编码器(autoencoder,AE)联合学习编码和解码过程,并尽可能根据压缩的低维特征重构原始数据,其优化目标被广泛应用于Deep JSCC,自编码器的类别包括:最原始的自编码器(AE)、变分自编码器(Variational Autoencoder,VAE)和对抗自编码器(Adversarial Autoencoder,AAE)。例如,现有技术提出的第一个基于自编码器架构的Deep JSCC图像传输方法,与传统的JPEG和JPEG2000信源编码相比,该方法在低信噪比条件下优于基于信源信道分离的数字传输方案。从变分的视角来看,Deep JSCC可以视为一种变分自编码器(VAE)。基于这个结论,有人将VAE的目标函数作为优化目标,提出了非线性变换信源信道编码(NTSCC),它可以紧密地适应非线性变换下的信源分布。还有人提出了基于Swin Transformer的Deep JSCC,称为Swin JSCC,它同样将VAE的目标函数作为优化目标,适用于语义通信,并超越了最先进的BPG + 5G LDPC编码传输系统。
尽管上述基于自编码器的Deep JSCC方案表现出了令人印象深刻的性能,但将自编码器应用于语义通信时,语义噪声的影响和系统的鲁棒性仍需要进一步研究。与传统系统中的噪声类似,语义噪声会引起对语义信息的误解和解码错误,从而导致接收端预期的语义与重构的语义之间的误导。语义噪声可以在语义编码、数据传输和解码等不同阶段产生。在语义编码阶段,语义噪声对应的是经过语义编码后的原始信号与编码后的信号不匹配,这与编码器的表示能力有关。在数据传输阶段,信道衰落引起的信号失真或恶意攻击者发送的一些精心设计的信号都引入了语义噪声。在解码阶段,误解、不正确的表达和意义的混淆给接收者带来了语义噪声。鉴于此,亟待提出一种能对文本信息精确重建的语义通信方法。
实现思路