本技术公开了一种基于协同聚类的跨被试言语想象脑电意图解码域迁移方法,包括如下步骤:步骤1、获取已有的言语想象脑电数据,从而构建源域数据集并预处理;步骤2、提取预处理后的源域数据集中言语想象相关的脑电特征;步骤3、初始化样本的聚类指示矩阵和特征的聚类指示矩阵,并求解优化;步骤4、训练一个基于脑电样本和特征协同聚类的半监督言语想象意图解码模型;步骤5、采集目标域数据,并进行预处理;步骤6、确定目标域的最佳源域匹配;步骤7、调整后的系数矩阵;步骤8、在目标域上得到最终优化的样本特征耦合聚类脑电言语想象意图解码矩阵分解模型,继而,意图解码的识别标签可以转化为目标域样本的聚类指示矩阵并求解。
背景技术
言语想象意图解码是一项前沿的研究课题,其意义和价值在于它能够深入探索人类大脑处理和生成语言的机制,并开辟全新的脑机接口交互方式。言语想象,即在无声状态下的内在发音,代表了个体的内部语言体验。通过解码这些内部声音,研究人员有机会将人们脑中想象的语音转化为外在可识别的信号或声音,这在基础研究和实际应用中都具有深远的影响。在基础研究层面,言语想象意图解码为我们理解大脑的语言预处理机制提供了一个独特的窗口。这种技术能够揭示大脑如何在无声状态下处理、储存和生成语言,从而深化我们对认知过程的理解。在应用层面,言语想象意图解码技术的潜力更为广泛。对于那些因中风、帕金森病、脑外伤等疾病而失去言语能力的患者,这项技术提供了恢复交流能力的新希望。通过将大脑中的言语意图直接转化为声音或文字,患者可以在不依赖传统发声器官的情况下重新与他人交流。此外,这项技术还可应用于加密通信和脑纹识别等领域,为人们提供一种不依赖语言发声的交流方式。总的来说,言语想象意图解码技术不仅推动了我们对大脑认知机制的理解,还为医疗康复、无声通信等领域带来了革命性的应用前景。
其中,基于脑电信号的言语想象意图解码是一种通过分析脑电图(EEG)信号来识别和解码个体的内部语言想象的技术,由于其廉价、易用、采集方便和检测准确率高的优势颇受关注。这种技术的核心在于利用脑电信号中蕴含的语言处理和生成信息来推测个体的言语意图,即使在不发声的情况下也能实现有效的交流,拓宽了脑机接口(Brain-ComputerInterface,BCI)系统的应用场景,展示出广泛的应用前景和推广价值。
然而,虽然脑电信号廉价易得,但它是典型的非平稳信号,具有信噪比低和数据特征不明显的特点,且跨时段或跨被试的脑电信号存在显著差异,在已有言语想象脑电数据集上训练好的模型往往难以在新的被试或新的时间段上表现出相同的性能。这种情况下,直接将已训练好的模型应用于新采集的脑电数据上,通常会导致言语想象意图解码的精度显著降低,进而影响模型的实际应用价值。
针对上述技术问题,目前已知的现有技术主要有两种应对思路。
第一种是为新被试和新的时间段重新训练一个言语想象意图解码模型。虽然这种方法可以针对新数据进行定制化优化,从而提高解码精度,但它也存在显著的缺点:重新训练模型不仅耗时耗力,而且样本采集的过程往往耗费大量时间和人力资源,导致时间成本高昂。此外,这种方法对每个新被试或时间段都需要进行重复训练,无法有效推广应用。
另一种思路是基于已有的数据集和训练好的模型进行迁移学习,即在新采集到的数据基础上,利用之前的模型和数据进行调整和优化,从而适应新的数据。
其中,在迁移学习中,源域(Source Domain)是指我们已经有大量标注数据和训练好的模型的领域,提供了用来训练初步模型的知识和经验;目标域(Target Domain)是我们希望将源域模型迁移到的领域,可能只有有限的标注数据或者甚至没有标注数据。目标域的任务是将已经从源域获得的知识应用到新的环境中,以期实现相似的学习效果或提高目标任务的性能。而目标域的特征分布和任务与源域可能存在差异,这也是迁移学习的挑战所在。域适应(Domain Adaptation)是迁移学习中的一个重要过程,旨在减小源域和目标域之间的分布差异。具体来说,域适应试图通过调整或优化模型,使其在目标域上能够更好地泛化。
现有的域适应技术主要有以下两类:
模型调整(Model Adjustment):在源域训练的模型基础上,进行针对目标域的调整。具体的,通过少量目标域的标注数据进行微调,以优化模型在目标域上的性能。这种技术的缺点在于仍然依赖于较多的标注数据进行校准,这在脑电数据的实际应用中依然需要投入较高的成本和精力。
分布对齐(Distribution Alignment):通过优化技术,调整源域和目标域的原始特征分布或者编码降维后特征空间上的分布,使它们尽可能地对齐,通过最小化源域和目标域的概率分布距离以使源域和目标域分布尽可能相似,常用来衡量概率分布距离的工具有KL散度、JS距离和最大均值差异(也称MMD距离)。这类技术的代表有迁移成分分析(Transfer component analysis,TCA)、联合分布适配(Joint distribution adaption,JDA)、迁移联合适配(Transfer joint matching,TJM)等。然而,这种技术的问题在于源域和目标域可能并不适配,盲目分布对齐会引起“负迁移”现象,导致迁移学习的效果不稳定。
此外,传统迁移学习中的域适应过程通常涉及复杂的算法调整,如何提高迁移过程中的可解释性和复杂度也是仍需解决的一个技术痛点。
基于上述缺陷,为脑电的言语想象解码带来了很大挑战。脑电信号的非平稳性意味着其统计特性(如均值和方差)随时间变化,这使得信号的分析和解码变得更加复杂。大脑活动在不同时间点可能具有不同的电活动模式,导致信号特征的变化,使得稳定而可靠的解码变得困难。因此,脑电信号的特征在不同实验时段之间可能会发生变化,这可能是由于实验条件变化、受试者状态变化或其他环境因素所致。这种时段变化增加了模型训练和解码的复杂性,使得实时和长期稳定的解码成为一大挑战。同时,不同个体的大脑电活动模式存在自然差异,这种个体间的差异使得跨被试的解码模型难以普适化。每个人的脑电信号在结构和动态特征上可能有所不同,使得基于脑电信号的言语想象意图解码模型的泛化效果不佳。
因此,构建一个具有普适性的、能够处理这些言语想象脑电数据个体差异和时段差异、在不同被试和不同时间段具有良好的迁移能力的意图解码模型显得尤为重要。
实现思路