本技术提供一种基于大模型的心理健康监测系统,涉及数据处理技术领域,所述方法包括:采集用户的多模态数据,并对其进行预处理,得到语音数据、视频数据和文本数据;对语音数据进行处理,得到短暂高频噪声数据,对视频数据进行处理,得到图片模糊数据,根据频域语音数据和视频数据,获取语音情感特征和行为情感特征;对短暂高频噪声数据进行处理,得到语音修复情感特征,对图片模糊数据进行修复,得到行为修复情感特征;将语音情感特征、行为情感特征、语音修复情感特征和行为修复情感特征融合得到情感特征分析数据,并输入至预设的情感识别大模型中,生成心理健康状态评估结果。本发明能够得到精准数据。
背景技术
在对运动员进行心理健康监测时,需要从文本、语音和视频三个方向进行收集数据,而由于运动员日常活动主要处于运动场所中,该场所下采集的数据可能存在不准确的情况。
例如,在进行排球训练或比赛时,运动员之间的沟通声可能会被排球与肢体之间碰撞产生的噪声所掩盖。这种噪声足以覆盖语音信号中的关键情感特征,现有的噪声抑制算法可能在此情境下常常难以有效地过滤这些噪声,因为它们主要针对背景噪声或恒定的环境声而设计,无法针对突发的、频率分散的声音进行有效处理。这种情况不仅影响了音频信号的质量,还可能导致情感识别系统的准确性下降,从而妨碍对运动员心理健康状况的全面评估。
实现思路