本技术提出一种融合用户反馈的情感支持对话策略管理方法,涉及自然语言处理的技术领域,方法包括获取输入的对话信息;将所述对话信息输入预训练的知识增强编码器,输出增强知识的上下文表示;基于所述上下文表示,选择生成安抚用户的回复策略;基于所述回复策略和所述上下文表示,生成与所述回复策略一致的候选回复;预测用户对所述候选回复的反馈,基于所述反馈迭代生成最优回复策略。本发明能够有效精准预测适配的回复策略和生成与回复策略一致的回复。
背景技术
随着经济的发展,竞争的加剧,人们的生活与工作节奏也越来越快。对处于经济转型期的人们来说,无疑加大了心理压力。为了缓解情绪上的压力,情感支持对话系统应运而生。它旨在理解人类用户的情绪困扰,并通过提供共情回复和疏导建议给予情感陪伴的对话形式。这种对话系统不仅关注于理解和回应用户的情感状态,还通过提供安慰、鼓励和支持来帮助用户处理情绪问题,增强用户的情感福祉。为更好地解决用户问题,系统需要及时调整对话策略,即实现有效的策略管理,并确保生成的回复与选择的策略一致。
在情感支持对话任务的研究中,目前主流的方法可归纳为三类。第一类方法依赖于检索技术,通过从预先构建的语料库中检索与上下文匹配的文本片段来生成回复,这类方法虽然能够在一定程度上提供情感支持,但其局限性在于缺乏动态调整机制,这难以根据用户的反馈来优化回复策略,导致生成的回复无法充分满足用户的情感需求。第二类方法使用神经网络直接生成对话内容,但在情感表达上往往存在不准确和模糊的问题,尤其是针对数据集不足或情感复杂的情况下,生成难以达到情感支持的预期效果的回复。第三类方法是知识增强的生成技术,通过引入知识图谱、参数化知识或非结构化文本来丰富生成的对话内容。此类方法在一定程度上提高了对话的丰富性和一致性,但仍然面临生成内容与事实不符的问题,且依赖于外部知识的质量,容易导致情感表达的不充分。因此,如何精准预测适配的回复策略和生成与回复策略一致的回复,是极其重要的待解决的技术问题。
实现思路