本技术提出了一种基于图注意力网络的多模态食品虚假评论检测方法。该方法包括四个主要步骤:首先,通过网络爬虫技术从点评平台获取食品评论的文本和图片数据,并利用Python工具包进行数据清洗,获得规范数据格式;其次,使用预训练的特征提取器分别提取文本和图像特征,并将其特征转换为模态图结构;然后,将文本和视觉模态图映射到统一特征空间中,通过图注意力网络实现多模态特征的充分融合;最后,通过全局平均池化操作提取全局特征,并使用全连接分类器对全局特征进行分类,结合交叉熵损失函数优化模型,从而实现对食品评论真实性的准确检测。本发明弥补了多模态融合方法上的不足,从而有效提高了食品虚假评论检测的准确性和鲁棒。
背景技术
在数字化时代,用户在各类点评平台上发布的在线评论对消费者的决策和信任构建产生了深远影响,尤其是食品评论,其不仅为消费者提供了关于餐厅、食品或服务质量的参考信息,还对商家的经济效益产生了显著作用。尽管在线评论在构建消费者信任和促进购买决策中起到了关键作用,但虚假评论的泛滥正在逐步侵蚀用户评论内容的可信度。虚假评论者往往通过发布带有极端正面或负面评价的内容来操控消费者认知,借此提高或降低商家的评分,进而扭曲市场的真实状况。特别是在餐饮行业,在线评分的微小提升即可带来显著的收入增长,这种现象进一步激发了食品虚假评论的生成和传播动机,因此,借助技术手段有效检测虚假评论、净化在线评论环境已成为亟待解决的问题。
目前,针对食品虚假评论检测技术的研究主要分为两种:基于单模态的虚假评论检测方法和基于多模态的虚假评论检测方法。基于单模态的检测方法侧重于评论文本分析,例如通过分析评论的词汇选择、句法结构和情感极性等特征来判断评论的真实性,而单一模态的数据难以有效捕捉虚假评论的复杂特征,且容易被训练有素的虚假评论者所欺骗。相比之下,基于多模态的检测方法通过融合文本、图像等多源信息,能够更加全面地识别虚假评论,但现有的多模态方法在特征表示和融合策略上存在一定的不合理性,限制了其检测效果的进一步提升。
因此,对于食品虚假在线评论的检测,需要细粒度地提取虚假评论中异构模态的特征信息,并支持模态间和模态内的细粒度交互,确保文本和图像特征能够充分交换信息,通过引入图注意力机制,能够自适应地捕捉关键特征,并更准确地识别虚假评论。
实现思路