本技术公开了一种基于大模型图片内容特征增强的个性化景点推荐方法,包括:1、数据集获取与处理:获取带有地理标记图片的旅游数据集,并对图片的地理信息进行逆编码,得到用户‑景点交互矩阵;2、图片内容特征提取:利用大模型进行数据增强,将图片转为可解释性的文本语义信息;3、建立预测偏好模型:采用基于Wide&Deep变体的推荐模型,捕捉特征之间的直接关系;4、从预测偏好模型中得到用户对所有景点的偏好值,将偏好值进行降序排序,并选取前top个偏好值所对应的景点推荐给用户。本发明整合了地理信息、时间信息和大模型提取的图片内容属性信息,并设计基于Wide&Deep变体的推荐模型,从而有效提升了景点推荐的准确性和个性化水平。
背景技术
近些年来,随着互联网的快速发展,以Flickr为代表的许多社交平台开启了图片共享服务,用户可以上传与位置关联的图片,使得互联网上出现大量带有文本标签、时间戳和地理参考的图片。这些图片不仅记录了用户的日常生活,还为研究者提供了丰富的数据资源。有别于其他在线媒体,地理标记图片将地理信息、时间信息和视觉信息连接在一起,成为拍照者的数字足迹,通过分析图片上传的时间和地理信息,可以得到用户的时空运动轨迹,能够有效缓解传统的基于地理标签POI(Point Of Interest)推荐中常见的数据稀疏问题,为预测用户访问兴趣点提供重要的上下文信息。
现有的基于地理标记图片的POI推荐通常仅将图片的视觉特征和地理标记信息作为推荐任务的辅助信息,而没有充分利用图片中深层次的实体信息与氛围情感信息,没有充分考虑社交媒体数据中隐含的客户对旅游景点内容特征的偏好,因此降低了推荐的多样性和准确率,进而影响用户体验。例如,对于单个用户,发布许多攀岩、潜水图片的用户更有可能访问冒险、刺激类的景点项目;对于不同用户,其参观过的景点可能不同,但是对比图片可能会发现景点内容极其相似,这表明:即使是在不同的地点,用户也可能被相似类型的体验所吸引。
同时,现有的图片视觉特征提取方法大多基于深度神经网络(Deep NeuralNetworks, DNNs),深度神经网络通常被视为“黑盒”模型,难以直观理解其内部工作机制和决策过程,特征不具有可解释性且不同特征之间的关联无法捕捉,这对于需要透明度和可信度的POI推荐应用场景来说是一个显著的局限。同时, 目前社交平台上的许多地理标记图片包含大量的冗余信息,如低质量的图片和重复的内容,如果直接提取这些图片的表征,对于模型的压力很大,也很难识别出具体的用户偏好。冗余信息可能导致模型过拟合,影响POI推荐的准确性和个性化程度。
实现思路