一种基于细粒度情感分析的多源智能旅游推荐方法技术

技术编号:37865522 阅读:29 留言:0更新日期:2023-06-15 20:55
本发明专利技术公开了一种基于细粒度情感分析的多源智能旅游推荐方法,包括如下步骤:对旅游领域数据集,在句子层级上为每个句子打上类别标签和情感标签;构建BERT结合对抗训练网络的细粒度情感分析模型,深度挖掘用户评论中隐含的细粒度评价信息;基于细粒度情感分析模型构建用户画像和景点画像,根据用户的偏好进行景点推荐。本发明专利技术加入对抗训练方法,对模型的精度提高起到了关键作用,使得模型在训练的同时学习对抗样本,进而更准确地挖掘出用户评论文本中的情感信息;将细粒度情感属性作为额外的属性值加入推荐系统中,能有效提高旅游推荐的准确率,优化用户的旅游体验。优化用户的旅游体验。优化用户的旅游体验。

【技术实现步骤摘要】
一种基于细粒度情感分析的多源智能旅游推荐方法


[0001]本专利技术属于文本数据挖掘、数据分析与智能推荐
,尤其涉及一种利用动态旅游评价文本数据结合旅行轨迹、并基于细粒度情感分析的多源智能旅游推荐方法。

技术介绍

[0002]越来越多的人在社交媒体上分享自己的旅行经历,或在旅游服务网站留下自己的评论,这些评论信息为后来的用户提供了较大的参考价值。用户在进行旅行规划时,趋向于查阅不同网络平台上其他游客的经验和意见。然而,随之而来的问题是,社交媒体评论数据在规模、种类、多样性等方面的快速增长,每天都会产生海量的文本数据,用户难以从这些海量数据中获取有效的信息用于辅助出行规划。与此同时,评论中可能会提及不同的类别,如景点的位置,特点和服务,不同用户的差异性,评论者撰写评论的方式等导致难以从这些数据中检索有用的信息。人工处理数量庞大的用户生成数据是不现实的,有关学者提出了一些数据挖掘工具与算法,利用自然语言处理技术从大规模非结构化文本数据中提取信息,用于从大数据中提取用户的关注对象与情感属性,并应用于数据分析,出行推荐等领域。然而,现有的基于情感本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于细粒度情感分析的多源智能旅游推荐方法,其特征在于:包括如下步骤:步骤1:收集社交媒体网站中与旅游有关的非结构化数据的文本信息;将收集到的文本信息进行预处理,去除重复和无效的数据,得到自行构建的旅游领域数据集;无效的数据是内容为空以及内容仅包含表情、符号或图片的数据;对旅游领域数据集的数据进行标注,在句子层级上为每个句子打上类别标签;然后,为旅游领域数据集中每个句子标注情感标签,情感标签分为“很不满意”、“不满意”、“中间态度”、“满意”和“很满意”;其中,对旅游领域数据集中部分数据打类别标签和情感标签,并将打上类别标签和情感标签的数据划分为训练集、验证集与测试集;步骤2:构建BERT结合对抗训练网络的细粒度情感分析模型,并对细粒度情感分析模型进行训练、验证与测试;构建BERT结合对抗训练网络的细粒度情感分析模型的过程具体如下:

基于BERT的深度学习模型对用户的评论数据进行处理,对于一条包含n个句子的评论R={R1,R2,R
i


,R
n
},分别在每个句子R
i
的句首和句尾添加特殊标记[CLS]和[SEP],通过深度学习模型的词嵌入器转换为M
×
768维的句向量,其中,M为评论数据中句子的字数平均值;

在步骤

中生成的句向量基础上,为每个句向量生成维度为M
×
768的字嵌入向量,以指定句向量中每个元素所处的位置;将生成的字嵌入向量与句向量相加得到组合向量;

对每个组合向量x,采用快速梯度法的对抗训练方法加入对抗扰动Δx,进行防御对抗攻击,生成对抗样本x+Δx;用(x+Δx,y)更新训练集,其中,y代表与x对应的句子的类别标签和情感标签向量;然后,使用梯度下降法来更新对抗训练网络E的参数θ;

使用Softmax函数输出组合向量所属的类别与情感分值;其中,快速梯度法具体公式为:式中,D代表训练集,θ代表对抗训练网络E参数,L(x,y;θ)...

【专利技术属性】
技术研发人员:吴向平黄少伟
申请(专利权)人:中国计量大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1