【技术实现步骤摘要】
一种基于细粒度情感分析的多源智能旅游推荐方法
[0001]本专利技术属于文本数据挖掘、数据分析与智能推荐
,尤其涉及一种利用动态旅游评价文本数据结合旅行轨迹、并基于细粒度情感分析的多源智能旅游推荐方法。
技术介绍
[0002]越来越多的人在社交媒体上分享自己的旅行经历,或在旅游服务网站留下自己的评论,这些评论信息为后来的用户提供了较大的参考价值。用户在进行旅行规划时,趋向于查阅不同网络平台上其他游客的经验和意见。然而,随之而来的问题是,社交媒体评论数据在规模、种类、多样性等方面的快速增长,每天都会产生海量的文本数据,用户难以从这些海量数据中获取有效的信息用于辅助出行规划。与此同时,评论中可能会提及不同的类别,如景点的位置,特点和服务,不同用户的差异性,评论者撰写评论的方式等导致难以从这些数据中检索有用的信息。人工处理数量庞大的用户生成数据是不现实的,有关学者提出了一些数据挖掘工具与算法,利用自然语言处理技术从大规模非结构化文本数据中提取信息,用于从大数据中提取用户的关注对象与情感属性,并应用于数据分析,出行推荐等领域。 ...
【技术保护点】
【技术特征摘要】
1.一种基于细粒度情感分析的多源智能旅游推荐方法,其特征在于:包括如下步骤:步骤1:收集社交媒体网站中与旅游有关的非结构化数据的文本信息;将收集到的文本信息进行预处理,去除重复和无效的数据,得到自行构建的旅游领域数据集;无效的数据是内容为空以及内容仅包含表情、符号或图片的数据;对旅游领域数据集的数据进行标注,在句子层级上为每个句子打上类别标签;然后,为旅游领域数据集中每个句子标注情感标签,情感标签分为“很不满意”、“不满意”、“中间态度”、“满意”和“很满意”;其中,对旅游领域数据集中部分数据打类别标签和情感标签,并将打上类别标签和情感标签的数据划分为训练集、验证集与测试集;步骤2:构建BERT结合对抗训练网络的细粒度情感分析模型,并对细粒度情感分析模型进行训练、验证与测试;构建BERT结合对抗训练网络的细粒度情感分析模型的过程具体如下:
①
基于BERT的深度学习模型对用户的评论数据进行处理,对于一条包含n个句子的评论R={R1,R2,R
i
,
…
,R
n
},分别在每个句子R
i
的句首和句尾添加特殊标记[CLS]和[SEP],通过深度学习模型的词嵌入器转换为M
×
768维的句向量,其中,M为评论数据中句子的字数平均值;
②
在步骤
①
中生成的句向量基础上,为每个句向量生成维度为M
×
768的字嵌入向量,以指定句向量中每个元素所处的位置;将生成的字嵌入向量与句向量相加得到组合向量;
③
对每个组合向量x,采用快速梯度法的对抗训练方法加入对抗扰动Δx,进行防御对抗攻击,生成对抗样本x+Δx;用(x+Δx,y)更新训练集,其中,y代表与x对应的句子的类别标签和情感标签向量;然后,使用梯度下降法来更新对抗训练网络E的参数θ;
④
使用Softmax函数输出组合向量所属的类别与情感分值;其中,快速梯度法具体公式为:式中,D代表训练集,θ代表对抗训练网络E参数,L(x,y;θ)...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。