一种基于情感分类的多层归因图谱构建方法技术

技术编号:30345628 阅读:19 留言:0更新日期:2021-10-12 23:32
本发明专利技术提供一种基于情感分类的多层归因图谱构建方法,包括:步骤一、数据处理:步骤二、利用步骤一中处理后得到的样本,进行LSTM网络搭建,并训练得到如下两个模型:a)情感倾向的极性分类预测模型,b)负向内容倾向的方面级相关分类预测模型,步骤三、方面特征框架的形成:步骤四、将模型a)和模型b)训练建模后,对预测样本进行预测形成两种不同分类的预测结果标签,并对结果标签进行交叉,形成更细化的分类,最后提取其中的负向内容,结合上述模型的LSTM预测标签,形成方面级特征框架雏形;步骤五、对于方面级特征框架雏形中每个细分群进行进一步关注级细化分群。本发明专利技术对评论的归纳更方便用户针对性制定应对措施。用户针对性制定应对措施。用户针对性制定应对措施。

【技术实现步骤摘要】
一种基于情感分类的多层归因图谱构建方法


[0001]本专利技术涉及一种基于情感分类的多层归因图谱构建方法,属于电子商务领域。

技术介绍

[0002]随着电子商务的发展。越来越多的用户对商品/服务的看法和评价观点出现在网络上,影响着后续的用户购买决策。据研究表明:有87%的消费者会在购买前阅读商品的在线评论;93%的消费者表示,在线评论会影响到他们的购物决策;更是会有消费者愿意为同款产品或服务最多支付15%的费用,只要这款商品或服务能为他们带来更好的消费体验。
[0003]在体验过相关产品或服务后,越来越多的情感倾向内容出现在网络上。而这种情感倾向又进一步被后续参与购买的消费者关注与参考,影响着他们的购买决策。而传统的情感分析仅对用户的整体倾向进行识别,无法跟踪到这些情感倾向的具体原因和引发的触点,导致其对于商家而言无法落地于营销推进、和产品/服务的跟踪完善。

技术实现思路

[0004]本专利技术的目的在于提供一种基于情感分类的多层归因图谱构建方法,本专利技术不仅提供了方面级特征框架雏形的形成方法,还提供了在方面级特征框架雏形之内,融合业务和模型,从情感倾向、引发触点这两个视角,构建基于评论内容的多层归因图谱的方法,根据多层归因图谱内容,产出采取措施建议。
[0005]本专利技术提供一种基于情感分类的多层归因图谱构建方法,其特征在于,包括如下步骤:
[0006]一种基于情感分类的多层归因图谱构建方法,其特征在于,包括如下步骤:
[0007]步骤一、数据处理:对打好标签的辅助领域和源领域的样本,使用分词工具进行分词、对标点和停用词处理,并且将分词后的文本映射成向量;
[0008]步骤二、利用步骤一中处理后得到的样本,进行LSTM网络搭建,并训练得到如下两个模型:
[0009]a)情感倾向的极性分类预测模型,
[0010]b)负向内容倾向的方面级相关分类预测模型,
[0011]步骤三、方面特征框架的形成:
[0012]利用上述训练好的模型a)和模型b)对新数据进行标签预测打标,
[0013]根据模型a)生成情感倾向的极性分类标签,
[0014]根据模型b)生成负向内容倾向的方面级相关分类标签,形成方面级大类框架;
[0015]步骤四、
[0016]将模型a)和模型b)训练建模后,对预测样本进行预测形成两种不同分类的预测结果标签,并对结果标签进行交叉,形成更细化的分类,最后提取其中的负向内容,结合上述模型的LSTM预测标签,形成方面级特征框架雏形;
[0017]步骤五、对于方面级特征框架雏形中每个细分群进行进一步关注级细化分群,方
式如下:
[0018]再次通过框架内聚类分群对关键词进行不同粒度的多层细分,形成可供专家自由选择的分合弹性归纳空间,然后结合业务归纳及可辨识度,进一步根据交互观测图谱确定合适的细分粒度,通过这种交互归纳提炼出可理解、可操作的多项关注级细化关注点,并提取其中的特征关键词,补充到层级特征关键词映射表中;
[0019]清晰化聚焦分群:在不影响清晰化也不影响操作针对性,且可控的前提下,对于每个关注级细化分群覆盖到尽可能多的评论样本,对于需要引入的类群,提取其中对应层级特征关键词增入到层级特征关键词映射表中;
[0020]对方面级特征框架雏形中的每个细分群均作上述处理,逐步形成基于评论内容的多层归因图谱。
[0021]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:在步骤四和步骤五之间还包括步骤六,应用延展步骤:步骤6

1,使用业务层级关键词映射表接收业务层设置的关键词。
[0022]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:步骤六中还包括:步骤6

2,融合业务人员细分,并辅以模型细分观测,进一步补充与完善步骤6

1中的业务层级关键词映射表。
[0023]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:步骤五中,在步骤四搭建形成的方面级特征框架雏形范围内,针对其中的每个细分评论群,根据业务视角分群的交互图谱和经无监督模型分类后的类群对应的交互图谱之间的清晰度和区分程度穿插构建聚焦分群。
[0024]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:步骤五中,还包括构建清晰化聚焦分群的步骤:在步骤四搭建形成的方面级特征框架雏形范围内,针对其中的每个细分评论群,使用经业务视角分群的交互图谱和经无监督模型分类后的类群对应的交互图谱之间的清晰度和区分程度来穿插构建清晰化聚焦分群。
[0025]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:步骤五中,还包括形成补充细分群的步骤:形成补充细分群:若在无监督分类模型中有出现,但前期业务关键词梳理中未包含的细分群,根据观测到的图谱内容,补充层级特征关键词到映射表中。
[0026]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:步骤二中,情感倾向的极性分类预测模型,第一层采用bi

LSTM最后的1个输出单元经sigmoid函数计算,得到最终的分类值;
[0027]负向内容倾向的方面级相关分类预测模型采用标准的LSTM神经网络,之后形成多个输出单元由softmax层计算得出对应的分类值。
[0028]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:对方面级特征框架雏形中的每个细分群均作:步骤6

1步骤6

2和再次通过框架内聚类分群对关键词进行不同粒度的多层细分,清晰化聚焦分群,形成补充细分群的处理,形成基于评论内容的多层归因图谱。
[0029]进一步,本专利技术的基于情感分类的多层归因图谱构建方法,还具有这样的特征:提取出被评价对象的主语或主语的名词作为引发触点视角,引发触点视角表示由哪些对象而
引发的这些负面情绪;其余的特征关键词划归为细分情感倾向视角。
附图说明
[0030]图1是多层归因图谱结果样例表的酒店服务大类的结果部分。
[0031]图2是多层归因图谱结果样例表的酒店设施大类的结果部分。
[0032]图3是多层归因图谱结果样例表的酒店周边环境大类的结果部分。
具体实施方式
[0033]以下通过具体实施方式来进一步说明本专利技术的技术方案。
[0034]由于消费者进行酒店消费的频次较低,造成大多数酒店商家积累的在线评论数量较小。因此引入一些与酒店评论所使用的评论用语相似的其它领域的评论数据。从而在模型学习的初始阶段提供更为充足的学习样本。
[0035]数据集:采用一部分已打好情感极性标签和方面级标签的某旅游站的酒店评论+某网站书评评论数据。此处某旅游网站的酒店评论称之为源领域样本,某网站书评评论数据称之为辅助领域的样本。
[0036]步骤1.本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于情感分类的多层归因图谱构建方法,其特征在于,包括如下步骤:步骤一、数据处理:对打好标签的辅助领域和源领域的样本,使用分词工具进行分词、对标点和停用词处理,并且将分词后的文本映射成向量;步骤二、利用步骤一中处理后得到的样本,进行LSTM网络搭建,并训练得到如下两个模型:a)情感倾向的极性分类预测模型,b)负向内容倾向的方面级相关分类预测模型,步骤三、方面特征框架的形成:利用上述训练好的模型a)和模型b)对新数据进行标签预测打标,根据模型a)生成情感倾向的极性分类标签,根据模型b)生成负向内容倾向的方面级相关分类标签,形成方面级大类框架;步骤四、将模型a)和模型b)训练建模后,对预测样本进行预测形成两种不同分类的预测结果标签,并对结果标签进行交叉,形成更细化的分类,最后提取其中的负向内容,结合上述模型的LSTM预测标签,形成方面级特征框架雏形;步骤五、对于方面级特征框架雏形中每个细分群进行进一步关注级细化分群,方式如下:再次通过框架内聚类分群对关键词进行不同粒度的多层细分,形成可供专家自由选择的分合弹性归纳空间,然后结合业务归纳及可辨识度,进一步根据交互观测图谱确定合适的细分粒度,通过这种交互归纳提炼出可理解、可操作的多项关注级细化关注点,并提取其中的特征关键词,补充到层级特征关键词映射表中;清晰化聚焦分群:在不影响清晰化也不影响操作针对性,且可控的前提下,对于每个关注级细化分群覆盖到尽可能多的评论样本,对于需要引入的类群,提取其中对应层级特征关键词增入到层级特征关键词映射表中;对方面级特征框架雏形中的每个细分群均作上述处理,逐步形成基于评论内容的多层归因图谱。2.如权利要求1所述的基于情感分类的多层归因图谱构建方法,其特征在于:在步骤四和步骤五之间还包括步骤六,应用延展步骤:步骤6

1,使用业务层级关键词映射表接收业务层设置的关键词。3.如权利要求2所述的基于情感分类的多层归因图谱构建方法,其特征在于:步骤六中还包括:步骤6

2,融合业务人员细分,并辅以模型细分观测,进一...

【专利技术属性】
技术研发人员:钱虹江元元
申请(专利权)人:创络上海数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1