文本中情感搭配集合的生成方法、装置、设备和介质制造方法及图纸

技术编号:26066648 阅读:16 留言:0更新日期:2020-10-28 16:39
本申请公开了文本中情感搭配集合的生成方法、装置、设备和介质,涉及自然语言处理和深度学习技术领域。具体实现方案为:在对评论文本中进行情感搭配挖掘的过程中,在通过词性搭配规则的方式从评论文本中准确挖掘出第一情感搭配词组后,通过评论文本对第一情感搭配词组进行扩充,并结合第一情感搭配词组和扩充的情感搭配词组,生成该评论文本的目标情感搭配结果,从而在保证情感挖掘的准确性的条件下,提升了情感挖掘的召回率,提高了评论文本中情感搭配集合的生成的整体效果。

【技术实现步骤摘要】
文本中情感搭配集合的生成方法、装置、设备和介质
本申请涉及计算机
,具体涉及自然语言处理和深度学习
,尤其涉及文本中情感搭配集合的生成方法、装置、设备和介质。
技术介绍
情感搭配通常指主观评论文本中能够表达用户评论观点的标签。情感搭配对于用户观点分析、特定商品的舆情分析、用户建模都具有重要的作用。情感搭配挖掘结果的精确程度将直接影响用户观点分析、特定商品的舆情分析、用户建模等业务的效果。因此,如何从评论文本中既准确又全面的挖掘出情感搭配是亟需解决的一个问题。
技术实现思路
本申请提供了一种文本中情感搭配集合的生成方法、装置、设备和介质。根据本申请的一方面,提供了一种文本中情感搭配集合的生成方法,包括:获取评论文本;根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。根据本申请的另一方面,提供了一种文本中情感搭配集合的生成装置,包括:第一获取模块,用于获取评论文本;第一情感搭配分析模块,根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;扩充模块,用于根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及生成模块,用于将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请的文本中情感搭配集合的生成方法。根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例公开的电子设备的文本中情感搭配集合的生成方法。上述申请中的一个实施例具有如下优点或有益效果:在对评论文本中进行情感搭配挖掘的过程中,先结合词性搭配规则对评论文本进行情感搭配分析,以得到评论文本的情感搭配集合,然后,基于原始文本,对于情感搭配集合中的第一情感搭配词组进行扩充,以得到每个第一情感搭配词组的情感搭配扩充集合,最后,对将情感搭配集合和每个第一情感搭配词组的情感搭配扩充集合进行合并,以得到评论文本的目标情感搭配集合。由此,在对评论文本中进行情感搭配挖掘的过程中,在通过词性搭配规则的方式从评论文本中准确挖掘出第一情感搭配词组后,通过评论文本对第一情感搭配词组进行扩充,并结合第一情感搭配词组和扩充的情感搭配词组,生成该评论文本的目标情感搭配结果,从而在保证情感挖掘的准确性的条件下,提升了情感挖掘的召回率,保证了情感挖掘的准确率和召回率的兼顾,提高了评论文本中情感搭配集合的生成的整体效果。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请一个实施例的文本中情感搭配集合的生成方法的流程示意图;图2是根据本申请一个实施例的步骤103的细化流程图;图3是根据本申请一个实施例的步骤203的细化流程图;图4是根据本申请一个实施例的步骤202的细化流程图一;图5是根据本申请一个实施例的步骤202的细化流程图二;图6是根据本申请一个实施例的步骤102的细化流程图;图7是结合规则的挖掘方法和基于DNN的挖掘方法对文本进行情感挖掘的示意图。图8是根据本申请一个施例的文本中情感搭配集合的生成装置的结构示意图;图9是根据本申请另一个施例的文本中情感搭配集合的生成装置的结构示意图;图10是用来实现本申请实施例的文本中情感搭配集合的生成方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。下面参考附图描述本申请实施例的文本中情感搭配集合的生成方法、装置、设备和介质。图1是根据本申请一个实施例的文本中情感搭配集合的生成方法的流程示意图。其中,需要说明的是,本实施例的文本中情感搭配集合的生成方法的执行主体为文本中情感搭配集合的生成装置,文本中情感搭配集合的生成装置可以由软件和/或硬件的方式实现,该实施例中的文本中情感搭配集合的生成装置可以配置在电子设备或者服务器中,该实施例对不作具体限定。如图1所示,该文本中情感搭配集合的生成方法可以包括:步骤101,获取评论文本。其中,本实施中的评论文本可以是通用领域中任意一个领域或者多个领域混合的评论文本,例如,评论文本可以为“美食”领域的评论文本,或者,评论文本可以为“汽车”领域的评论文本,或者,评论文本还可以由“美食”领域的评论文本和“旅游”领域的评论文本组成的。步骤102,根据预设的词性搭配规则对评论文本进行情感搭配分析,以获取评论文本的情感搭配集合,其中,情感搭配集合包括多个第一情感搭配词组。其中,第一情感搭配词组包括评价词和纬度词,例如,评论文本为“个人觉得不错,外观漂亮年轻”,对应的第一情感搭配词组为“外观漂亮”、“外观年轻”等,其中,“外观”为第一情感搭配词组“外观漂亮”的纬度词,“漂亮”为第一情感搭配词组“外观漂亮”的评价词,“外观”为第一情感搭配词组“外观年轻”的纬度词,“年轻”为第一情感搭配词组“外观年轻”的评价词。步骤103,根据评论文本对每个第一情感搭配词组进行扩充,以生成多个第一情感搭配词组对应的多个情感搭配扩充集合。在本申请的一个实施例中,根据评论文本对每个第一情感搭配词组进行扩充,以得到多个第一情感搭配词组对应的多个情感搭配扩充集合的具体实现方式可以包括多种,例如:作为一种示例性的实现方式,可基于传统的主题模型(LatentDirichletAllocation,LDA)对评论文本的分词结果集合中的每个分词进行向量表示,以得到每个分词的主题表示向量,然后,获取第一情感搭配词组中的维度词对应的标题表示向量,根据每个分词和纬度词对应的标题表示向量,确定纬度词和每个分词之间的标题相似度,然后,获取标题相似度排序在前的K个分词,并根据所获取的K个分词和第一情感搭配词组中的评价词进行组合,以得到第一情感搭本文档来自技高网...

【技术保护点】
1.一种文本中情感搭配集合的生成方法,包括:/n获取评论文本;/n根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;/n根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及/n将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。/n

【技术特征摘要】
1.一种文本中情感搭配集合的生成方法,包括:
获取评论文本;
根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;
根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及
将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。


2.根据权利要求1所述的方法,其中,所述根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合,包括:
获取每个所述第一情感搭配词组中的评价词和维度词;
根据所述评论文本和所述评价词,对所述维度词进行扩充,以生成所述第一情感搭配词组对应的维度词扩充集合,其中,所述维度词扩充集合之中包括多个扩充维度词;以及
根据所述维度词扩充集合和所述评价词,生成所述第一情感搭配词组对应的情感搭配扩充集合。


3.根据权利要求2所述的方法,其中,所述根据所述维度词扩充集合和所述评价词,以生成所述第一情感搭配词组对应的情感搭配扩充集合,包括:
将所述维度词扩充集合中的每个所述扩充维度词和所述评价词进行组合,以生成第一候选情感搭配集合,其中,所述第一候选情感搭配集合中包括多个第一候选情感搭配词组;
生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度;
根据所述多个语义相似度对所述多个第一候选情感搭配词组进行排序,以生成排序结果;以及
从所述排序结果中选择出排序在前的K个第一候选情感搭配词组,以生成所述情感搭配扩充集合,其中,所述K为大于或者等于1的整数。


4.根据权利要求3所述的方法,其中,所述生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度,包括:
获取所述第一情感搭配词组的第一语义表示向量;
分别获取多个所述第一候选情感搭配词组的多个第二语义表示向量;以及
根据所述第一语义表示向量和多个所述第二语义表示向量,分别生成所述第一情感搭配词组相对于多个所述第一候选情感搭配词组之间的语义相似度。


5.根据权利要求2所述的方法,其中,所述根据所述评论文本和所述评价词,对所述维度词进行扩充,以得到所述第一情感搭配词组的维度词扩充集合,包括:
从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
获取所述目标短句的结构特征;
根据所述目标短句的结构特征从所述评论文本中获取与所述目标短句具有相同结构特征的候选短句;
提取所述候选短句中的候选维度词;
根据所述候选维度词,生成所述第一情感搭配词组的候选维度词扩充集合;以及
根据所述候选维度词扩充集合生成所述维度词扩充集合。


6.根据权利要求2所述的方法,其中,所述根据所述评论文本和所述评价词生成所述第一情感搭配词组的维度词扩充集合,包括:
从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
根据所述目标短句,获取所述维度词对应的共线维度词;以及
根据所述共线维度词,生成所述第一情感搭配词组的维度词扩充集合。


7.根据权利要求1所述的方法,其中,在所述将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的目标情感搭配集合之前,所述方法还包括:
获取所述情感搭配扩充集合中的第二情感搭配词组;
获取所述第二情感搭配词组中的维度词在所述评论文本中的第一位置;
获取所述第二情感搭配词组中的评价词在所述评论文本中的第二位置;以及
如果所述第一位置和所述第二位置之间的文本长度超过预设长度,则将所述情感搭配扩充集合中的所述第二情感搭配词组删除。


8.根据权利要求1所述的方法,其中,所述根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,包括:
对所述评论文本进行分词处理,以得到所述评论文本的多个分词;
根据所述多个分词对应的词性和所述预设的词性搭配规则,对所述评论文本进行情感搭配抽取,以获取所述评论文本的第二候选情感搭配集合;以及
根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合。


9.根据权利要求8所述的方法,其中,所述第二候选情感搭配集合包括多个第二候选情感搭配词组,所述根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合,包括:
根据每个所述第二候选情感搭配词组中的维度词的第一语义和评价词的第二语义,对具有相同第一语义和第二语义的第二候选情感搭配词组进行聚类,以得到多个第三候选情感搭配词组;
根据每个所述第三候选情感搭配词组对应的第二候选情感搭配词组的数量,并按照所述数量从大到小的顺序进行排序,将排列在前预设数量的第三候选情感搭配词组作为所述评论文本的情感搭配集合。


10.一种文本中情感搭配集合的生成装置,包括:
第一获取模块,用于获取评论文本;
第一情感搭配分析模块,根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭...

【专利技术属性】
技术研发人员:刘昊肖欣延
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1