【技术实现步骤摘要】
文本中情感搭配集合的生成方法、装置、设备和介质
本申请涉及计算机
,具体涉及自然语言处理和深度学习
,尤其涉及文本中情感搭配集合的生成方法、装置、设备和介质。
技术介绍
情感搭配通常指主观评论文本中能够表达用户评论观点的标签。情感搭配对于用户观点分析、特定商品的舆情分析、用户建模都具有重要的作用。情感搭配挖掘结果的精确程度将直接影响用户观点分析、特定商品的舆情分析、用户建模等业务的效果。因此,如何从评论文本中既准确又全面的挖掘出情感搭配是亟需解决的一个问题。
技术实现思路
本申请提供了一种文本中情感搭配集合的生成方法、装置、设备和介质。根据本申请的一方面,提供了一种文本中情感搭配集合的生成方法,包括:获取评论文本;根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。根据本申请的另一方面,提供了一种文本中情感搭配集合的生成装置,包括:第一获取模块,用于获取评论文本;第一情感搭配分析模块,根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;扩充模块,用于根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成 ...
【技术保护点】
1.一种文本中情感搭配集合的生成方法,包括:/n获取评论文本;/n根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;/n根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及/n将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。/n
【技术特征摘要】
1.一种文本中情感搭配集合的生成方法,包括:
获取评论文本;
根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭配集合包括多个第一情感搭配词组;
根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合;以及
将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的情感搭配集合。
2.根据权利要求1所述的方法,其中,所述根据所述评论文本对每个所述第一情感搭配词组进行扩充,以生成所述多个第一情感搭配词组对应的多个情感搭配扩充集合,包括:
获取每个所述第一情感搭配词组中的评价词和维度词;
根据所述评论文本和所述评价词,对所述维度词进行扩充,以生成所述第一情感搭配词组对应的维度词扩充集合,其中,所述维度词扩充集合之中包括多个扩充维度词;以及
根据所述维度词扩充集合和所述评价词,生成所述第一情感搭配词组对应的情感搭配扩充集合。
3.根据权利要求2所述的方法,其中,所述根据所述维度词扩充集合和所述评价词,以生成所述第一情感搭配词组对应的情感搭配扩充集合,包括:
将所述维度词扩充集合中的每个所述扩充维度词和所述评价词进行组合,以生成第一候选情感搭配集合,其中,所述第一候选情感搭配集合中包括多个第一候选情感搭配词组;
生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度;
根据所述多个语义相似度对所述多个第一候选情感搭配词组进行排序,以生成排序结果;以及
从所述排序结果中选择出排序在前的K个第一候选情感搭配词组,以生成所述情感搭配扩充集合,其中,所述K为大于或者等于1的整数。
4.根据权利要求3所述的方法,其中,所述生成所述第一情感搭配词组分别相对于所述多个第一候选情感搭配词组之间的多个语义相似度,包括:
获取所述第一情感搭配词组的第一语义表示向量;
分别获取多个所述第一候选情感搭配词组的多个第二语义表示向量;以及
根据所述第一语义表示向量和多个所述第二语义表示向量,分别生成所述第一情感搭配词组相对于多个所述第一候选情感搭配词组之间的语义相似度。
5.根据权利要求2所述的方法,其中,所述根据所述评论文本和所述评价词,对所述维度词进行扩充,以得到所述第一情感搭配词组的维度词扩充集合,包括:
从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
获取所述目标短句的结构特征;
根据所述目标短句的结构特征从所述评论文本中获取与所述目标短句具有相同结构特征的候选短句;
提取所述候选短句中的候选维度词;
根据所述候选维度词,生成所述第一情感搭配词组的候选维度词扩充集合;以及
根据所述候选维度词扩充集合生成所述维度词扩充集合。
6.根据权利要求2所述的方法,其中,所述根据所述评论文本和所述评价词生成所述第一情感搭配词组的维度词扩充集合,包括:
从所述评论文本中提取所述第一情感搭配词组所属的目标短句;
根据所述目标短句,获取所述维度词对应的共线维度词;以及
根据所述共线维度词,生成所述第一情感搭配词组的维度词扩充集合。
7.根据权利要求1所述的方法,其中,在所述将所述情感搭配集合和所述多个情感搭配扩充集合进行合并,以生成所述评论文本的目标情感搭配集合之前,所述方法还包括:
获取所述情感搭配扩充集合中的第二情感搭配词组;
获取所述第二情感搭配词组中的维度词在所述评论文本中的第一位置;
获取所述第二情感搭配词组中的评价词在所述评论文本中的第二位置;以及
如果所述第一位置和所述第二位置之间的文本长度超过预设长度,则将所述情感搭配扩充集合中的所述第二情感搭配词组删除。
8.根据权利要求1所述的方法,其中,所述根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,包括:
对所述评论文本进行分词处理,以得到所述评论文本的多个分词;
根据所述多个分词对应的词性和所述预设的词性搭配规则,对所述评论文本进行情感搭配抽取,以获取所述评论文本的第二候选情感搭配集合;以及
根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合。
9.根据权利要求8所述的方法,其中,所述第二候选情感搭配集合包括多个第二候选情感搭配词组,所述根据所述第二候选情感搭配集合,生成所述评论文本的情感搭配集合,包括:
根据每个所述第二候选情感搭配词组中的维度词的第一语义和评价词的第二语义,对具有相同第一语义和第二语义的第二候选情感搭配词组进行聚类,以得到多个第三候选情感搭配词组;
根据每个所述第三候选情感搭配词组对应的第二候选情感搭配词组的数量,并按照所述数量从大到小的顺序进行排序,将排列在前预设数量的第三候选情感搭配词组作为所述评论文本的情感搭配集合。
10.一种文本中情感搭配集合的生成装置,包括:
第一获取模块,用于获取评论文本;
第一情感搭配分析模块,根据预设的词性搭配规则对所述评论文本进行情感搭配分析,以获取所述评论文本的情感搭配集合,其中,所述情感搭...
【专利技术属性】
技术研发人员:刘昊,肖欣延,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。