情感属性获取方法、装置、设备、及存储介质制造方法及图纸

技术编号:27212186 阅读:31 留言:0更新日期:2021-02-04 11:27
本申请实施例公开了一种情感属性获取方法、装置、设备及计算机可读存储介质,本申请实施例通过获取待分析文本,以及获取所述待分析文本中各个字符的特征信息;对所述待分析文本进行向量化处理,获得所述待分析文本的向量矩阵;根据所述待分析文本中各个字符的特征信息与所述向量矩阵,获取拼接后的向量矩阵信息;根据所述待分析文本、各个字符的特征信息以及拼接后的向量矩阵信息,获得所述待分析文本对应的情感属性。提高了情感属性获取的准确性以及效率。及效率。及效率。

【技术实现步骤摘要】
情感属性获取方法、装置、设备、及存储介质


[0001]本申请涉及数据处理
,具体涉及一种情感属性获取方法、装置、设备及存储介质。

技术介绍

[0002]随着电子商务和互联网的迅猛发展,网上浏览商品、下订单、支付以及发表个人对商品的使用感受和评价已然成为人们的日常习惯。这些评论文本反映了消费者对此产品在各个维度的褒贬喜恶,即用户对产品的评价属性,比如用户对某款手机的评价“还好吧,外观绚丽,电池耗电太快了,拍照功能中规中矩”,其中,评价属性“外观”的情感倾向为正向,“电池耗电”的情感倾向为负向,“拍照功能”的情感倾向为中性,正向、负向以及中性即为评价属性的情感。
[0003]现在方法获取情感属性主要分为三种:一种是基于频率的方法,首先对评论文本使用关联规则提取商品属性,然后利用情感词典对情感倾向进行判别,该方法存在较大局限性,比如容易引入噪音词以及难以处理长尾词,仅依靠情感词典难以处理动态的表述方式。第二种是基于模板规则的方法,通过制定词性、依存句法模板对属性和情感词进行联合提取,此方法除了具有第一种方法中的情感判别难题,还存在依赖专家耗时耗力制定规则,模板难以适应日新月异的口语化表达。第三种是基于条件随机场的方法,通过人工制定特征模板,然后将这些特征送入基于概率的模型进行训练,此方法也需要手工制定特征规则,模型复杂度较大,需要较多人工介入。

技术实现思路

[0004]本申请实施例提供一种情感属性获取方法、装置、设备及存储介质,可以实现获取情感属性的效率,以及提高情感属性获取的准确性。/>[0005]第一方面,本申请实施例提供了一种情感属性获取方法,包括:
[0006]获取待分析文本,以及获取所述待分析文本中各个字符的特征信息;
[0007]对所述待分析文本进行向量化处理,获得所述待分析文本的向量矩阵;
[0008]根据所述待分析文本中各个字符的特征信息与所述向量矩阵,获取拼接后的向量矩阵信息;
[0009]根据所述待分析文本、各个字符的特征信息以及拼接后的向量矩阵信息,获得所述待分析文本对应的情感属性。
[0010]在一些实施方式中,所述根据所述待分析文本中各个字符的特征信息与所述向量矩阵,获取拼接后的向量矩阵信息,包括:
[0011]获取所述特征信息对应的字符在所述待分析文本中的第一位置,以及所述向量矩阵对应字符在所述待分析文本中的第二位置;
[0012]根据所述第一位置以及第二位置将所述待分析文本中各个字符的特征信息与所述向量矩阵进行拼接,获得拼接后的向量矩阵信息。
[0013]在一些实施方式中,所述根据所述待分析文本以及拼接后的向量矩阵信息,获得所述待分析文本对应的情感属性,包括:
[0014]获取所述各个字符的特征信息的向量;
[0015]根据所述待分析文本以及拼接后的向量矩阵信息计算所述待分析文本的标签分数;
[0016]根据所述标签分数获取所述待分析文本对应的情感属性。
[0017]在一些实施方式中,所述对所述待分析文本进行向量化处理,获得所述待分析文本的向量矩阵,包括:
[0018]通过训练后向量化模型对输入的待分析文本进行分词处理,生成组成所述待分析文本的词语,并获取所述词语对应的词向量;
[0019]将所述词向量按所述待分析文本对应的字符排列顺序进行连接,得到所述待分析文本的向量矩阵。
[0020]在一些实施方式中,所述通过向量化模型对输入的待分析文本进行分词处理,生成组成所述待分析文本的词语,包括:
[0021]将所述待分析文本切分出与预设词库匹配的词,得到初始词语;
[0022]通过所述向量化模型获取所述初始词语与预设词库中各个词语之间的最优路径;
[0023]根据所述最优路径确定组成所述待分析文本的词语。
[0024]在一些实施方式中,所述通过向量化模型对输入的待分析文本进行分词处理,生成组成所述待分析文本的词语,并获取所述词语对应的词向量之前,还包括:
[0025]获取标注有真实词语类别的同一偏旁部首的词语,得到训练样本;
[0026]确定所述训练样本的词语预测类别;
[0027]根据所述真实词语类别和词语预测类别获取预设的损失函数;
[0028]根据所述损失函数对所述向量化模型进行收敛,获得训练后向量化模型。
[0029]在一些实施方式中,所述特征信息包括偏旁部首,所述获取所述待分析文本中各个字符的特征信息,包括:
[0030]获取基础部首表;
[0031]对所述待分析文本中各个字符进行拆分,得到所述待分析文本的子字符;
[0032]根据所述基础部首表与所述子字符获取所述待分析文本中各个字符的偏旁部首。
[0033]第二方面,本申请实施例还提供了一种情感属性获取装置,包括:
[0034]第一获取单元,用于获取待分析文本,以及获取所述待分析文本中各个字符的特征信息;
[0035]向量化单元,用于对所述待分析文本进行向量化处理,获得所述待分析文本的向量矩阵;
[0036]第二获取单元,用于根据所述待分析文本中各个字符的特征信息与所述向量矩阵,获取拼接后的向量矩阵信息;
[0037]情感属性获得单元,用于根据所述待分析文本以及拼接后的向量矩阵信息,获得所述待分析文本对应的情感属性。
[0038]在一些实施方式中,所述第二获取单元,包括:
[0039]第一获取子单元,用于获取所述特征信息对应的字符在所述待分析文本中的第一
位置,以及所述向量矩阵对应字符在所述待分析文本中的第二位置;根据所述第一位置以及第二位置将所述待分析文本中各个字符的特征信息与所述向量矩阵进行拼接,获得拼接后的向量矩阵信息。
[0040]在一些实施方式中,所述情感属性获得单元,包括:
[0041]第二获取子单元,用于获取所述各个字符的特征信息的向量;
[0042]计算子单元,用于根据所述待分析文本以及拼接后的向量矩阵信息计算所述待分析文本的标签分数;
[0043]第三获取子单元,用于根据所述标签分数获取所述待分析文本对应的情感属性。
[0044]在一些实施方式中,所述向量化单元,包括:
[0045]生成子单元,用于通过训练后向量化模型对输入的待分析文本进行分词处理,生成组成所述待分析文本的词语,并获取所述词语对应的词向量;
[0046]连接子单元,用于将所述词向量按所述待分析文本对应的字符排列顺序进行连接,得到所述待分析文本的向量矩阵。
[0047]在一些实施方式中,所述生成子单元,包括:
[0048]切分模块,用于将所述待分析文本切分出与预设词库匹配的词,得到初始词语;
[0049]获取模块,用于通过所述向量化模型获取所述初始词语与预设词库中各个词语之间的最优路径;根据所述最优路径确定组成所述待分析文本的词语。
[0050]在一些实施方式中,所述向量化单元,包括:本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种情感属性获取方法,其特征在于,包括:获取待分析文本,以及获取所述待分析文本中各个字符的特征信息;对所述待分析文本进行向量化处理,获得所述待分析文本的向量矩阵;根据所述待分析文本中各个字符的特征信息与所述向量矩阵,获取拼接后的向量矩阵信息;根据所述待分析文本、各个字符的特征信息以及拼接后的向量矩阵信息,获得所述待分析文本对应的情感属性。2.根据权利要求1所述的情感属性获取方法,其特征在于,所述根据所述待分析文本中各个字符的特征信息与所述向量矩阵,获取拼接后的向量矩阵信息,包括:获取所述特征信息对应的字符在所述待分析文本中的第一位置,以及所述向量矩阵对应字符在所述待分析文本中的第二位置;根据所述第一位置以及第二位置将所述待分析文本中各个字符的特征信息与所述向量矩阵进行拼接,获得拼接后的向量矩阵信息。3.根据权利要求1所述的情感属性获取方法,其特征在于,所述根据所述待分析文本以及拼接后的向量矩阵信息,获得所述待分析文本对应的情感属性,包括:获取所述各个字符的特征信息的向量;根据所述待分析文本以及拼接后的向量矩阵信息计算所述待分析文本的标签分数;根据所述标签分数获取所述待分析文本对应的情感属性。4.根据权利要求1所述的情感属性获取方法,其特征在于,所述对所述待分析文本进行向量化处理,获得所述待分析文本的向量矩阵,包括:通过训练后向量化模型对输入的待分析文本进行分词处理,生成组成所述待分析文本的词语,并获取所述词语对应的词向量;将所述词向量按所述待分析文本对应的字符排列顺序进行连接,得到所述待分析文本的向量矩阵。5.根据权利要求4所述的情感属性获取方法,其特征在于,所述通过向量化模型对输入的待分析文本进行分词处理,生成组成所述待分析文本的词语,包括:将所述待分析文本切分出与预设词库匹配的词,得到初始...

【专利技术属性】
技术研发人员:郭林东陈东沂姚小龙张铭杰杨晓瑜李佳玮孙钥徐冬焱
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1