【技术实现步骤摘要】
评论文本处理方法、装置、存储介质和计算机设备
本申请涉及计算机
,特别是涉及一种评论文本处理方法、装置、存储介质和计算机设备。
技术介绍
随着计算机技术和互联网技术的发展,越来越多的用户习惯通过网络获取内容。比如通过网络观看视频、浏览新闻或者文章等。这些内容的评论可以侧面反映内容的质量,从而很大程度上影响了其他用户是否会浏览这些内容。现有技术中通常是工作人员人工查看评论得到评论对于内容的情感极性,然而,这种方式不仅耗费大量的人力而且对于情感极性的主观理解不一,导致评论处理的准确率较低。
技术实现思路
基于此,有必要针对目前评论处理准确率较低的技术问题,提供一种评论文本处理方法、装置、存储介质和计算机设备。一种评论文本处理方法,包括:获取目标内容所对应的评论文本;对所述评论文本进行分词,得到所述评论文本所对应的词序列;根据所述词序列及所述词序列中包括的情感关键词,得到所述评论文本所对应的情感特征;根据所述词序列及所述词序列中包括的噪声关键词,得到 ...
【技术保护点】
1.一种评论文本处理方法,包括:/n获取目标内容所对应的评论文本;/n对所述评论文本进行分词,得到所述评论文本所对应的词序列;/n根据所述词序列及所述词序列中的情感词,得到所述评论文本的情感特征;/n根据所述词序列及所述词序列中的噪声词,得到所述评论文本的质量特征;/n结合所述情感特征和所述质量特征,确定所述评论文本对于所述目标内容的情感极性。/n
【技术特征摘要】
1.一种评论文本处理方法,包括:
获取目标内容所对应的评论文本;
对所述评论文本进行分词,得到所述评论文本所对应的词序列;
根据所述词序列及所述词序列中的情感词,得到所述评论文本的情感特征;
根据所述词序列及所述词序列中的噪声词,得到所述评论文本的质量特征;
结合所述情感特征和所述质量特征,确定所述评论文本对于所述目标内容的情感极性。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述词序列得到所述评论文本的语义特征;
所述结合所述情感特征和所述质量特征,确定所述评论文本对于所述目标内容的情感极性,包括:
结合所述语义特征、所述情感特征和所述质量特征,确定所述评论文本对于所述目标内容的情感极性。
3.根据权利要求2所述的方法,其特征在于,所述评论文本的数量多于一个;每个所述评论文本对应一个词序列;所述根据所述词序列得到所述评论文本的语义特征,包括:
根据多于一个词序列,得到多于一个评论文本共同对应的语义特征;
所述根据所述词序列及所述词序列中的情感词,得到所述评论文本的情感特征,包括:
根据多于一个词序列及所述多于一个词序列中的情感词,得到多于一个评论文本共同对应的情感特征;
所述根据所述词序列及所述词序列中的噪声词,得到所述评论文本的质量特征,包括:
根据多于一个词序列及所述多于一个词序列中的噪声词,得到多于一个评论文本共同对应的质量特征。
4.根据权利要求2所述的方法,其特征在于,所述结合所述语义特征、所述情感特征和所述质量特征,确定所述评论文本对于所述目标内容的情感极性,包括:
将所述语义特征融入所述情感特征,得到语义感知的情感特征;
基于所述情感特征进行自融合,得到自感知的情感特征;
将所述质量特征融入所述情感特征,得到质量感知的情感特征;
根据所述语义感知的情感特征、所述自感知的情感特征和所述质量感知的情感特征,得到所述评论文本对于所述目标内容的情感极性。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
向量化所述词序列包括的词,得到所述评论文本对应的评论向量;
所述根据所述词序列得到所述评论文本的语义特征,包括:
根据所述评论向量得到所述评论文本的语义特征向量;
所述根据所述词序列及所述词序列中的情感词,得到所述评论文本的情感特征,包括:
根据所述评论向量及所述评论向量中的情感词向量,得到所述评论文本的情感特征向量;
所述根据所述词序列及所述词序列中的噪声词,得到所述评论文本的质量特征,包括:
根据所述评论向量及所述评论向量中的噪声词向量,得到所述评论文本的质量特征向量;
所述结合所述语义特征、所述情感特征和所述质量特征,确定所述评论文本对于所述目标内容的情感极性,包括:
结合所述语义特征向量、所述情感特征向量和所述质量特征向量,确定所述评论文本对于所述目标内容的情感极性。
6.根据权利要求5所述的方法,其特征在于,所述根据所述评论向量得到所述评论文本的语义特征向量,包括:
通过多于一个注意力网络分别对所述评论向量进行处理,得到多于一个子空间下的语义特征子向量;每个子空间对应一个语义特征子向量;
根据拼接所述语义特征子向量的结果,确定所述评论文本的语义特征向量。
7.根据权利要求5所述的方法,其特征在于,所述根据所述评论向量及所述评论向量中的情感词向量,得到所述评论文本的情感特征向量,包括:
通过多于一个注意力网络基于所述评论向量,生成所述评论向量的自关注注意力向量;
通过多于一个注意力网络基于所述自关注注意力向量和所述情感词向量,生成情感词注意力向量;
通过多于一个注意力...
【专利技术属性】
技术研发人员:唐湘云,黄申,廖东亮,黎功福,徐进,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。