【技术实现步骤摘要】
文本处理、装置、存储介质及设备
本申请涉及人工智能
,特别涉及一种文本处理、装置、存储介质及设备。
技术介绍
对文本进行情感分析(SentimentAnalysis,SA),是人工智能
中一种典型的自然语言处理(NaturalLanguageProcessing)NLP)任务,目前具有广泛的应用场景。其中,情感分析也可称之为意见挖掘或倾向性分析等,用于分析人们的观点或情绪,以评估用户对诸如产品或服务等实体的情感趋向或态度。示例性地,用户在对指定产品发表文本评价之后,可通过对该文本评价进行情感分析来确定其情感极性(包括但不限于积极、消极或中立),从而确定用户对该指定产品的情感趋向,比如用户是否喜爱该指定产品。在对文本进行情感分析时,准确率比如方面词是否抽取准确,以及情感极性是否预测准确至关重要,是衡量一个情感分析方案的重要指标。为此,如何对文本进行情感分析,便成为了时下本领域技术人员亟待解决的一个问题。
技术实现思路
本申请实施例提供了一种文本处理、装置、存储介质及设备,能够提高 ...
【技术保护点】
1.一种文本处理方法,其特征在于,所述方法包括:/n获取待处理文本,对所述待处理文本执行向量化处理得到共享特征向量;/n分别对所述共享特征向量执行与方面词抽取任务对应的第一编码处理、与观点词抽取任务对应的第二编码处理和与方面级别情感分类任务对应的第三编码处理,依次得到第一特征向量、第二特征向量和第三特征向量;/n基于所述第一特征向量、所述第二特征向量和所述第三特征向量执行信息传递处理,所述信息传递处理是指在所述方面词抽取任务、所述观点词抽取任务和所述方面级别情感分类任务中的任意两两任务间进行双向特征信息传递;/n基于信息传递处理后得到的特征向量,对所述待处理文本进行方面词抽 ...
【技术特征摘要】 【专利技术属性】
1.一种文本处理方法,其特征在于,所述方法包括:
获取待处理文本,对所述待处理文本执行向量化处理得到共享特征向量;
分别对所述共享特征向量执行与方面词抽取任务对应的第一编码处理、与观点词抽取任务对应的第二编码处理和与方面级别情感分类任务对应的第三编码处理,依次得到第一特征向量、第二特征向量和第三特征向量;
基于所述第一特征向量、所述第二特征向量和所述第三特征向量执行信息传递处理,所述信息传递处理是指在所述方面词抽取任务、所述观点词抽取任务和所述方面级别情感分类任务中的任意两两任务间进行双向特征信息传递;
基于信息传递处理后得到的特征向量,对所述待处理文本进行方面词抽取和方面级别的情感极性分类。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述共享特征向量执行与文档级别领域分类任务对应的第四编码处理,以及与文档级别情感分类任务对应的第五编码处理,依次得到第四特征向量和第五特征向量;
所述基于信息传递处理后得到的特征向量,对所述待处理文本进行方面词抽取和方面级别的情感极性分类,包括:
基于所述第四特征向量、所述第五特征向量和所述信息传递处理后得到的特征向量,执行信息聚合处理;其中,所述第四特征向量单向传递到所述方面词抽取任务和所述观点词抽取任务,所述第五特征向量单向传递到所述方面级别情感分类任务;
基于得到的聚合信息,对所述待处理文本进行方面词抽取和方面级别的情感极性分类。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量、所述第二特征向量和所述第三特征向量执行信息传递处理,包括:
对于所述方面级别情感分类任务,根据所述第一特征向量,获取所述方面词抽取任务传递到所述方面级别情感分类任务的第一特征信息;
根据所述第二特征向量,获取所述观点词抽取任务传递到所述方面级别情感分类任务的第二特征信息;
基于所述第三特征向量、所述第一特征信息和所述第二特征信息执行特征连接处理。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量、所述第二特征向量和所述第三特征向量执行信息传递处理,包括:
对于所述观点词抽取任务,根据所述第一特征向量,获取所述方面词抽取任务传递到所述观点词抽取任务的第三特征信息;
根据所述第三特征向量,获取所述方面级别情感分类任务传递到所述观点词抽取任务的第四特征信息;
基于所述第二特征向量、所述第三特征信息和所述第四特征信息执行特征连接处理。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征向量、所述第二特征向量和所述第三特征向量执行信息传递处理,包括:
对于所述方面词抽取任务,根据所述第二特征向量,获取所述观点词抽取任务传递到所述方面词抽取任务的第五特征信息;
根据所述第三特征向量,获取所述方面级别情感分类任务传递到所述方面词抽取任务的第六特征信息;
基于所述第一特征向量、所述第五特征信息和所述第六特征信息执行特征连接处理。
6.根据权利要求2所述的方法,其特征在于,所述文本处理包括T次迭代过程,其中,T和t的取值为正整数,0≤t≤T;
所述基于所述第四特征向量、所述第五特征向量和所述信息传递处理后得到的特征向量,执行信息聚合处理,包括:
对于第t+1轮迭代过程,基于所述第四特征向量和第六特征向量执行信息聚合处理,将得到的第一聚合信息返回并执行所述第一编码处理,所述第六特征向量为t轮信息传递处理之后所述方面词抽取任务对应的特征向量;
对于第t+1轮迭代过程,基于所述第四特征向量和第七特征向量执行信息聚合处理,将得到的第二聚合信息返回并执行所述第二编码处理,所述第七特征向量为t轮信息传递处理之后所述观点词抽取任务对应的特征向量;
对于第t+1轮迭代过程,基于所述第五特征向量和第八特征向量执行信息聚合处理,将得到的第三聚合信息返回并执行所述第三编码处理,所述第八特征向量为t轮信息传递处理之后所述方面级别情感分类任务对应的特征向量。
7.根据权利要求6所述的方法,所述基于得到的聚合信息,对所述待处理文本进行方面词抽取和方面级别的情感极性分类,包括:
在经过T轮迭代之后,基于第T轮迭代过程得到的聚合信息,获取所述待处理文本中各个词最终的隐层表示向量;
对所述待处理文本中各个词最终的隐层表示向量执行全连接处理,得到所述待处理文本的方面词和方面级别的情感极性分类结果。
8.根据权利要求2所述的方法,其特征在于,所述根据所述第二特征向量,获取所述观点词抽取任务传递到所述方面级别情感分类任务的第二特征信息,包括:
技术研发人员:梁云龙,孟凡东,张金超,周杰,徐金安,陈钰枫,
申请(专利权)人:腾讯科技深圳有限公司,北京交通大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。