【技术实现步骤摘要】
文本数据处理方法、装置、电子设备及存储介质
本申请涉及自然语言处理
,更具体地,涉及一种文本数据处理方法、装置、电子设备及存储介质。
技术介绍
情感分析是自然语言处理中的一项基本任务,可以用来挖掘用户的意见,进行数据分析、舆情监控等任务。情感分析又可分为情感信息的抽取、情感信息的分类以及情感信息的检索与归纳。其中,情感分类是指根据文本所表达的含义和情感信息将文本划分成褒扬的或贬义的两种或几种类型,是对文本作者倾向性和观点、态度的划分。但一个句子针对不同方面可能涉及多种不同的情感,目前在对包含多种情感或多个方面的文本进行情感分类时,存在局限性。
技术实现思路
本申请提出了一种文本数据处理方法、装置、电子设备及存储介质,以改善上述缺陷。第一方面,本申请实施例提供了一种文本数据处理方法,所述方法包括:获取待分类文本数据;从所述待分类文本数据中提取方面特征词;获取所述待分类文本数据的文本词向量表示以及所述方面特征词的方面特征词向量表示;将所述文本词向量表示和所述方面特征词向量表示分别输入目标神经网络,得到所述文本词向量表示的第一隐藏层含义和所述方面特征词向量表示的第二隐藏层含义,其中,所述目标神经网络被预先训练,用于根据输入的词向量表示,输出所述词向量表示的隐藏层含义;基于所述第一隐藏层含义和所述第二隐藏层含义,得到所述方面特征词的目标分类特征;根据所述方面特征词的目标分类特征,获取所述方面特征词的预测情感极性;根据所述预测情感极性对所述待分类文本数据进行情感分类,以得到所述方面特征词对应的 ...
【技术保护点】
1.一种文本数据处理方法,其特征在于,所述方法包括:/n获取待分类文本数据;/n从所述待分类文本数据中提取方面特征词;/n获取所述待分类文本数据的文本词向量表示以及所述方面特征词的方面特征词向量表示;/n将所述文本词向量表示和所述方面特征词向量表示分别输入目标神经网络,得到所述文本词向量表示的第一隐藏层含义和所述方面特征词向量表示的第二隐藏层含义,其中,所述目标神经网络被预先训练,用于根据输入的词向量表示,输出所述词向量表示的隐藏层含义;/n基于所述第一隐藏层含义和所述第二隐藏层含义,得到所述方面特征词的目标分类特征;/n根据所述方面特征词的目标分类特征,获取所述方面特征词的预测情感极性;/n根据所述预测情感极性对所述待分类文本数据进行情感分类,以得到所述方面特征词对应的情感分类结果并显示。/n
【技术特征摘要】
1.一种文本数据处理方法,其特征在于,所述方法包括:
获取待分类文本数据;
从所述待分类文本数据中提取方面特征词;
获取所述待分类文本数据的文本词向量表示以及所述方面特征词的方面特征词向量表示;
将所述文本词向量表示和所述方面特征词向量表示分别输入目标神经网络,得到所述文本词向量表示的第一隐藏层含义和所述方面特征词向量表示的第二隐藏层含义,其中,所述目标神经网络被预先训练,用于根据输入的词向量表示,输出所述词向量表示的隐藏层含义;
基于所述第一隐藏层含义和所述第二隐藏层含义,得到所述方面特征词的目标分类特征;
根据所述方面特征词的目标分类特征,获取所述方面特征词的预测情感极性;
根据所述预测情感极性对所述待分类文本数据进行情感分类,以得到所述方面特征词对应的情感分类结果并显示。
2.根据权利要求1所述的方法,其特征在于,所述目标神经网络包括双向长短期记忆网络。
3.根据权利要求1或2所述的方法,其特征在于,所述目标神经网络包括第一神经网络和第二神经网络,所述将所述文本词向量表示和所述方面特征词向量表示分别输入目标神经网络,得到所述文本词向量表示的第一隐藏层含义和所述方面特征词向量表示的第二隐藏层含义,包括:
将所述文本词向量表示输入所述第一神经网络,得到所述文本词向量表示的第一隐藏层含义;
将所述方面特征词向量表示输入所述第二神经网络,得到所述方面特征词向量表示的第二隐藏层含义。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一隐藏层含义和所述第二隐藏层含义,得到所述方面特征词的目标分类特征,包括:
基于所述第一隐藏层含义和所述第二隐藏层含义,得到第一矩阵和第二矩阵,其中,所述第一矩阵为所述待分类文本数据对所述方面特征词的注意力矩阵,所述第二矩阵为所述方面特征词对所述待分类文本数据的注意力矩阵;
根据所述第一矩阵和所述第二矩阵,得到所述待分类文本数据和所述方面特征词的相互注意力;
基于所述相互注意力,得到所述方面特征词的目标分类特征。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一隐藏层含义和所述第二隐藏层含义,得到第一矩阵和第二矩阵,包括:
对所述第一隐藏层含义和所述第二隐藏层含义分别求平均,得到所述待分类文本数据的文本初始表示和所述方面特征词的方面特征词初始表示;
将所述文本初始表示和所述方面特征词初始表示相乘得到初始矩阵;
将所述初始矩阵的行和列分别基于softmax函数,得到所述第一...
【专利技术属性】
技术研发人员:姜楠,田芳,李进,万涛,黄伟,
申请(专利权)人:华东交通大学,
类型:发明
国别省市:江西;36
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。