一种文本评价方法、装置、设备以及可读存储介质制造方法及图纸

技术编号:20588915 阅读:19 留言:0更新日期:2019-03-16 07:10
本申请提供了一种文本评价方法、装置、设备及存储介质,方法包括:获取待评价文本,基于预先建立的词向量确定模型确定待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在待评价文本的整体内容中的上下文语义信息,将待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得待评价文本的评价结果。本申请提供的文本评价方法、装置、设备及存储介质,可自动预测出待评价文本的评价结果,并且,由于用于预测评价结果的目标词向量包含了对应词在待评价文本的整体内容中的上下文语义信息,因此,基于每个词对应的目标词向量能够较准确的预测出评价结果,用户体验较好。

【技术实现步骤摘要】
一种文本评价方法、装置、设备以及可读存储介质
本申请涉及智能教育
,更具体涉及一种文本评价方法、装置、设备以及可读存储介质。
技术介绍
在某些应用领域,需要对文本进行评价,比如,在教育领域,需要对学生的作文进行评分。现有技术中,对文本进行评价的方式大多为人工评价方式,即由评价人员基于文本内容对文本进行评价。然而,在某些时候,待评价的文本往往很多,比如,老师可能需要对成百上千个学生的作文进行评分,因此,人工评价方式耗时、耗力,即人工评价方式的人工成本和时间成本较高,因此,亟需一种能够对文本进行自动评价的方案。
技术实现思路
有鉴于此,本申请提供了一种文本评价方法、装置、设备以及可读存储介质,用以对待评价文本进行自动评价,其技术方案如下:文本评价方法,包括:获取待评价文本;基于预先建立的词向量确定模型,确定所述待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在所述待评价文本的整体内容中的上下文语义信息;将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果。优选的,基于预先建立的词向量确定模型,确定所述待评价文本中每个词对应的目标词向量,包括:利用至少两个词向量确定模型获得所述待评价文本中每个词对应的语义词向量,将所述语义词向量通过双线性变换的方式得到所述目标词向量;其中,至少一个词向量确定模型用于获得所述待评价文本中每个词对应的包含自身语义信息的词向量,至少一个词向量确定模型用于获得所述待评价文本中每个词对应的包含局部上下文语义信息的词向量。优选的,所述预先建立的词向量确定模型包括第一词向量确定模型和第二词向量确定模型;所述第一词向量确定模型为用于训练语义特征的词向量模型;所述第二词向量确定模型为带有记忆功能的词向量模型。优选的,所述利用至少两个词向量确定模型获得所述待评价文本中每个词对应的语义词向量,包括:对所述待评价文本的内容进行分词处理,分词处理后得到所述待评价文本中的各个词;对于所述待评价文本中的每个词,将该词输入所述第一词向量确定模型,获得只包含该词自身语义信息的词向量,作为该词对应的第一语义词向量;将所述待评价文本中各个词对应的第一语义词向量输入所述第二词向量确定模型,获得每个词对应的、包含局部上下文语义信息的词向量,作为与每个词对应的第二语义词向量。优选的,所述将所述语义词向量通过双线性变换的方式得到所述目标词向量,包括:对于所述待评价文本中的每个词,将该词对应的第一语义词向量与至少一个词对应的第二语义词向量通过至少一个双线性矩阵变换,获得至少一个变换结果向量;若所述变换结果向量为一个,则将所述变换结果向量确定为该词对应的目标词向量,若所述变换结果向量为多个,则将多个变换结果向量进行拼接,将拼接后得到的向量确定为该词对应的目标词向量。优选的,所述将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果,包括:基于所述待评价文本中每个词对应的词向量,通过所述评价模型确定整个待评价文本对应的词向量,并以所述整个待评价文本对应的词向量通过所述评价模型预测所述待评价文本的评价结果;其中,所述词向量确定模型基于多个主题的文本训练得到。优选的,所述评价模型包括特征提取模块和具有记忆功能的特征表征模块;所述特征提取模块至少一层,输入为词对应的词向量,输出为变换后词对应的特征向量,若为多层,输出为拼接后的特征向量;所述特征表征模块至少一层,输入为所述特征向量,输出为整个待评价文本对应的词向量,若为多层,输出为整个待评价文本对应的、拼接后的词向量。一种文本评价装置,包括:文本获取模块、词向量确定模块和文本评价模块;所述文本获取模块,用于获取待评价文本;所述词向量确定模块,用于基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在所述待评价文本的整体内容中的上下文语义信息;所述文本评价模块,用于将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果。优选的,所述词向量确定模块,具体用于利用至少两个词向量确定模型获得所述待评价文本中每个词对应的语义词向量,将所述语义词向量通过双线性变换的方式得到所述目标词向量;其中,至少一个词向量确定模型用于获得所述待评价文本中每个词对应的包含自身语义信息的词向量,至少一个词向量确定模型用于获得所述待评价文本中每个词对应的包含局部上下文语义信息的词向量。优选的,所述文本评价模块,具体用于基于所述待评价文本中每个词对应的目标词向量,通过所述评价模型确定整个待评价文本对应的词向量,并以整个待评价文本对应的词向量通过所述评价模型预测所述待评价文本的评价结果;其中,所述词向量确定模型基于多个主题的文本训练得到。优选的,所述评价模型包括特征提取模块和具有记忆功能的特征表征模块;所述特征提取模块至少一层,输入为词对应的词向量,输出为变换后词对应的特征向量,若为多层,输出为拼接后的特征向量;所述特征表征模块至少一层,输入为所述特征向量,输出为整个待评价文本对应的词向量,若为多层,输出为整个待评价文本对应的、拼接后的词向量。一种文本评价设备,包括:存储器和处理器;所述存储器,用于存储程序;所述处理器,用于执行所述程序,所述程序具体用于:获取待评价文本;基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在所述待评价文本的整体内容中的上下文语义信息;将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的得分。一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现所述文本评价方法的各个步骤。经由上述的技术方案可知,本申请提供的文本评价方法、装置、设备及存储介质,首先获取待评价文本,然后基于预先建立的词向量确定模型确定待评价文本中每个词对应的目标词向量,最后将待评价文本中每个词对应的目标词向量输入预先建立的评价模型,通过评价模型预测待评价文本的得分。由此可见,本申请提供的文本评价方法、装置、设备及存储介质,可自动预测出待评价文本的评价,并且,由于用于预测评价的目标词向量包含了对应词在待评价文本的整体内容中的上下文语义信息,因此,基于各个词对应的目标词向量能够较准确的预测出待评价文本的得分,用户体验较好。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的文本评价方法的流程示意图;图2为本申请实施例提供的文本评价方法中,基于预先建立的词向量确定模型确定待评价文本中每个词对应的目标词向量的一种可能的实现方式的流程示意图;图3为本申请实施例提供的基于第一词向量确定模型和第二词向量确定模型确定待评价文本中各个词对应的目标词向量的一示例的示意图;图4为本申请实施例提供的文本评价方法中,基于预先建立的词向量确定模型确定待评价文本中每个词对应的目标词向量的另一种可能的实现方式的流程本文档来自技高网...

【技术保护点】
1.一种文本评价方法,其特征在于,包括:获取待评价文本;基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在所述待评价文本的整体内容中的上下文语义信息;将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果。

【技术特征摘要】
1.一种文本评价方法,其特征在于,包括:获取待评价文本;基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,一个词对应的目标词向量包含该词在所述待评价文本的整体内容中的上下文语义信息;将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果。2.根据权利要求1所述的文本评价方法,其特征在于,基于预先建立的词向量确定模型确定所述待评价文本中每个词对应的目标词向量,包括:利用至少两个词向量确定模型获得所述待评价文本中每个词对应的语义词向量,将所述语义词向量通过双线性变换的方式得到所述目标词向量;其中,至少一个词向量确定模型用于获得所述待评价文本中每个词对应的包含自身语义信息的词向量,至少一个词向量确定模型用于获得所述待评价文本中每个词对应的包含局部上下文语义信息的词向量。3.根据权利要求2所述的文本评价方法,其特征在于,所述预先建立的词向量确定模型包括第一词向量确定模型和第二词向量确定模型;所述第一词向量确定模型为用于训练语义特征的词向量模型;所述第二词向量确定模型为带有记忆功能的词向量模型。4.根据权利要求2所述的文本评价方法,其特征在于,所述利用至少两个词向量确定模型获得所述待评价文本中每个词对应的语义词向量,包括:对所述待评价文本的内容进行分词处理,分词处理后得到所述待评价文本中的各个词;对于所述待评价文本中的每个词,将该词输入所述第一词向量确定模型,获得只包含该词自身语义信息的词向量,作为该词对应的第一语义词向量;将所述待评价文本中各个词对应的第一语义词向量输入所述第二词向量确定模型,获得每个词对应的、包含局部上下文语义信息的词向量,作为与每个词对应的第二语义词向量。5.根据权利要求4所述的文本评价方法,其特征在于,所述将所述语义词向量通过双线性变换的方式得到所述目标词向量,包括:对于所述待评价文本中的每个词,将该词对应的第一语义词向量与至少一个词对应的第二语义词向量通过至少一个双线性矩阵变换,获得至少一个变换结果向量;若所述变换结果向量为一个,则将所述变换结果向量确定为该词对应的目标词向量,若所述变换结果向量为多个,则将多个变换结果向量进行拼接,将拼接后得到的向量确定为该词对应的目标词向量。6.根据权利要求1所述的文本评价方法,其特征在于,所述将所述待评价文本中每个词对应的目标词向量输入预先建立的评价模型,获得所述待评价文本的评价结果,包括:基于所述待评价文本中每个词对应的词向量,通过所述评价模型确定整个待评价文本对应的词向量,并以所述整个待评价文本对应的词向量通过所述评价模型预测所述待评价文本的评价结果;其中,所述词向量确定模型基于多个主题的文本训练得到。7.根据权利要求2或6所述的文本评价方法,其...

【专利技术属性】
技术研发人员:张凯波盛志超陈志刚魏思胡国平胡郁
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1