一种学科能力类型标注方法、装置、存储介质及终端设备制造方法及图纸

技术编号:22167237 阅读:30 留言:0更新日期:2019-09-21 10:43
本发明专利技术涉及计算机技术领域,尤其涉及一种学科能力类型标注方法、标注装置、存储介质及终端设备。本发明专利技术提供的方法包括:获取数学试题文本,并对数学试题文本进行切词处理,得到构成数学试题文本的多个分词;利用预设的词向量生成模型生成各个分词的词向量,并将各个分词的词向量组成输入矩阵;将输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到学科能力分析模型输出的分析结果;将分析结果标注为数学试题文本对应的学科能力类型,以通过基于注意力机制和双向长短期记忆神经网络的学科能力分析模型来实现学科能力类型的自动化标注,降低学科能力类型标注的人工成本,提高学科能力类型标注的标注效率和准确率。

A Marking Method, Device, Storage Media and Terminal Equipment for Discipline Capability Type

【技术实现步骤摘要】
一种学科能力类型标注方法、装置、存储介质及终端设备
本专利技术涉及计算机
,尤其涉及一种学科能力类型标注方法、标注装置、计算机可读存储介质及终端设备。
技术介绍
在数学教学中,为培养学生不同方面的能力,往往需要选择不同学科能力类型的数学试题对学生进行训练,因而,为实现针对性训练,则需要对数学试题进行学科能力类型的标注,而现有的学科能力类型标注方法主要依赖于人工手动标注,不仅标注成本高,而且标准效率较低,标注准确性也因人而异而存在较大的误差。综上,如何提高数学试题中学科能力类型标注的效率和准确性成为本领域技术人员亟待解决的问题。
技术实现思路
本专利技术实施例提供了一种学科能力类型标注方法、标注装置、计算机可读存储介质及终端设备,能够实现学科能力类型的自动化标注,提高学科能力类型标注的标注效率和准确率。本专利技术实施例第一方面,提供了一种学科能力类型标注方法,包括:获取数学试题文本,并对所述数学试题文本进行切词处理,得到构成所述数学试题文本的多个分词;利用预设的词向量生成模型生成各个所述分词的词向量,并将各个所述分词的词向量组成输入矩阵;将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果;将所述分析结果标注为所述数学试题文本对应的学科能力类型。本专利技术实施例第二方面,提供了一种学科能力类型标注装置,包括:切词处理模块,用于获取数学试题文本,并对所述数学试题文本进行切词处理,得到构成所述数学试题文本的多个分词;向量生成模块,用于利用预设的词向量生成模型生成各个所述分词的词向量,并将各个所述分词的词向量组成输入矩阵;结果输出模块,用于将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果;类型标注模块,用于将所述分析结果标注为所述数学试题文本对应的学科能力类型。本专利技术实施例第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如前述第一方面所述学科能力类型标注方法的步骤。本专利技术实施例第四方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:获取数学试题文本,并对所述数学试题文本进行切词处理,得到构成所述数学试题文本的多个分词;利用预设的词向量生成模型生成各个所述分词的词向量,并将各个所述分词的词向量组成输入矩阵;将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果;将所述分析结果标注为所述数学试题文本对应的学科能力类型。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例中,在需要对数学试题文本进行学科能力类型的标注时,可首先对该数学试题文本进行切词处理,其次可利用词向量模型对切词处理得到的分词构建词向量,然后将所构建的词向量组成输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到学科能力分析模型输出的分析结果,并将所得到的分析结果标注为该数学试题文本对应的学科能力类型,以通过基于注意力机制和双向长短期记忆神经网络的学科能力分析模型来实现学科能力类型的自动化标注,降低学科能力类型标注的人工成本,提高学科能力类型标注的标注效率和准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中一种学科能力类型标注方法的一个实施例流程图;图2为本专利技术实施例中一种学科能力类型标注方法在一个应用场景下得到分析结果的流程示意图;图3为本专利技术实施例中一种学科能力类型标注方法在一个应用场景下训练学科能力分析模型的流程示意图;图4为本专利技术实施例中一种学科能力类型标注装置的一个实施例结构图;图5为本专利技术一实施例提供的一种终端设备的示意图。具体实施方式本专利技术实施例提供了一种学科能力类型标注方法、标注装置、计算机可读存储介质及终端设备,用于实现学科能力类型的自动化标注,提高学科能力类型标注的标注效率和准确率。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。请参阅图1,本专利技术实施例提供了一种学科能力类型标注方法,所述学科能力类型标注方法,包括:步骤S101、获取数学试题文本,并对所述数学试题文本进行切词处理,得到构成所述数学试题文本的多个分词;本专利技术实施例的执行主体为终端设备,所述终端设备包括但不限于:服务器、计算机、智能手机以及平板电脑等设备。具体地,在需要确定数学试题的学科能力类型时,可向所述终端设备中输入对应的数学试题文本,所述终端设备在获取到所述数学试题文本后,可首先对所述数学试题文本进行预处理,如可以采用jieba分词模型对所述数学试题文本进行切词处理,然后还可基于预设停用词表对切词后的数学试题文本进行去停用词处理等,以得到构成所述数学试题文本的各个分词,其中,所述预设停用词表可以是数学老师在现有中文停用词表基础上重构的符合数学题目规范的数学题停用词表。步骤S102、利用预设的词向量生成模型生成各个所述分词的词向量,并将各个所述分词的词向量组成输入矩阵;可以理解的是,在得到所述数学试题文本对应的各个分词后,则可使用预设的词向量生成模型来生成各个分词的词向量,在此,所述预设的词向量模型可以为使用word2vec技术构建的词向量模型,如可以为基于CBOW(ContinuousBagofWords)模型构建的词向量模型,也可以为基于Skip-gram模型构建的词向量模型。本专利技术实施例中,在得到各个分词的词向量之后,则可以按照各分词在所述数学试题文本中的出现顺序将各词向量组成输入矩阵,如可得到WordMatrix=(WordVec1,WordVec2,WordVec3,......,Wordyecn),其中,WordVec1为所述数学试题文本中出现的第一个分词所对应的词向量,WordVec2为所述数学试题文本中出现的第二个分词所对应的词向量,WordVecn为所述数学试题文本中出现的第n个分词所对应的词向量。步骤S103、将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果;步骤S104、将所述分析结果标注为所述数学试题文本对应的学科能力类型。本专利技术实施例中,在得到各词向量组成的输入矩阵之后,即可以将所得到的输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,以得到所述学科能力分析模型输出的分析结果,并将所得到的分析结果标注为所述数学试题文本所对应的学科能力类型。其中,本文档来自技高网...

【技术保护点】
1.一种学科能力类型标注方法,其特征在于,包括:获取数学试题文本,并对所述数学试题文本进行切词处理,得到构成所述数学试题文本的多个分词;利用预设的词向量生成模型生成各个所述分词的词向量,并将各个所述分词的词向量组成输入矩阵;将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果;将所述分析结果标注为所述数学试题文本对应的学科能力类型。

【技术特征摘要】
1.一种学科能力类型标注方法,其特征在于,包括:获取数学试题文本,并对所述数学试题文本进行切词处理,得到构成所述数学试题文本的多个分词;利用预设的词向量生成模型生成各个所述分词的词向量,并将各个所述分词的词向量组成输入矩阵;将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果;将所述分析结果标注为所述数学试题文本对应的学科能力类型。2.根据权利要求1所述的学科能力类型标注方法,其特征在于,所述将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,得到所述学科能力分析模型输出的分析结果,包括:将所述输入矩阵输入至基于注意力机制和双向长短期记忆神经网络的学科能力分析模型中,在所述学科能力分析模型的隐藏层中对所述输入矩阵的各词向量进行特征提取,得到各词向量对应的特征向量;将各特征向量输入至所述学科能力分析模型的注意力层中,得到各特征向量对应的权重值;根据所得到的权重值对各特征向量进行加权处理,得到所述数学试题文本对应的文本特征向量;将所述文本特征向量输入至所述学科能力分析模型的输出层中,得到所述数学试题文本对应的分析结果。3.根据权利要求2所述的学科能力类型标注方法,其特征在于,所述将各特征向量输入至所述学科能力分析模型的注意力层中,得到各特征向量对应的权重值,包括:根据下述公式计算得到各特征向量对应的权重值:其中,WeightValn为第n个特征向量对应的权重值,N为特征向量的总个数,WeightIMatrix为输入层的权重矩阵,CoupVec为各特征向量的加和,MainVecn为第n个特征向量,T为转置符号。4.根据权利要求3所述的学科能力类型标注方法,其特征在于,所述根据所得到的权重值对各特征向量进行加权处理,得到所述数学试题文本对应的文本特征向量,包括:根据下式对各特征向量进行加权处理,得到所述数学试题文本对应的文本特征向量:其中,TextVecatt为所述文本特征向量,MainVecn为第n个特征向量,WeightValn为第n个特征向量对应的权重值,N为特征向量的总个数。5.根据权利要求4所述的学科能力类型标注方法,其特征在于,所述将所述文本特征向量输入至所述学科能力分析模型的输出层中,得到所述数学试题文本对应的分析结果,包括:将所述文本特征向量输入至所述学科能力分析模型的输出层中,在所述输出层根据下式计算所述文本特征向量在各分析结果中的概率值;其中,Probm为第m个分析结果的概率值,WeightOMatrix为输出层的权值矩阵,TextVecatt(m)为TextVecatt中第m个分量值,M...

【专利技术属性】
技术研发人员:刘静
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1