一种修辞识别的方法、装置及电子设备制造方法及图纸

技术编号:28375345 阅读:12 留言:0更新日期:2021-05-08 00:02
本发明专利技术提供了一种修辞识别的方法、装置及电子设备,其中,该方法包括:预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n‑1个子分类器和总分类器;确定待识别的目标句子,根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;循环执行分类过程,直至确定所述目标句子对应的修辞标签。通过本发明专利技术实施例提供的修辞识别的方法、装置及电子设备,通过多分类器依次识别目标句子修辞标签的方式,在没有跑完全部修辞识别模型时也可能确定目标句子的修辞标签,从而可以提高修辞识别的效率;且之后在分类置信度超过预设阈值才确定目标句子的修辞标签,其修辞识别的结果更加准确,即能够实现又快又准地修辞识别。

【技术实现步骤摘要】
一种修辞识别的方法、装置及电子设备
本专利技术涉及修辞识别
,具体而言,涉及一种修辞识别的方法、装置、电子设备及计算机可读存储介质。
技术介绍
在现在语文教学任务中,明确要求小学生需要掌握并使用常见的修辞手法。小学语文课程中,常见的修辞手法有比喻、拟人、排比等。比喻句就是打比方,就是根据联想,抓住不同事物的相似之处,用浅显、具体、生动的事物来代替抽象、难理解的事物。拟人句就是把某件东西比喻成有人的动作,而不是像童话形式;所写事物必须具有人的特点,不能出现比喻词,不能出现表示人物的词语。排比句,指使用排比修辞方法,把三个或以上意义相关或相近、结构相同或相似、语气相同的词组或句子并排在一起组成的句子。有时候两个句子或以上的并列句子也可以称为排比句。在写作过程中,运用这些修辞手法,可以使文章变得更生动,读起来给人一种美的感受。因此不同修辞手法的熟练使用已经成为评判小学生写作水平的重要标准之一。基于上述,找出一种针对学生写作中的修辞手法的自动识别方法必然能有效提升作文自动评价的丰富度和准确度。目前相关修辞手法的识别技术,主要使用基于关键词位置和频率统计的方式,虽然可以解决一部分的识别问题,但是因为使用规则匹配的方式,导致识别比较死板,容易漏掉一些特殊的句子。目前也存在基于深度学习模型来识别修辞手法的方案,但该方案只是对深度学习模型的应用,其修辞识别效率较低;特别是学生作文中包含多个句子,需要对每个句子进行修辞判断,此时会严重影响对学生作为评价的效率。
技术实现思路
为解决现有存在的技术问题,本专利技术实施例提供一种修辞识别的方法、装置、电子设备及计算机可读存储介质。第一方面,本专利技术实施例提供了一种修辞识别的方法,包括:预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;循环执行分类过程,直至确定所述目标句子对应的修辞标签;其中,所述分类过程包括:当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。第二方面,本专利技术实施例还提供了一种修辞识别的装置,包括:模型模块,用于预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;预处理模块,用于确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;循环识别模块,用于循环执行分类过程,直至确定所述目标句子对应的修辞标签;其中,所述循环识别模块执行分类过程包括:当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。第三方面,本专利技术实施例提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述的修辞识别的方法中的步骤。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的修辞识别的方法中的步骤。本专利技术实施例提供的修辞识别的方法、装置、电子设备及计算机可读存储介质,由包含多个自注意力层和多个分类器的修辞识别模型进行修辞识别,在识别目标句子的修辞时,由多个分类器依次执行分类操作,直至某个分类器可以准确地识别出该目标句子的修辞标签。该方法通过多分类器依次识别目标句子修辞标签的方式,在没有跑完全部修辞识别模型时也可能确定目标句子的修辞标签,从而可以提高修辞识别的效率;且之后在分类置信度超过预设阈值才确定目标句子的修辞标签,其修辞识别的结果更加准确,即能够实现又快又准地修辞识别。附图说明为了更清楚地说明本专利技术实施例或
技术介绍
中的技术方案,下面将对本专利技术实施例或
技术介绍
中所需要使用的附图进行说明。图1示出了本专利技术实施例所提供的一种修辞识别的方法的流程图;图2示出了本专利技术实施例所提供的修辞识别的方法中,修辞识别模型的一种结构示意图;图3示出了本专利技术实施例所提供的一种修辞识别的装置的结构示意图;图4示出了本专利技术实施例所提供的一种用于执行修辞识别的方法的电子设备的结构示意图。具体实施方式本专利技术实施例通过流程图和/或方框图描述所提供的方法、装置、电子设备。应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。下面结合本专利技术实施例中的附图对本专利技术实施例进行描述。图1示出了本专利技术实施例所提供的一种修辞识别的方法的流程图。如图1所示,该方法包括:步骤101:预设修辞识别模型,修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,映射层连接第1个自注意力层的输入层,且第i个自注意力层的输出端与下一个自注意力层的输入端相连;第i个子分类器与第i个自注意力层的输出端相连,且第n个自注意力层的输出端与总分类器相连,n≥2。本专利技术实施例中,该修辞识别模型设有多个自注意力层,该修辞识别模型的结构示意图可参见图2所示,该修辞识别模型包括映射(embedding)层、n个自注意力(self-attention)层、n-1个子分类器和总分类器;即,分类器(包括子分类器和总分类器)的数量与自注意力层的数量相同,都为n。本专利技术实施例中,映射层用于将词映射成特征向量,进而可以确定由多个词组成的句子的特征向量;其中,映射层可以把词本文档来自技高网
...

【技术保护点】
1.一种修辞识别的方法,其特征在于,包括:/n预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;/n确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;/n循环执行分类过程,直至确定所述目标句子对应的修辞标签;/n其中,所述分类过程包括:/n当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;/n当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。/n

【技术特征摘要】
1.一种修辞识别的方法,其特征在于,包括:
预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;
确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;
循环执行分类过程,直至确定所述目标句子对应的修辞标签;
其中,所述分类过程包括:
当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;
当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。


2.根据权利要求1所述的方法,其特征在于,在所述预设修辞识别模型之前,包括:
根据修辞训练样本对所述修辞识别模型的预训练部分进行训练,确定所述预训练部分的权重参数,所述预训练部分包括所述映射层、n个自注意力层和总分类器;
在保持所述预训练部分的权重参数不变的情况下,将无标句子输入至所述修辞识别模型,根据所述总分类器的输出结果确定所述无标句子对应的分类概率分布,并确定每个所述子分类器输出的预测概率分布;
将所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵、或者多个所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵之和作为损失函数,基于所述无标句子对所述子分类器进行训练,并最终确定训练后的修辞识别模型。


3.根据权利要求2所述的方法,其特征在于,所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练包括:
将所述修辞训练样本中训练样本句子对应的修辞标签的概率设为1-ε,将所述训练样本句子的其他修辞标签的概率设为其中,ε为小于0.1的正数,K为修辞标签的分类数量。


4.根据权利要求2所述的方法,其特征在于,在所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练之后,还包括:
对所述预训练部分的最后一个或两个的自注意力层进行微调。


5.根据权利要求1-4任意一项所述的方法,其特征在于,所述确定待识别的目标句子包括:
对待识别作文进行分段处理,确定每段对应的文本;
将句子终止符作为分隔符,确定每段文本中的句子;
对所述句子进行筛选处理,将剩余的句子作为待识别的目标句子;
其中,所述筛选处理包括去除长度小于预设值的句子、去除半数以上为拟声词的句子、去除约定俗成句子中的一种或多种。


6....

【专利技术属性】
技术研发人员:王晓辉杨熙饶丰赵晖
申请(专利权)人:北京一起教育科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1