【技术实现步骤摘要】
一种修辞识别的方法、装置及电子设备
本专利技术涉及修辞识别
,具体而言,涉及一种修辞识别的方法、装置、电子设备及计算机可读存储介质。
技术介绍
在现在语文教学任务中,明确要求小学生需要掌握并使用常见的修辞手法。小学语文课程中,常见的修辞手法有比喻、拟人、排比等。比喻句就是打比方,就是根据联想,抓住不同事物的相似之处,用浅显、具体、生动的事物来代替抽象、难理解的事物。拟人句就是把某件东西比喻成有人的动作,而不是像童话形式;所写事物必须具有人的特点,不能出现比喻词,不能出现表示人物的词语。排比句,指使用排比修辞方法,把三个或以上意义相关或相近、结构相同或相似、语气相同的词组或句子并排在一起组成的句子。有时候两个句子或以上的并列句子也可以称为排比句。在写作过程中,运用这些修辞手法,可以使文章变得更生动,读起来给人一种美的感受。因此不同修辞手法的熟练使用已经成为评判小学生写作水平的重要标准之一。基于上述,找出一种针对学生写作中的修辞手法的自动识别方法必然能有效提升作文自动评价的丰富度和准确度。目前相关修辞手法的识别技术,主要使用基于关键词位置和频率统计的方式,虽然可以解决一部分的识别问题,但是因为使用规则匹配的方式,导致识别比较死板,容易漏掉一些特殊的句子。目前也存在基于深度学习模型来识别修辞手法的方案,但该方案只是对深度学习模型的应用,其修辞识别效率较低;特别是学生作文中包含多个句子,需要对每个句子进行修辞判断,此时会严重影响对学生作为评价的效率。
技术实现思路
为解决现有存在的技 ...
【技术保护点】
1.一种修辞识别的方法,其特征在于,包括:/n预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;/n确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;/n循环执行分类过程,直至确定所述目标句子对应的修辞标签;/n其中,所述分类过程包括:/n当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;/n当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。/n
【技术特征摘要】
1.一种修辞识别的方法,其特征在于,包括:
预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;
确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;
循环执行分类过程,直至确定所述目标句子对应的修辞标签;
其中,所述分类过程包括:
当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;
当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。
2.根据权利要求1所述的方法,其特征在于,在所述预设修辞识别模型之前,包括:
根据修辞训练样本对所述修辞识别模型的预训练部分进行训练,确定所述预训练部分的权重参数,所述预训练部分包括所述映射层、n个自注意力层和总分类器;
在保持所述预训练部分的权重参数不变的情况下,将无标句子输入至所述修辞识别模型,根据所述总分类器的输出结果确定所述无标句子对应的分类概率分布,并确定每个所述子分类器输出的预测概率分布;
将所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵、或者多个所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵之和作为损失函数,基于所述无标句子对所述子分类器进行训练,并最终确定训练后的修辞识别模型。
3.根据权利要求2所述的方法,其特征在于,所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练包括:
将所述修辞训练样本中训练样本句子对应的修辞标签的概率设为1-ε,将所述训练样本句子的其他修辞标签的概率设为其中,ε为小于0.1的正数,K为修辞标签的分类数量。
4.根据权利要求2所述的方法,其特征在于,在所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练之后,还包括:
对所述预训练部分的最后一个或两个的自注意力层进行微调。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述确定待识别的目标句子包括:
对待识别作文进行分段处理,确定每段对应的文本;
将句子终止符作为分隔符,确定每段文本中的句子;
对所述句子进行筛选处理,将剩余的句子作为待识别的目标句子;
其中,所述筛选处理包括去除长度小于预设值的句子、去除半数以上为拟声词的句子、去除约定俗成句子中的一种或多种。
6....
【专利技术属性】
技术研发人员:王晓辉,杨熙,饶丰,赵晖,
申请(专利权)人:北京一起教育科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。