【技术实现步骤摘要】
语病诊断模型的训练方法、语病诊断方法、装置及设备
[0001]本公开涉及人工智能领域,尤其涉及语病诊断模型的训练方法、语病诊断方法、装置及设备。
技术介绍
[0002]语病诊断的目的是诊断文本内容是否符合语法规范,如果不符合规范,则识别语病的类型,并获取语病在文本中的具体位置。随着人工智能领域的兴起,研究人员开始尝试采用人工智能方式针对文本进行语病诊断,以便将其快速便捷地应用于诸如作文批改、语病纠正等场景,然而,现有的语病诊断方式的效果不佳,语病诊断结果的准确性较低。
技术实现思路
[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种语病诊断模型的训练方法、语病诊断方法、装置及设备。
[0004]根据本公开的一方面,提供了一种语病诊断模型的训练方法,包括:获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置。
[0005]根据本公开的另一方面,提供了一种语病诊断方法,包括:获取待诊断的目标文本;通过语病诊断模型对所述目标文本进行语病诊断,得到所述目标文本中的语病类别及语病位置;其中, ...
【技术保护点】
【技术特征摘要】
1.一种语病诊断模型的训练方法,包括:获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置。2.如权利要求1所述的语病诊断模型的训练方法,其中,所述指定语病的信息包括指定语病的类别和定义。3.如权利要求2所述的语病诊断模型的训练方法,其中,根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本的步骤,包括:从所述文本样本的语病标签中提取语病类别,将提取的所述语病类别作为指定语病的类别,并将所述指定语病的类别以填槽方式嵌入所述语病模板中;查找所述语病类别对应的语病定义,并将查找到的所述语病定义作为指定语病的定义,并将所述指定语病的定义以填槽方式嵌入所述语病模板中,得到嵌入语病信息的模板文本。4.如权利要求1所述的语病诊断模型的训练方法,其中,所述文本样本的数量为N个,不同所述文本样本的语病类别和/或语病位置不同,且N个所述文本样本共包含M种语病类别;所述模板文本的数量为M个,每个所述模板文本对应一种语病类别;N与M均为正整数。5.如权利要求4所述的语病诊断模型的训练方法,其中,基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:将M个所述模板文本和N个所述携带有语病标签的文本样本进行组合,得到M*N个组合样本;基于所述M*N个组合样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型。6.如权利要求5所述的语病诊断模型的训练方法,其中,基于所述M*N个组合样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:对于每种语病类别,基于所述M*N个组合样本得到该种语病类别对应的正样本和负样本;根据每种所述语病类别对应的正样本和负样本,对预设的神经网络模型进行训练,得到训练好的语病诊断模型。7.如权利要求6所述的语病诊断模型的训练方法,其中,对于每种语病类别,基于所述M*N个组合样本得到该种语病类别对应的正样本和负样本的步骤,包括:对于每种语病类别,从所述M*N个组合样本中查找第一目标组合样本和第二目标组合样本;所述第一目标组合样本中的模板文本对应该种语病类别,且所述第一目标组合样本中的语病标签包含该种语病类别;所述第二目标组合样本中的模板文本对应该种语病类
别,且所述第二目标组合样本中的语病标签不包含该种语病类别;对所述第一目标组合样本执行第一处理操作,将第一处理操作后的所述第一目标组合样本作为该种语病类别对应的正样本;其中,所述第一处理操作包括将所述第一目标组合样本的语病标签中除该种语病类别之外的语病类别剔除;对所述第二目标组合样本执行第二处理操作,将第二处理操作后的所述第二目标组合样本作为该种语病类别对应的负样本;其中,所述第二处理操作包括将所述第二目标组合样本的所有语病标签剔除。8.如权利要求6所述的语病诊断模型的训练方法,其中,根据每种所述语病类别对应的正样本和负样本,对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:基于每种所述语病类别对应的正样本和负样本进行合并处理,得到样本训练集;采用所述样本训练集对预设的神经网络模型进行训练,得到训练好的语病诊断模型。9.如权利要求8所述的语病诊断模型的训练方法,其中,基于每种所述语病类别对应的正样本和负样本进行合并处理的步骤,包括:基于每种所述语病类别对应的正样本数量和负样...
【专利技术属性】
技术研发人员:李云良,胡飞,李木子,
申请(专利权)人:北京世纪好未来教育科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。