语病诊断模型的训练方法、语病诊断方法、装置及设备制造方法及图纸

技术编号:33795146 阅读:16 留言:0更新日期:2022-06-12 14:57
本公开提供一种语病诊断模型的训练方法、语病诊断方法、装置及设备,其中该训练方法包括:获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置。本公开可以有效提升语病诊断结果的准确性和可靠性。语病诊断结果的准确性和可靠性。语病诊断结果的准确性和可靠性。

【技术实现步骤摘要】
语病诊断模型的训练方法、语病诊断方法、装置及设备


[0001]本公开涉及人工智能领域,尤其涉及语病诊断模型的训练方法、语病诊断方法、装置及设备。

技术介绍

[0002]语病诊断的目的是诊断文本内容是否符合语法规范,如果不符合规范,则识别语病的类型,并获取语病在文本中的具体位置。随着人工智能领域的兴起,研究人员开始尝试采用人工智能方式针对文本进行语病诊断,以便将其快速便捷地应用于诸如作文批改、语病纠正等场景,然而,现有的语病诊断方式的效果不佳,语病诊断结果的准确性较低。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种语病诊断模型的训练方法、语病诊断方法、装置及设备。
[0004]根据本公开的一方面,提供了一种语病诊断模型的训练方法,包括:获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置。
[0005]根据本公开的另一方面,提供了一种语病诊断方法,包括:获取待诊断的目标文本;通过语病诊断模型对所述目标文本进行语病诊断,得到所述目标文本中的语病类别及语病位置;其中,所述语病诊断模型是采用上述训练方法训练得到的。
[0006]根据本公开的另一方面,提供了一种语病诊断模型的训练装置,包括:文本样本获取模块,用于获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;模板文本获取模块,用于根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;模型训练模块,用于基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置。
[0007]根据本公开的另一方面,提供了一种语病诊断装置,包括:目标文本获取模块,用于获取待诊断的目标文本;语病诊断模块,用于通过语病诊断模型对所述目标文本进行语病诊断,得到所述目标文本中的语病类别及语病位置;其中,所述语病诊断模型是采用上述训练方法训练得到的。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:处理器;以及存储程序的存
储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述语病诊断模型的训练方法或者上述语病诊断方法。
[0009]根据本公开的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述语病诊断模型的训练方法或者上述语病诊断方法。
[0010]本公开实施例中提供的上述语病诊断模型的训练方法及装置,能够首先获取携带有语病标签的文本样本;该语病标签包括文本样本的语病类别和语病位置,然后根据预先设置的语病模板和文本样本的语病标签,得到嵌入语病信息的模板文本;其中,语病模板为用于指示查找指定语病的位置的文本,且语病模板中指定语病的信息待嵌入;最后能够基于模板文本和携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型。在上述方式中,语病模板用于查找指定语病位置,因此具有一定的任务导向,通过将语病模板和文本样本的语病标签结合即可得到嵌入语病信息的模板文本,该模板文本不仅具有任务导向,还较好融入了语病信息,因此模板文本能够在模型训练过程中为待诊断的文本样本提供额外的上下文信息,使得训练得到的语病诊断模型的性能更佳,可以有效提升语病诊断结果的准确性和可靠性。
[0011]本公开实施例中提供的上述语病诊断方法及装置,通过采用上述训练方法得到的语病诊断模型进行语病诊断,所得的语病诊断结果更为准确可靠。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0014]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为本公开实施例提供的一种语病诊断模型的训练方法的流程示意图;图2为本公开实施例提供的一种模板文本的构造示意图;图3为本公开实施例提供的一种模板文本和文本样本的组合示意图;图4为本公开实施例提供的一种正负样本构造示意图;图5为本公开实施例提供的一种样本训练集构造示意图;图6为本公开实施例提供的一种语病诊断模型的训练示意图;图7为本公开实施例提供的一种语病诊断方法的流程示意图;图8为本公开实施例提供的一种语病诊断示意图;图9为本公开实施例提供的一种语病诊断模型的训练装置的结构示意图;图10为本公开实施例提供的一种语病诊断装置的结构示意图;图11为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0016]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0017]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0018]本公开使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0019]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0020]为了能够更清楚地理解本公开的上述目的、特征和优点,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语病诊断模型的训练方法,包括:获取携带有语病标签的文本样本;所述语病标签包括所述文本样本的语病类别和语病位置;根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本;其中,所述语病模板为用于指示查找指定语病的位置的文本,且所述语病模板中指定语病的信息待嵌入;基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型;其中,所述语病诊断模型用于对目标文本进行识别,得到所述目标文本中的语病类别及语病位置。2.如权利要求1所述的语病诊断模型的训练方法,其中,所述指定语病的信息包括指定语病的类别和定义。3.如权利要求2所述的语病诊断模型的训练方法,其中,根据预先设置的语病模板和所述文本样本的语病标签,得到嵌入语病信息的模板文本的步骤,包括:从所述文本样本的语病标签中提取语病类别,将提取的所述语病类别作为指定语病的类别,并将所述指定语病的类别以填槽方式嵌入所述语病模板中;查找所述语病类别对应的语病定义,并将查找到的所述语病定义作为指定语病的定义,并将所述指定语病的定义以填槽方式嵌入所述语病模板中,得到嵌入语病信息的模板文本。4.如权利要求1所述的语病诊断模型的训练方法,其中,所述文本样本的数量为N个,不同所述文本样本的语病类别和/或语病位置不同,且N个所述文本样本共包含M种语病类别;所述模板文本的数量为M个,每个所述模板文本对应一种语病类别;N与M均为正整数。5.如权利要求4所述的语病诊断模型的训练方法,其中,基于所述模板文本和所述携带有语病标签的文本样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:将M个所述模板文本和N个所述携带有语病标签的文本样本进行组合,得到M*N个组合样本;基于所述M*N个组合样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型。6.如权利要求5所述的语病诊断模型的训练方法,其中,基于所述M*N个组合样本对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:对于每种语病类别,基于所述M*N个组合样本得到该种语病类别对应的正样本和负样本;根据每种所述语病类别对应的正样本和负样本,对预设的神经网络模型进行训练,得到训练好的语病诊断模型。7.如权利要求6所述的语病诊断模型的训练方法,其中,对于每种语病类别,基于所述M*N个组合样本得到该种语病类别对应的正样本和负样本的步骤,包括:对于每种语病类别,从所述M*N个组合样本中查找第一目标组合样本和第二目标组合样本;所述第一目标组合样本中的模板文本对应该种语病类别,且所述第一目标组合样本中的语病标签包含该种语病类别;所述第二目标组合样本中的模板文本对应该种语病类
别,且所述第二目标组合样本中的语病标签不包含该种语病类别;对所述第一目标组合样本执行第一处理操作,将第一处理操作后的所述第一目标组合样本作为该种语病类别对应的正样本;其中,所述第一处理操作包括将所述第一目标组合样本的语病标签中除该种语病类别之外的语病类别剔除;对所述第二目标组合样本执行第二处理操作,将第二处理操作后的所述第二目标组合样本作为该种语病类别对应的负样本;其中,所述第二处理操作包括将所述第二目标组合样本的所有语病标签剔除。8.如权利要求6所述的语病诊断模型的训练方法,其中,根据每种所述语病类别对应的正样本和负样本,对预设的神经网络模型进行训练,得到训练好的语病诊断模型的步骤,包括:基于每种所述语病类别对应的正样本和负样本进行合并处理,得到样本训练集;采用所述样本训练集对预设的神经网络模型进行训练,得到训练好的语病诊断模型。9.如权利要求8所述的语病诊断模型的训练方法,其中,基于每种所述语病类别对应的正样本和负样本进行合并处理的步骤,包括:基于每种所述语病类别对应的正样本数量和负样...

【专利技术属性】
技术研发人员:李云良胡飞李木子
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1