一种基于神经网络的藏文语法纠错方法技术

技术编号：29052832 阅读：18 留言：0更新日期：2021-06-26 06:19

本发明专利技术公开了一种基于神经网络的藏文语法纠错方法，获取待纠错样本，并对所述待纠错样本进行切词和语义判断，并构建对应的纠错词集；基于所述纠错词集，按照设定的取样方式对切词得到的纠错藏文进行修改；基于获取的神经网络，在所述神经网络的输出层后添加一个自注意力机制层，得到改进的神经网络；基于大数据网络，获取多个训练集和测试集，并利用所述训练集和所述测试集对所述改进的神经网络进行训练和测试，直至满足要求；将修改得到的修改藏文输入改进的神经网络中，并输出对应的损失值；将当前所述损失值与所述待纠错样本对应的样本损失值进行比较，得到满足要求的纠错文本，能够快速的对藏文进行纠错。能够快速的对藏文进行纠错。能够快速的对藏文进行纠错。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络的藏文语法纠错方法

[0001]本专利技术涉及语言处理
，尤其涉及一种基于神经网络的藏文语法纠错方法。

技术介绍

[0002]目前虽然存在很多种语法纠错方法，但是大多是针对语种使用较为广泛的汉语、英语等通用语种的语法纠错方法，但是在藏文上，相关的语法纠错方法仍较为稀缺。

技术实现思路

[0003]本专利技术的目的在于提供一种基于神经网络的藏文语法纠错方法，能够快速的对藏文语法进行纠错。
[0004]为实现上述目的，本专利技术提供了一种基于神经网络的藏文语法纠错方法，包括以下步骤：
[0005]获取待纠错样本，并对所述待纠错样本进行切词和语义判断，并构建对应的纠错词集；
[0006]基于所述纠错词集，按照设定的取样方式对切词得到的纠错藏文进行修改；
[0007]将修改得到的修改藏文输入改进的神经网络中，并输出对应的损失值；
[0008]将当前所述损失值与所述待纠错样本对应的样本损失值进行比较，得到满足要求的纠错文本。
[0009]其中，将修改后的所述纠错藏文输入改进的神经网络中，并输出对应的损失值之前，所述方法还包括：
[0010]基于获取的神经网络，在所述神经网络的输出层后添加一个自注意力机制层，得到改进的神经网络；
[0011]基于大数据网络，获取多个训练集和测试集，并利用所述训练集和所述测试集对所述改进的神经网络进行训练和测试，直至满足要求。
[0012]其中，获取待纠错样本，并对所述待纠错样本进行切词和...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的藏文语法纠错方法，其特征在于，包括以下步骤：获取待纠错样本，并对所述待纠错样本进行切词和语义判断，并构建对应的纠错词集；基于所述纠错词集，按照设定的取样方式对切词得到的纠错藏文进行修改；将修改得到的修改藏文输入改进的神经网络中，并输出对应的损失值；将当前所述损失值与所述待纠错样本对应的样本损失值进行比较，得到满足要求的纠错文本。2.如权利要求1所述的基于神经网络的藏文语法纠错方法，其特征在于，将修改后的所述纠错藏文输入改进的神经网络中，并输出对应的损失值之前，所述方法还包括：基于获取的神经网络，在所述神经网络的输出层后添加一个自注意力机制层，得到改进的神经网络；基于大数据网络，获取多个训练集和测试集，并利用所述训练集和所述测试集对所述改进的神经网络进行训练和测试，直至满足要求。3.如权利要求1所述的基于神经网络的藏文语法纠错方法，其特征在于，获取待纠错样本，并对所述待纠错样本进行切词和语义判断，并构建对应的纠错词集，包括：利用爬虫技术获取待纠错样本，并基于设定的切词规则对所述待纠错样本进行切词，得到多个纠错藏文；基于评判准则对得到的多个所述纠错样本进行语义判断和错别字判断，并基于判断结果，构建对应的语义纠错词集和错...

【专利技术属性】
技术研发人员：华果才让，
申请(专利权)人：华果才让，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人