System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于多音字拼音预测的多任务训练方法与设备技术_技高网

一种用于多音字拼音预测的多任务训练方法与设备技术

技术编号:41156064 阅读:2 留言:0更新日期:2024-04-30 18:20
本申请的目的是提供一种用于多音字拼音预测的多任务训练方法与设备。与现有技术相比,本申请通过对样本训练数据进行标签设置,其中,所述标签包括多音字的拼音信息、多音字的词性信息以及多音字在词语中的位置信息,其中,每个标签对应一种训练任务,然后将样本训练数据的多音字对应的包含了上下文语义信息的语义向量分别映射到三种标签空间进行多任务训练,并基于所述多任务训练的预测概率和对应标签计算交叉熵损失更新模型参数,以实现用于多音字拼音预测的多任务训练。通过这种方式能够提高多音字拼音预测的准确度。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种用于多音字拼音预测的多任务训练技术。


技术介绍

1、传统的拼音纠错方法是基于词组拼音库实现的。具体方式是先将句子进行分词,得到词组列表,然后遍历词组列表中的每一个词,查询拼音库中该词的结果。假如拼音库中没有覆盖当前词组,则会将该词组翻译成单个字,返回单字的最常见读音。但是对于多音字,总选择最常见读音是不合理的,例如:“我中标了”,分词结果为[“我”,“中标”,“了”],假如拼音词组库中有“中标”这个词组,则直接返回拼音库中的结果“zhong4biao1”(“4”,”1”代表声调),否则,将“中标”分成单个字[“中”,“标”],返回最常见拼音“zhong1biao1”。这里多音字“中”的拼音就出错了。因此,需要一种能够准确进行多音字拼音预测的方式。


技术实现思路

1、本申请的目的是提供一种用于多音字拼音预测的多任务训练方法与设备

2、根据本申请的一个方面,提供了一种用于多音字拼音预测的多任务训练方法,其中,该方法包括:

3、对样本训练数据进行标签设置,其中,所述标签包括多音字的拼音信息、多音字的词性信息以及多音字在词语中的位置信息,其中,每个标签对应一种训练任务;

4、将样本训练数据的多音字对应的包含了上下文语义信息的语义向量分别映射到三种标签空间进行多任务训练;

5、基于所述多任务训练的预测概率和对应标签计算交叉熵损失更新模型参数,以实现用于多音字拼音预测的多任务训练。

6、可选地,其中,所述将样本训练数据的多音字对应的包含了上下文语义信息的语义向量分别映射到三种标签空间包括:

7、将多音字的语义向量通过三个独立的线性变换层,分别转换成维的向量,其中分别为拼音信息、词性信息、词语中的位置信息三个标签集中可选标签的数量。

8、可选地,其中,所述基于所述多任务训练的预测概率更新模型参数包括:

9、基于得到三个任务的预测概率矩阵p1、p2、p3,其中,、、;

10、分别计算p1、p2、p3与对应标签的交叉熵损失确定每个任务的损失;

11、基于每个标签的预设权重对三个任务的损失进行加权求和,以反向传播更新模型参数。

12、可选地,其中,所述方法还包括:

13、基于样本训练数据的多音字获取其包含了上下文语义信息的语义向量。

14、可选地,其中,所述基于样本训练数据的多音字获取其包含了上下文语义信息的语义向量包括:

15、将样本训练数据分成单个的字;

16、将所述单个的字基于预训练的语言模型输出包含了上下文语义信息的语义向量。

17、可选地,其中,所述多音字在词语中的位置信息包括多音字在词语开头、多音字在词语中间、多音字在词语结尾、多音字以单字出现。

18、根据本申请的另一方面,还提供了一种基于前述训练方法的多音字拼音预测方法,其中,该方法包括:

19、当处于预测阶段,将预测数据的多音字对应的包含了上下文语义信息的语义向量映射到多音字的拼音信息的任务;

20、将该任务对应的预测概率的最大概率对应的标签作为预测结果。

21、根据本申请的另一方面,还提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如前述方法的操作。

22、根据本申请的又一方面,还提供了一种用于多音字拼音预测的多任务训练设备,其中,该设备包括:

23、一个或多个处理器;以及

24、存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述方法的操作。

25、根据本申请的再一方面,还提供了一种多音字拼音预测设备,其中,该设备包括:

26、一个或多个处理器;以及

27、存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述方法的操作。

28、与现有技术相比,本申请通过对样本训练数据进行标签设置,其中,所述标签包括多音字的拼音信息、多音字的词性信息以及多音字在词语中的位置信息,其中,每个标签对应一种训练任务,然后将样本训练数据的多音字对应的包含了上下文语义信息的语义向量分别映射到三种标签空间进行多任务训练,并基于所述多任务训练的预测概率和对应标签计算交叉熵损失更新模型参数,以实现用于多音字拼音预测的多任务训练。通过这种方式能够提高多音字拼音预测的准确度。

本文档来自技高网...

【技术保护点】

1.一种用于多音字拼音预测的多任务训练方法,其中,该方法包括:

2.根据权利要求1所述的方法,其中,所述将样本训练数据的多音字对应的包含了上下文语义信息的语义向量分别映射到三种标签空间包括:

3.根据权利要求2所述的方法,其中,所述基于所述多任务训练的预测概率更新模型参数包括:

4.根据权利要求1所述的方法,其中,所述方法还包括:

5.根据权利要求4所述的方法,其中,所述基于样本训练数据的多音字获取其包含了上下文语义信息的语义向量包括:

6.根据权利要求1所述的方法,其中,所述多音字在词语中的位置信息包括多音字在词语开头、多音字在词语中间、多音字在词语结尾、多音字以单字出现。

7.一种基于权利要求1所述的训练方法的多音字拼音预测方法,其中,该方法包括:

8.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至7中任一项所述的方法。

9.一种用于多音字拼音预测的多任务训练设备,其中,该设备包括:

10.一种多音字拼音预测设备,其中,该设备包括:

...

【技术特征摘要】

1.一种用于多音字拼音预测的多任务训练方法,其中,该方法包括:

2.根据权利要求1所述的方法,其中,所述将样本训练数据的多音字对应的包含了上下文语义信息的语义向量分别映射到三种标签空间包括:

3.根据权利要求2所述的方法,其中,所述基于所述多任务训练的预测概率更新模型参数包括:

4.根据权利要求1所述的方法,其中,所述方法还包括:

5.根据权利要求4所述的方法,其中,所述基于样本训练数据的多音字获取其包含了上下文语义信息的语义向量包括:

6...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:北京蜜度信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1