System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种模型训练和业务执行方法、装置、存储介质及设备制造方法及图纸_技高网

一种模型训练和业务执行方法、装置、存储介质及设备制造方法及图纸

技术编号:40489053 阅读:5 留言:0更新日期:2024-02-26 19:20
本说明书公开了一种模型训练和业务执行方法、装置、存储介质及设备。在对文本处理模型进行训练的过程中,通过设置的词性嵌入层,可以使得文本处理模型在训练过程中,学习到各分词的词性与文本语义之间的潜在关系,这使得文本处理模型在实际应用中可以结合文本中各分词的词性特征,更加精准的提取出输入文本的特征信息,从而得到更加准确的文本处理结果。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种模型训练和业务执行方法、装置、存储介质及设备


技术介绍

1、随着人工智能的快速发展,自然语言处理(natural language processing,nlp)技术已经在诸如智能客服、信息推荐、隐私数据保护等诸多领域得到了长足的应用,从而有效的提升了用户在这些业务领域中的业务执行效率以及个人信息的安全性。

2、目前在实际应用中通常需要训练出一个用于自然语言处理的文本处理模型,将获取到的文本数据输入到该文本处理模型中,文本处理模型会从该文本数据中提取出相应的特征信息,进而基于提取出的特征信息,输出文本处理结果。

3、然后,目前文本处理模型提取的特征信息并不能很好的表征出文本数据的实际特征,从而导致文本处理模型最终输出的文本处理结果并不准确,进而影响了业务处理的效果。

4、因此,如何能够有效的提高文本处理模型的特征提取能力,则是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种模型训练方法、装置、存储介质及设备。通过确定出的样本文本的词性序列信息,结合样本文本本身,对文本处理模型进行训练。

2、本说明书采用下述技术方案:

3、本说明书提供了一种模型训练方法,包括:

4、获取样本文本;

5、对所述样本文本进行划分,得到各分词,并确定每个分词的词性;

6、根据每个分词的词性,确定每个分词对应的词性标识;

7、根据每个分词对应的词性标识,确定所述样本文本的词性序列信息;

8、将所述样本文本中的部分文本内容进行遮盖,得到遮盖后文本,并将所述词性序列信息以及所述遮盖后文本输入到待训练的文本处理模型中,以通过所述文本处理模型中包含的文本处理层,对所述遮盖后文本进行编码,得到文本编码特征,以及通过所述文本处理模型中包含的词性嵌入层,对所述词性序列信息进行编码,得到词性编码特征,并将所述文本编码特征以及所述词性编码特征进行融合,得到融合特征,以将所述融合特征输入到所述文本处理模型中包含的预测层,并通过所述预测层,预测出所述遮盖后文本中被遮盖的文本内容,作为预测内容;

9、以最小化所述预测内容与所述样本文本中实际被遮盖的文本内容之间的偏差为优化目标,对所述文本处理模型进行训练。

10、可选地,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息,具体包括:

11、针对每个分词,根据该分词中包含的每个单字在该分词中的位置,确定该分词中包含的每个单字对应的位置标识符,并根据该分词的词性对应的词性标识以及该分词中包含的每个单字对应的位置标识符,确定该分词中包含的每个单字所对应的词性位置标识;

12、根据每个分词中包含的各单字所对应的词性位置标识,确定所述样本文本的词性序列信息。

13、可选地,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息,具体包括:

14、针对每个分词,确定该分词的分词结构信息,所述分词结构信息用于表示该分词属于单字分词还是多字分词;

15、根据该分词的分词结构信息,确定该分词对应的结构标识;

16、根据每个分词对应的结构标识以及每个分词的词性对应的词性标识,确定所述样本文本的词性序列信息。

17、可选地,根据每个分词的词性,确定每个分词对应的词性标识,具体包括:

18、针对每个分词,确定该分词的词性所归属的词性簇,其中,同一词性簇中包含的各词性所对应的词性标识相同;

19、根据所述词性簇对应的词性标识,确定该分词对应的词性标识。

20、本说明书提供了一种业务执行方法,包括:

21、接收业务请求;

22、根据所述业务请求,确定待处理文本;

23、将所述待处理文本输入到预先训练的文本处理模型中,以通过所述文本处理模型,确定所述待处理文本的文本特征信息,所述文本处理模型是通过上述的模型训练方法训练得到的;

24、将所述文本特征信息传输至预设的业务模型中,以通过所述业务模型,输出业务结果;

25、根据所述业务结果,执行针对所述业务请求的业务处理。

26、本说明书提供了一种模型训练装置,包括:

27、获取模块,获取样本文本;

28、划分模块,对所述样本文本进行划分,得到各分词,并确定每个分词的词性;

29、标识确定模块,根据每个分词的词性,确定每个分词对应的词性标识;

30、序列信息确定模块,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息;

31、处理模块,将所述样本文本中的部分文本内容进行遮盖,得到遮盖后文本,并将所述词性序列信息以及所述遮盖后文本输入到待训练的文本处理模型中,以通过所述文本处理模型中包含的文本处理层,对所述遮盖后文本进行编码,得到文本编码特征,以及通过所述文本处理模型中包含的词性嵌入层,对所述词性序列信息进行编码,得到词性编码特征,并将所述文本编码特征以及所述词性编码特征进行融合,得到融合特征,以将所述融合特征输入到所述文本处理模型中包含的预测层,并通过所述预测层,预测出所述遮盖后文本中被遮盖的文本内容,作为预测内容;

32、训练模块,以最小化所述预测内容与所述样本文本中实际被遮盖的文本内容之间的偏差为优化目标,对所述文本处理模型进行训练。

33、可选地,所述序列信息确定模块具体用于,针对每个分词,根据该分词中包含的每个单字在该分词中的位置,确定该分词中包含的每个单字对应的位置标识符,并根据该分词的词性对应的词性标识以及该分词中包含的每个单字对应的位置标识符,确定该分词中包含的每个单字所对应的词性位置标识;根据每个分词中包含的各单字所对应的词性位置标识,确定所述样本文本的词性序列信息。

34、可选地,所述序列信息确定模块具体用于,针对每个分词,确定该分词的分词结构信息,所述分词结构信息用于表示该分词属于单字分词还是多字分词;根据该分词的分词结构信息,确定该分词对应的结构标识;根据每个分词对应的结构标识以及每个分词的词性对应的词性标识,确定所述样本文本的词性序列信息。

35、可选地,所述标识确定模块具体用于,针对每个分词,确定该分词的词性所归属的词性簇,其中,同一词性簇中包含的各词性所对应的词性标识相同;根据所述词性簇对应的词性标识,确定该分词对应的词性标识。

36、本说明书提供了一种业务执行装置,包括:

37、接收模块,接收业务请求;

38、确定模块,根据所述业务请求,确定待处理文本;

39、输入模块,将所述待处理文本输入到预先训练的文本处理模型中,以通过所述文本处理模型,确定所述待处理文本的文本特征信息,所述文本处理模型是通过上述的模型训练方法训练得到的;

40、传输模块,将所述文本特征信息传输至预设的业务模型中,以通过所述业务模型,输出业本文档来自技高网...

【技术保护点】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息,具体包括:

3.如权利要求1所述的方法,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息,具体包括:

4.如权利要求1所述的方法,根据每个分词的词性,确定每个分词对应的词性标识,具体包括:

5.一种业务执行的方法,包括:

6.一种模型训练装置,包括:

7.如权利要求6所述的装置,所述序列信息确定模块具体用于,针对每个分词,根据该分词中包含的每个单字在该分词中的位置,确定该分词中包含的每个单字对应的位置标识符,并根据该分词的词性对应的词性标识以及该分词中包含的每个单字对应的位置标识符,确定该分词中包含的每个单字所对应的词性位置标识;根据每个分词中包含的各单字所对应的词性位置标识,确定所述样本文本的词性序列信息。

8.如权利要求6所述的装置,所述序列信息确定模块具体用于,针对每个分词,确定该分词的分词结构信息,所述分词结构信息用于表示该分词属于单字分词还是多字分词;根据该分词的分词结构信息,确定该分词对应的结构标识;根据每个分词对应的结构标识以及每个分词的词性对应的词性标识,确定所述样本文本的词性序列信息。

9.如权利要求6所述的装置,所述标识确定模块具体用于,针对每个分词,确定该分词的词性所归属的词性簇,其中,同一词性簇中包含的各词性所对应的词性标识相同;根据所述词性簇对应的词性标识,确定该分词对应的词性标识。

10.一种业务执行装置,包括:

11.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~5任一项所述的方法。

12.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~5任一项所述的方法。

...

【技术特征摘要】

1.一种模型训练方法,包括:

2.如权利要求1所述的方法,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息,具体包括:

3.如权利要求1所述的方法,根据每个分词对应的词性标识,确定所述样本文本的词性序列信息,具体包括:

4.如权利要求1所述的方法,根据每个分词的词性,确定每个分词对应的词性标识,具体包括:

5.一种业务执行的方法,包括:

6.一种模型训练装置,包括:

7.如权利要求6所述的装置,所述序列信息确定模块具体用于,针对每个分词,根据该分词中包含的每个单字在该分词中的位置,确定该分词中包含的每个单字对应的位置标识符,并根据该分词的词性对应的词性标识以及该分词中包含的每个单字对应的位置标识符,确定该分词中包含的每个单字所对应的词性位置标识;根据每个分词中包含的各单字所对应的词性位置标识,确定所述样本文本的词性序列信息。

8.如权利要求6所述...

【专利技术属性】
技术研发人员:张睿赵智源祝慧佳
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1