模型训练方法、回复信息的方法、装置、设备及介质制造方法及图纸

技术编号:38409574 阅读:14 留言:0更新日期:2023-08-07 11:16
本发明专利技术公开了一种模型训练方法、回复信息的方法、装置、设备及介质。该方法包括:确定预设问答样本对以及获取自然提问语句;利用预设初始模型中的初始预处理子模型语义清洗处理所述自然提问语句,并根据处理结果和所述预设提问样本,确定提问样本;将所述提问样本输入所述预设初始模型中的初始机器学习子模型中,得到样本回复信息;利用所述样本回复信息和所述预设回答样本训练所述预设初始模型,以得到训练完成后的预设模型。本发明专利技术实施例的技术方案,可以在训练的过程中,通过对自然提问语句的语义清洗处理将干扰内容筛除,不仅不需要大量的训练样本,还能在保证训练效果的基础上,提高训练的效率。提高训练的效率。提高训练的效率。

【技术实现步骤摘要】
模型训练方法、回复信息的方法、装置、设备及介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种模型训练方法、回复信息的方法、装置、设备及存储介质。

技术介绍

[0002]在自动化交互系统中,客户提出问题,该系统会识别出客户的意图,并匹配适当的答案,而能够准确识别客户的意是极为关键的。只有正确的识别了客户意图,才能准确的回复客户,以解决客户的问题。
[0003]当客户与交互系统进行对话时,该系统通常会为客户直接解答问题,或给出引导问题,以引导客户输入关键问题。交互系统通常需要基于客户当前所给出的文本或语音内容,确定答案或下一轮引导问题。
[0004]然而,通常情况下,客户输入的对话内容不规范,如可能含有很多无效或干扰内容,故训练交互系统的语言应答模型时,需要大量的训练样本,训练效率较低。

技术实现思路

[0005]本专利技术提供了一种模型训练方法、回复信息的方法、装置、设备及存储介质,以解决训练模型时需要大量的训练样本的问题。
[0006]第一方面,本专利技术提供了一种模型训练方法,包括:
[0007]确定预设问答样本对以及获取自然提问语句,其中,所述预设问答样本对中包括预设提问样本和预设回答样本,所述自然提问语句和所述预设提问样本的提问目的一致;
[0008]利用预设初始模型中的初始预处理子模型语义清洗处理所述自然提问语句,并根据处理结果和所述预设提问样本,确定提问样本;
[0009]将所述提问样本输入所述预设初始模型中的初始机器学习子模型中,得到样本回复信息;
[0010]利用所述样本回复信息和所述预设回答样本训练所述预设初始模型,以得到训练完成后的预设模型。
[0011]第二方面,本专利技术提供了一种回复信息的方法,包括:
[0012]确定用户输入的对话信息;
[0013]利用预设模型中的语言预处理子模型,对所述对话信息进行语义清洗处理,得到目标特征编码,其中,所述预设模型采用如上述第一方面的模型训练方法得到;
[0014]将所述目标特征编码输入至所述预设模型中的预设机器学习子模型中,得到目标回复信息。
[0015]第三方面,本专利技术提供了一种模型训练装置,包括:
[0016]样本和语句确定模块,用于确定预设问答样本对以及获取自然提问语句,其中,所述预设问答样本对中包括预设提问样本和预设回答样本,所述自然提问语句和所述预设提问样本的提问目的一致;
[0017]提问样本确定模块,用于利用预设初始模型中的初始预处理子模型语义清洗处理所述自然提问语句,并根据处理结果和所述预设提问样本,确定提问样本;
[0018]样本回复确定模块,用于将所述提问样本输入所述预设初始模型中的初始机器学习子模型中,得到样本回复信息;
[0019]训练模块,用于利用所述样本回复信息和所述预设回答样本训练所述预设初始模型,以得到训练完成后的预设模型。
[0020]第四方面,本专利技术提供了一种回复信息的装置,包括:
[0021]对话信息确定模块,用于确定用户输入的对话信息;
[0022]特征编码确定模块,用于利用预设模型中的语言预处理子模型,对所述对话信息进行语义清洗处理,得到目标特征编码,其中,所述预设模型采用如上述第一方面的模型训练方法得到;
[0023]回复信息确定模块,用于将所述目标特征编码输入至所述预设模型中的预设机器学习子模型中,得到目标回复信息。
[0024]第五方面,本专利技术提供了一种电子设备,该电子设备包括:
[0025]至少一个处理器;
[0026]以及与至少一个处理器通信连接的存储器;
[0027]其中,存储器存储有可被至少一个处理器执行的计算机程序,该计算机程序被至少一个处理器执行,以使至少一个处理器能够执行上述第一方面的模型训练方法,和/或,执行上述第二方面的回复信息的方法。
[0028]第六方面,本专利技术提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现上述第一方面的模型训练方法,和/或,执行时实现上述第二方面的回复信息的方法。
[0029]本专利技术提供的模型训练方案,确定预设问答样本对以及获取自然提问语句,其中,所述预设问答样本对中包括预设提问样本和预设回答样本,所述自然提问语句和所述预设提问样本的提问目的一致,利用预设初始模型中的初始预处理子模型语义清洗处理所述自然提问语句,并根据处理结果和所述预设提问样本,确定提问样本,将所述提问样本输入所述预设初始模型中的初始机器学习子模型中,得到样本回复信息,利用所述样本回复信息和所述预设回答样本训练所述预设初始模型,以得到训练完成后的预设模型。通过采用上述技术方案,可以根据初始预处理子模型语义清洗处理后的结果和预设提问样本,确定出较为规范的样本回复信息,再利用该样本回复信息和预设回答样本训练预设初始模型,即可得到训练完成后的预设模型,本方案的训练方式,在训练的过程中通过对自然提问语句的语义清洗处理,可将干扰内容筛除,该方式无需大量的训练样本,在保证训练效果的基础上,提高了训练的效率。
[0030]本专利技术提供的回复信息的方案,确定用户输入的对话信息,利用预设模型中的语言预处理子模型,对所述对话信息进行语义清洗处理,得到目标特征编码,其中,所述预设模型采用如上文所述的模型训练方法得到,将所述目标特征编码输入至所述预设模型中的预设机器学习子模型中,得到目标回复信息。通过采用上述技术方案,通过利用预设模型可以在识别用户输入的对话语义之前,先将干扰内容滤除,使预设模型中的预设机器学习子模型可以根据对话信息对应的目标特征编码,准确且迅速的确定出对用户的回复信息,保
证了用户的体验感。
[0031]应当理解,本部分所描述的内容并非旨在标识本专利技术的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0032]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1是根据本专利技术实施例一提供的一种模型训练方法的流程图;
[0034]图2是根据本专利技术实施例二提供的一种模型训练方法的流程图;
[0035]图3是根据本专利技术实施例三提供的一种回复信息的方法的流程图;
[0036]图4是根据本专利技术实施例四提供的一种模型训练装置的结构示意图;
[0037]图5是根据本专利技术实施例五提供的一种回复信息的装置的结构示意图;
[0038]图6是根据本专利技术实施例六提供的一种电子设备的结构示意图。
具体实施方式
[0039]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:确定预设问答样本对以及获取自然提问语句,其中,所述预设问答样本对中包括预设提问样本和预设回答样本,所述自然提问语句和所述预设提问样本的提问目的一致;利用预设初始模型中的初始预处理子模型语义清洗处理所述自然提问语句,并根据处理结果和所述预设提问样本,确定提问样本;将所述提问样本输入所述预设初始模型中的初始机器学习子模型中,得到样本回复信息;利用所述样本回复信息和所述预设回答样本训练所述预设初始模型,以得到训练完成后的预设模型。2.根据权利要求1所述的方法,其特征在于,所述利用预设初始模型中的初始预处理子模型语义清洗处理所述自然提问语句,并根据处理结果和所述预设提问样本,确定提问样本,包括:将所述自然提问语句输入至预设初始模型中的初始预处理子模型中,得到语义特征编码;确定所述预设提问样本的关键字的文本编码序列;根据所述语义特征编码和所述文本编码序列,确定提问样本。3.根据权利要求2所述的方法,其特征在于,所述根据所述语义特征编码和所述文本编码序列,确定提问样本,包括:从所述语义特征编码中提取第一预设比例的编码内容,得到第一提问编码,以及从所述文本编码序列中提取第二预设比例的编码内容,得到第二提问编码;将所述第一提问编码和所述第二提问编码进行拼接,得到提问样本,其中,在对所述预设初始模型进行训练的前预设轮次中,所述第一提问编码占所述提问样本的比例,小于所述第二提问编码占所述提问样本的比例。4.根据权利要求1所述的方法,其特征在于,所述利用所述样本回复信息和所述预设回答样本训练所述预设初始模型,以得到训练完成后的预设模型,包括:根据所述样本回复信息和所述预设回答样本,确定损失函数,并利用所述损失函数训练所述预设初始模型,得到训练完成后的预设模型。5.一种回复信息的方法,其特征在于,包括:确定用户输入的对话信息;利用预设模型中的语言预处理子模型,对所述对话信息进行语义清洗处理,得到目标特征编码,其中,所述预设模型采用如权利要求1

4任一所述的模型训练方法得到;将所述目标特征编码输入至所述预设模型中的预设机器学习子模型中,得...

【专利技术属性】
技术研发人员:沈乐肖宇杨萱
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1