对话模型的训练方法、装置及存储介质制造方法及图纸

技术编号：32571787 阅读：31 留言：0更新日期：2022-03-09 16:59

本申请实施例提供一种对话模型的训练方法、装置及存储介质，其中，对话模型的训练方法包括：获取第一对话样本，第一对话样本包含第一语种的对话数据和第二语种的对话数据中的至少一项，第一对话样本是根据第一语种的对话数据得到的；利用第一对话样本对初始对话模型进行预训练得到第一语种的预训练对话模型；基于第二语种的对话数据获取第二对话样本，第二对话样本的数量小于或等于第一对话样本的数量；利用第二对话样本对第一语种的预训练对话模型进行训练得到第二语种的对话模型。提高了对话模型准确性。对话模型准确性。对话模型准确性。

全部详细技术资料下载

【技术实现步骤摘要】
对话模型的训练方法、装置及存储介质

[0001]本申请实施例涉及人工智能
，尤其涉及一种对话模型的训练方法、装置及存储介质。

技术介绍

[0002]随着人工智能技术的发展，基于神经网络模型的虚拟智能助手可以为用户提供各种功能。在许多应用场景中，虚拟智能助手都能够和用户对话。为了更好地为用户提供服务，需要大量对话样本对对话模型进行训练，而且，对于使用不同语种进行对话的用户，需要分别建立不同语种的对话模型，利用不同语种的对话样本进行训练。但是，对于一些用户数量较少的语种，如小语种，没有足够的对话样本，使得这些语种的对话模型不够准确，不能很好地向用户提供各种服务。

技术实现思路

[0003]有鉴于此，本申请实施例提供一种对话模型的训练方法、装置及存储介质，以至少部分解决上述问题。
[0004]根据本申请实施例的第一方面，提供了一种对话模型的训练方法，包括：获取第一对话样本，第一对话样本包含第一语种的对话数据和第二语种的对话数据中的至少一项，第一对话样本是根据第一语种的对话数据得到的；利用第一对话样本对...

【技术保护点】

【技术特征摘要】
1.一种对话模型的训练方法，其中，包括：获取第一对话样本，所述第一对话样本包含所述第一语种的对话数据和所述第二语种的对话数据中的至少一项，所述第一对话样本是根据第一语种的对话数据得到的；利用所述第一对话样本对初始对话模型进行预训练得到所述第一语种的预训练对话模型；基于第二语种的对话数据获取第二对话样本，所述第二对话样本的数量小于或等于所述第一对话样本的数量；利用所述第二对话样本对所述第一语种的预训练对话模型进行训练得到所述第二语种的对话模型。2.根据权利要求1所述的方法，其中，所述第一对话样本包含所述第一语种的对话数据，所述基于第一语种的对话数据获取第一对话样本，包括：获取基于所述第一语种的对话数据，作为所述第一对话样本。3.根据权利要求1所述的方法，其中，所述第一对话样本包含所述第一语种的对话数据和所述第二语种的对话数据，所述基于第一语种的对话数据获取第一对话样本，包括：获取所述第一语种的对话数据，在所述第一语种的对话数据中确定至少一个待替换实体；将所述第一语种的对话数据中的所述至少一个待替换实体替换为所述第二语种的目标实体，得到所述第一对话样本。4.根据权利要求1所述的方法，其中，所述第一对话样本包含所述第二语种的对话数据，所述基于第一语种的对话数据获取第一对话样本，包括：获取所述第一语种的对话数据；利用翻译模型将所述第一语种的对话数据翻译成所述第二语种，得到所述第一对话样本。5.根据权利要求1所述的方法，其中，所述利用所述第二对话样本对所述第一语种的预训练对话模型进行训练得到所述第二语种的对话模型，包括：将所述第二对话样本输入所述第一语种的预训练对话模型，根据所述第二对话样本中上一轮语句和历史语句预测当前语句；根据所述当前语句确定对话是否继续，如果对话继续，则继续预测下一轮语句，如果对话结束，则生成预测对话；根据预测对话确定损失函数，并更新所述第一语种的预训练对话模型中的参数，直到训练完成得到所述第二语种的对话模型。6.根据权利要求1...

【专利技术属性】
技术研发人员：姜飞俊，胡于响，施晨，林兆江，徐鹏，冯雁，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人