一种模型训练的方法、装置、存储介质及电子设备制造方法及图纸

技术编号：38945712 阅读：30 留言：0更新日期：2023-09-25 09:41

本说明书公开了一种模型训练的方法、装置、存储介质及电子设备，将若干个独立表达句输入该模型的生成器，以得到融合句，并将该融合句加入训练数据集，将该训练数据集中的待判别句输入该模型的来源判别器，以确定待判别句是否为原始句的判别结果，根据该判别结果分别确定该来源判别器的来源判别损失及生成器的来源生成损失，根据该来源生成损失及该来源判别损失，对该模型进行训练，其中，该模型的生成器用于将回复用户的若干独立表达句进行融合。本方法通过对模型中的生成器和来源判别器进行对抗训练，以使生成器生成接近原始句的融合句，获得语序正常、内容衔接自然不生硬的句子，来源判别器更精准判断输入的句子是否为原始句。句。句。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练的方法、装置、存储介质及电子设备

[0001]本说明书涉及人工智能领域，尤其涉及一种模型训练的方法、装置、存储介质及电子设备。

技术介绍

[0002]随着人工智能的发展，智能机器人应用于各个领域，例如，聊天机器人。为了让用户有良好的聊天体验，聊天机器人可在回复用户问题的同时，引入新的话题。由于回复给用户的内容及新的话题可能存在相同的人称代词或相关联的内容，若仅将回复给用户的内容及新的话题拼凑在一起，那么，展示给用户的聊天内容会较为生硬。例如，用户的问题为：“张三有哪些专利？”，聊天机器人可回复：“张三的专利有
……”
，为了引入新的话题，聊天机器人还可增加回复：“张三参加过长跑活动”显然，聊天机器人回复给用户的内容为：“张三的专利有
……
，张三参加过长跑活动”，但该回复内容十分生硬，影响用户的聊天体验。
[0003]基于此，本说明书提供一种模型训练的方法。

技术实现思路

[0004]本说明书提供一种模型训练的方法、装置、存储介质及电子设备，以部分的解决现有...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法，其特征在于，所述方法包括：将原始句拆分为若干个独立表达句，并将所述原始句加入训练数据集；将各独立表达句输入所述模型的生成器，以通过所述生成器对所述各独立表达句进行融合，得到融合句；并，将所述融合句加入所述训练数据集；将所述训练数据集中的待判别句输入所述模型的来源判别器，以得到所述来源判别器输出的判断所述待判别句是否为原始句的判别结果；根据所述来源判别器的判别结果及所述待判别句的来源标签，确定所述来源判别器的来源判别损失；并，根据所述来源判别器的判别结果、所述待判别句的来源标签及所述待判别句对应的原始句，确定所述生成器的来源生成损失；根据所述来源生成损失及所述来源判别损失，对所述模型进行对抗训练，其中，所述模型的生成器用于将回复用户的若干独立表达句进行融合。2.如权利要求1所述的方法，其特征在于，根据所述来源判别器的判别结果、所述待判别句的来源标签及所述待判别句对应的原始句，确定所述生成器的来源生成损失，具体包括：若所述来源判别器的判别结果与所述待判别句的来源标签不一致，则确定所述待判别句与所述待判别句对应的原始句的语序差异；根据所述语序差异，确定所述生成器的来源生成损失。3.如权利要求1所述的方法，其特征在于，所述方法还包括：将所述待判别句及所述待判别句对应的独立表达句输入所述模型的语义判别器，以得到所述语义判别器输出的判断所述待判别句的语义与所述待判别句对应的独立表达句的语义是否一致的判别结果；根据所述语义判别器输出的判别结果，对所述模型进行对抗训练。4.如权利要求3所述的方法，其特征在于，根据所述语义判别器输出的判别结果，对所述模型进行对抗训练，具体包括：根据所述语义判别器输出的判别结果及所述待判别句的语义标签，确定所述语义判别器的语义判别损失；并，根据所述语义判别器的判别结果、所述待判别句的语义标签及所述待判别句对应的独立表达句，确定所述生成器的语义生成损失；根据所述语义生成损失及所述语义判别损失，对所述模型进行对抗训练。5.如权利要求4...

【专利技术属性】
技术研发人员：谢冰，宋伟，朱世强，王雨菡，赵鑫安，尹越，袭向明，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人