【技术实现步骤摘要】
一种模型训练的方法、装置、存储介质及电子设备
[0001]本说明书涉及人工智能领域,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。
技术介绍
[0002]随着人工智能的发展,智能机器人应用于各个领域,例如,聊天机器人。为了让用户有良好的聊天体验,聊天机器人可在回复用户问题的同时,引入新的话题。由于回复给用户的内容及新的话题可能存在相同的人称代词或相关联的内容,若仅将回复给用户的内容及新的话题拼凑在一起,那么,展示给用户的聊天内容会较为生硬。例如,用户的问题为:“张三有哪些专利?”,聊天机器人可回复:“张三的专利有
……”
,为了引入新的话题,聊天机器人还可增加回复:“张三参加过长跑活动”显然,聊天机器人回复给用户的内容为:“张三的专利有
……
,张三参加过长跑活动”,但该回复内容十分生硬,影响用户的聊天体验。
[0003]基于此,本说明书提供一种模型训练的方法。
技术实现思路
[0004]本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以部分的解决现有 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练的方法,其特征在于,所述方法包括:将原始句拆分为若干个独立表达句,并将所述原始句加入训练数据集;将各独立表达句输入所述模型的生成器,以通过所述生成器对所述各独立表达句进行融合,得到融合句;并,将所述融合句加入所述训练数据集;将所述训练数据集中的待判别句输入所述模型的来源判别器,以得到所述来源判别器输出的判断所述待判别句是否为原始句的判别结果;根据所述来源判别器的判别结果及所述待判别句的来源标签,确定所述来源判别器的来源判别损失;并,根据所述来源判别器的判别结果、所述待判别句的来源标签及所述待判别句对应的原始句,确定所述生成器的来源生成损失;根据所述来源生成损失及所述来源判别损失,对所述模型进行对抗训练,其中,所述模型的生成器用于将回复用户的若干独立表达句进行融合。2.如权利要求1所述的方法,其特征在于,根据所述来源判别器的判别结果、所述待判别句的来源标签及所述待判别句对应的原始句,确定所述生成器的来源生成损失,具体包括:若所述来源判别器的判别结果与所述待判别句的来源标签不一致,则确定所述待判别句与所述待判别句对应的原始句的语序差异;根据所述语序差异,确定所述生成器的来源生成损失。3.如权利要求1所述的方法,其特征在于,所述方法还包括:将所述待判别句及所述待判别句对应的独立表达句输入所述模型的语义判别器,以得到所述语义判别器输出的判断所述待判别句的语义与所述待判别句对应的独立表达句的语义是否一致的判别结果;根据所述语义判别器输出的判别结果,对所述模型进行对抗训练。4.如权利要求3所述的方法,其特征在于,根据所述语义判别器输出的判别结果,对所述模型进行对抗训练,具体包括:根据所述语义判别器输出的判别结果及所述待判别句的语义标签,确定所述语义判别器的语义判别损失;并,根据所述语义判别器的判别结果、所述待判别句的语义标签及所述待判别句对应的独立表达句,确定所述生成器的语义生成损失;根据所述语义生成损失及所述语义判别损失,对所述模型进行对抗训练。5.如权利要求4...
【专利技术属性】
技术研发人员:谢冰,宋伟,朱世强,王雨菡,赵鑫安,尹越,袭向明,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。