问题生成模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24206532 阅读:108 留言:0更新日期:2020-05-20 14:54
本发明专利技术实施例适用于自然语言处理技术领域,提供了一种问题生成模型的训练方法、装置、电子设备及存储介质,其中,问题生成模型的训练方法包括:初始化第一模型;所述第一模型用于基于输入文本生成对应的问题文本;利用训练文本对所述第一模型进行迭代训练,直至一次训练过程中对应输出的问题文本与设定文本的匹配度满足设定条件,所述第一模型训练完成;其中,设定文本为预先为对应的训练文本设置的问题文本;在确定对应输出的问题文本与设定文本的匹配度时,所述方法还包括:在所述匹配度不满足所述设定条件时,将所述匹配度作为奖励函数调整所述第一模型的模型参数。

Training method, device, electronic equipment and storage medium of problem generation model

【技术实现步骤摘要】
问题生成模型的训练方法、装置、电子设备及存储介质
本专利技术属于自然语言处理
,尤其涉及一种问题生成模型的训练方法、装置、电子设备及存储介质。
技术介绍
问题生成(QG,QuestionGeneration)技术是根据一段文字,自动生成相应问题的技术。问题生成技术可以应用到聊天机器人中,使得聊天系统能够主动提出问题,以增强对话的交互性与持续性。另外,问题生成技术还可以应用在医药领域,例如可以用于自动问诊系统,通过与病人的对话进行诊断。然而,相关技术中问题生成模型生成问题的准确率并不高,而且不具备处理特殊词和单词重复问题的能力。
技术实现思路
有鉴于此,本专利技术实施例提供一种问题生成模型的训练方法、装置、电子设备及存储介质,以至少解决相关技术中问题生成模型生成问题的准确率并不高,而且不具备处理稀有词和单词重复问题的能力的问题。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供了一种问题生成模型的训练方法,该方法包括:初始化第一模型;所述第一模型用于基于输入文本生成对应本文档来自技高网...

【技术保护点】
1.一种问题生成模型的训练方法,其特征在于,包括:/n初始化第一模型;所述第一模型用于基于输入文本生成对应的问题文本;/n利用训练文本对所述第一模型进行迭代训练,直至一次训练过程中对应输出的问题文本与设定文本的匹配度满足设定条件,所述第一模型训练完成;其中,设定文本为预先为对应的训练文本设置的问题文本;/n在确定对应输出的问题文本与设定文本的匹配度时,所述方法还包括:/n在所述匹配度不满足所述设定条件时,将所述匹配度作为奖励函数调整所述第一模型的模型参数。/n

【技术特征摘要】
1.一种问题生成模型的训练方法,其特征在于,包括:
初始化第一模型;所述第一模型用于基于输入文本生成对应的问题文本;
利用训练文本对所述第一模型进行迭代训练,直至一次训练过程中对应输出的问题文本与设定文本的匹配度满足设定条件,所述第一模型训练完成;其中,设定文本为预先为对应的训练文本设置的问题文本;
在确定对应输出的问题文本与设定文本的匹配度时,所述方法还包括:
在所述匹配度不满足所述设定条件时,将所述匹配度作为奖励函数调整所述第一模型的模型参数。


2.如权利要求1所述的训练方法,其特征在于,在确定对应输出的问题文本与设定文本的匹配度时,所述方法包括:
计算所述问题文本与所述设定文本之间的双语评估替换BLEU分数,将所述BLEU分数作为所述匹配度;
所述将所述匹配度作为奖励函数调整所述第一模型的模型参数,包括:
基于设定的损失函数和所述BLEU分数调整设定的目标函数,所述设定的目标函数表征所述第一模型的训练程度。


3.如权利要求1所述的训练方法,其特征在于,所述利用训练文本对所述第一模型进行迭代训练时,所述方法包括:
将所述训练文本进行分词,得到对应的词向量;
根据所述词向量在所述训练文本中的位置,对所述词向量进行编号,得到词向量列表;
将所述词向量列表输入至第一模型,以训练第一模型。


4.如权利要求3所述的训练方法,其特征在于,所述利用训练文本对所述第一模型进行迭代训练时,所述第一模型用于:
计算所述词向量列表中每一个词向量的注意力权重;
根据所述注意力权重确定所述训练文本对应的语义编码向量;
根据所述语义编码向量确定所述训练文本对应的问题文本。


5.如权利要求4所述的训练方法,其特征在于,在根据所述语义编码向量确定所述训练文本对应的问题...

【专利技术属性】
技术研发人员:石奕
申请(专利权)人:卓尔智联武汉研究院有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1