问题生成方法、模型训练方法、装置、设备和存储介质制造方法及图纸

技术编号:26762670 阅读:23 留言:0更新日期:2020-12-18 23:14
本申请公开了一种问题生成方法、模型训练方法、装置、设备和存储介质,涉及人工智能领域,尤其涉及深度学习、自然语言处理领域。具体实现方案为:根据用于生成问题的文本内容,获得至少一个关键词和每个关键词对应的概率;根据文本内容、关键词和概率,分别获得与每个关键词对应的输入序列;分别将与每个关键词对应的输入序列输入问题生成模型,获得关于每个关键词的问题。本申请实施例能够针对文本内容获得更多不同方面的问题,丰富提问内容。

【技术实现步骤摘要】
问题生成方法、模型训练方法、装置、设备和存储介质
本申请涉及人工智能领域,尤其涉及深度学习、自然语言处理领域。
技术介绍
随着机器阅读技术的发展,可以通过计算机算法阅读一段或者一句文字,实现对自然语言的处理。问题生成是指根据给定的文本段落生成相关问题,在自然语言处理技术中是一个重要的问题。早期的问题生成方法大都需要依赖人工制定的规则模板。这些方法的成功与否,关键在于是否存在精心设计的陈述句到疑问句的转换规则,而这些转换规则通常是基于深层的语言知识。由于早期的问题生成方法强烈依赖人为设计的转换和生成规则,设计者的知识面往往专注于某一领域,因此所涉及的问题转换和生成规则也仅针对某一知识领域,很难适用于其它指示领域。因此,需要一种能够针对给定文本从尽可能多的角度进行提问,生成问题语句的方法。
技术实现思路
为了解决现有技术中至少一个问题,本申请实施例提供了一种问题生成方法、模型训练方法、装置、设备和存储介质。第一方面,本申请实施例提供一种问题生成方法,包括:根据用于生成问题的文本内容,获得至少一个关键词和每本文档来自技高网...

【技术保护点】
1.一种问题生成方法,包括:/n根据用于生成问题的文本内容,获得至少一个关键词和每个所述关键词对应的概率;/n根据所述文本内容、所述关键词和所述概率,分别获得与每个关键词对应的输入序列;/n分别将所述与每个关键词对应的输入序列输入问题生成模型,获得关于所述每个关键词的问题。/n

【技术特征摘要】
1.一种问题生成方法,包括:
根据用于生成问题的文本内容,获得至少一个关键词和每个所述关键词对应的概率;
根据所述文本内容、所述关键词和所述概率,分别获得与每个关键词对应的输入序列;
分别将所述与每个关键词对应的输入序列输入问题生成模型,获得关于所述每个关键词的问题。


2.根据权利要求1所述的方法,其中,所述根据所述文本内容、所述关键词和所述概率,分别获得与每个关键词对应的输入序列,包括:
根据所述文本内容,获得文本分词向量序列;所述文本分词向量序列包括所述文本内容中每个分词的分词向量,所述文本内容中的分词为关键词或非关键词;
针对每个关键词,在所述文本分词向量序列中,将所述关键词对应的概率拼接在所述关键词的分词向量之后,得到与所述关键词对应的输入序列。


3.根据权利要求1或2所述的方法,其中,所述分别将所述与每个关键词对应的输入序列输入问题生成模型,获得关于所述每个关键词的问题,包括:
针对各个关键词,将所述关键词对应的输入序列输入问题生成模型;
根据所述输入序列,采用所述问题生成模型针对固定词典中的每个词语进行计算,得到所述词语在所述问题的语句中每个位置的第一概率;所述固定词典为根据词库构建的词典;
根据所述第一概率,采用所述问题生成模型确定所述问题的语句中每个位置的词语,得到所述关键词的问题。


4.根据权利要求3所述的方法,其中,所述根据所述第一概率,采用所述问题生成模型确定所述问题的语句中每个位置的词语,得到所述关键词的问题,包括:
根据所述输入序列,采用所述问题生成模型针对动态词典中的每个词语,得到所述词语在所述问题的语句中每个位置的第二概率;所述动态词典为所述文本内容的分词构成的词典;
根据所述第一概率和所述第二概率,针对所述固定词典和所述动态词典构成的词典合集中的每个词语,计算所述词语在所述语句中每个位置的加权概率;
根据所述加权概率,确定所述语句中每个位置的词语,得到所述语句。


5.根据权利要求4所述的方法,其中,所述根据所述加权概率,确定所述语句中每个位置的词语,包括:
针对所述语句的各个位置,将在所述位置的加权概率最大的词语确定为所述位置的词语。


6.根据权利要求4所述的方法,其中,计算所述词典合集中的一个词语在所述语句中的一个位置的加权概率的方式包括:
在所述词语同时存在于所述固定词典和所述动态词典的情况下,对所述词语在所述位置的第一概率和所述词语在所述位置的第二概率进行加权求和,将加权求和的结果作为所述词语在所述位置的加权概率;
在所述词语仅存在于所述固定词典的情况下,将第一概率作为所述词语在所述语句中每个位置的加权概率;
在所述词语仅存在于所述动态词典的情况下,将第二概率作为所述词语在所述语句中每个位置的加权概率。


7.根据权利要求4-6中任意一项所述的方法,其中,所述问题生成模型包括双向LSTM编码层和单向LSTM解码层;所述双向LSTM编码层和单向LSTM解码层用于根据输入序列输出所述加权概率。


8.根据权利要求1或2所述的方法,其中,所述根据用于生成问题的文本内容,获得至少一个关键词和每个所述关键词对应的概率,包括:
将所述文本内容输入关键词提取模型;
采用所述关键词提取模型,获得所述至少一个关键词和每个所述关键词对应的概率。


9.根据权利要求8所述的方法,其中,所述关键词提取模型包括双向长短期记忆神经网络LSTM层、条件随机场CRF层和输出层;
所述采用所述关键词提取模型,获得所述至少一个关键词和所述关键词对应的概率,包括:
采用所述双向LSTM层,根据输入的文本内容获得所述文本内容的隐状态输出序列;
采用所述双向LSTM层,将所述隐状态输出序列映射到K维空间,得到所述文本内容的句子特征,所述K为正整数;
采用所述CRF层计算所述句子特征,得到所述文本内容中的每个分词为关键词的概率;
采用所述输出层,将大于概率阈值的分词作为关键词,获得至少一个关键词和所述关键词对应的概率。


10.一种模型训练方法,包括:
根据第一样本文本,获得所述第一样本文本中的至少一个第一样本关键词以及每个所述第一样本关键词的概率;
根据所述第一样本关键词、所述第一样本关键词的概率和第一样本文本,获得每个所述第一样本关键词对应的第一样本输入序列;
将所述第一样本文本输入序列输入待训练问题生成模型,获得输出结果;
根据所述输出结果和参考问题,获得问题生成损失;
根据所述问题生成损失,优化所述待训练问题生成模型,获得问题生成模型。


11.根据权利要求10所述的方法,其中,所述根据第一样本文本,获得所述第一样本文本中的至少一个第一样本关键词以及每个所述第一样本关键词的概率,包括:
将所述第一样本文本输入关键词提取模型,获得至少一个所述第一样本关键词和所述第一样本关键词的概率。


12.一种模型训练方法,包括:
根据第二样本文本、样本问题和关键词提取规则,获得第二样本文本中的第二样本关键词;
利用所述第二样本文本、样本问题和第二样本关键词,训练待训练关键词提取模型,得到关键词提取模型。


13.根据权利要求12所述的方法,其中,所述利用所述第二样本文本、样本问题和第二样本关键词,训练待训练关键词提取模型,得到关键词提取模型,包括:
将所述第二样本文本、样本问题输入待训练关键词提取模型,得到输出关键词和每个输出关键词的概率;
根据所述第二样本关键词、所述输出关键词和所述每个输出关键词的概率,得到关键词提取损失;
根据所述关键词提取损失,优化所述待训练关键词提取模型,得到所述关键词提取模型。


14.一种问题生成装置,包括:
关键词模块,用于根据用于生成问题的文本内容,获得至少一个关键词和每个所述关键词对应的概率;<...

【专利技术属性】
技术研发人员:李雅美蓝翔郑辉煌张留杰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1