问题生成方法技术

技术编号：25802612 阅读：14 留言：0更新日期：2020-09-29 18:36

本发明专利技术公开一种问题生成方法，包括：对阅读理解数据集中的阅读理解数据进行预处理；将问题生成数据输入至编码器，并获取编码器隐层状态；将相应于所述问题生成数据的问题输入至解码器，并获取解码器隐层状态；基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率；根据当前时刻的上下文向量、解码器隐层状态和解码器输入确定当前时刻的词生成概率；根据所述词的生成概率和所述当前时刻的词生成概率确定词的概率分布。本发明专利技术解决了现有技术中依赖于一个固定的词典，不能生成不在词典中的词，导致生成的问题不流畅的问题。

全部详细技术资料下载

【技术实现步骤摘要】
问题生成方法
本专利技术涉及人工智能
，尤其涉及一种问题生成方法。
技术介绍
问题生成在人类智能的发展和人工智能系统的发展中都起着重要作用。在许多应用领域中，对问题生成的需求正在迅速增长。问题生成系统旨在根据给定的文本生成各种问题。在教育领域，提出好的问题对于评估学生知识和激励自我学习至关重要；在对话系统中，问题生成是机器人的很重要的一项技能，比如可以帮助机器人冷启动或者得到用户的信息从而进行更好的沟通；在阅读理解中，问题生成可以帮助人们自动生成问题，从而节省大量人力物力财力去标注数据。现有的问题生成任务的研究方法主要分为两类：基于规则的与基于神经网络的方法。基于规则的问题生成方法，需要大量的人力创建规则，生成的问题也具有固定形式，并且无法避免规则中的错误。与基于规则的方法比较而言，基于神经网络的问题生成方法更多的是数据驱动、支持端到端训练的形式，不依赖手工编写的规则。但是目前基于神经网络方法不能很好的处理未登录词(OOV)和词重复生成的现象。
技术实现思路
本专利技术实施例提供一种问题生成方法，至少解决上述技术问题之一。第一方面，本专利技术实施例提供一种问题生成方法，包括：对阅读理解数据集中的阅读理解数据进行预处理，以得到多条问题生成数据；将问题生成数据输入至编码器，并获取编码器隐层状态；将相应于所述问题生成数据的问题输入至解码器，并获取解码器隐层状态；基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率；根据当前时...

【技术保护点】
1.一种问题生成方法，包括：/n对阅读理解数据集中的阅读理解数据进行预处理，以得到多条问题生成数据；/n将问题生成数据输入至编码器，并获取编码器隐层状态；/n将相应于所述问题生成数据的问题输入至解码器，并获取解码器隐层状态；/n基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率；/n根据当前时刻的上下文向量、解码器隐层状态和解码器输入确定当前时刻的词生成概率；/n根据所述词的生成概率和所述当前时刻的词生成概率确定词的概率分布，用于问题生成。/n

【技术特征摘要】
1.一种问题生成方法，包括：
对阅读理解数据集中的阅读理解数据进行预处理，以得到多条问题生成数据；
将问题生成数据输入至编码器，并获取编码器隐层状态；
将相应于所述问题生成数据的问题输入至解码器，并获取解码器隐层状态；
基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率；
根据当前时刻的上下文向量、解码器隐层状态和解码器输入确定当前时刻的词生成概率；
根据所述词的生成概率和所述当前时刻的词生成概率确定词的概率分布，用于问题生成。

2.根据权利要求1所述的方法，其中，所述基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率包括：
根据所述编码器隐层状态和所述解码器隐层状态计算第一关联向量；
对所述第一关联向量进行softmax操作并归一化处理得到第一注意力分布；
根据所述第一注意力分布确定当前时刻的上下文向量；
根据所述当前时刻的上下文向量和所述解码器隐层状态确定预设词典中的词的生成概率。

3.根据权利要求2所述的方法，其中，所述当前时刻的词生成概率由以下公式确定：

其中，wh*，ws，wy和标量bptr是可学习参数，δ是sigmoid函数。

4.根据权利要求3所述的方法，其中，所述词的概率分布由以下公式确定：

其中，当w是一个未登陆词时，Pvacab(w)为0；当w没有出现在输入文本中时，那么为0。

5.根据权利要求1所述的方法，其中，所述基于所述编码器隐层状态和所述解码器隐层状态确定预设词典中的词的生成概率包括：
根据所述编码器隐层状态和所述解码器隐层状态计算第一关联向量；
对所述第一关联向量进行softmax操作并归一化处理得到第一注意力分布；
对当前时刻之前的多个第一注意力分布求和；
根据求和结果所述编码器隐层状态和所述解码器隐层状态计算第二关联向量；
对所述第二关联向量进行归一化得到第二注意力分布；
根据所述第二注意力分布确定当前时刻的第二上下文向量；
...

【专利技术属性】
技术研发人员：朱少华，缪庆亮，俞凯，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人