一种面向机器阅读理解的问题生成方法技术

技术编号：34893558 阅读：150 留言：0更新日期：2022-09-10 13:52

本发明专利技术涉及一种面向机器阅读理解的问题生成方法，方法包括：使用已经构建的阅读理解数据集，包括问题、段落和答案；对数据集中与答案相关的三元组知识进行提取；使用seq2seq模型，以段落、答案和三元组知识作为模型的输入数据，得到编码向量和问题生成的预测结果；使用问题生成的预测结果计算得出问题生成的损失函数；使用辅助分类模型根据编码向量预测目标问题的疑问词类型，得到疑问词类型与辅助分类模型的预测结果；使用疑问词类型与辅助分类模型的预测结果计算得出辅助分类模型的损失函数；将两个损失函数组合，得到总损失函数，使用总损失函数对seq2seq模型和辅助分类模型进行迭代训练，得到训练完成的seq2seq模型；使用训练完成的seq2seq模型进行问题生成。训练完成的seq2seq模型进行问题生成。训练完成的seq2seq模型进行问题生成。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向机器阅读理解的问题生成方法

[0001]本专利技术涉及自然语言处理领域，尤其涉及一种面向机器阅读理解的问题生成方法。

技术介绍

[0002]近年来，随着人工智能技术的快速发展，自然语言生成的相关研究受到越来越多的关注，其中，问题生成是自然语言生成的一个重要研究方向，目前的问题生成研究主要是有答案的问题生成，根据给定的上下文信息和指定的答案信息，让机器能够理解给定的上下文信息生成针对该指定答案的问题。问题生成技术在学术界和工业界具有广泛的应用，一方面，问题生成可以作为一种数据增强技术为问答系统和阅读理解任务产生训练数据.研究表明，利用自动生成的问题来补充数据，或者同时将答案抽取与问题生成两个任务进行训练可以显著提升问答系统的性能。另一方面，问题生成可以在教育领域模拟用户提问、在对话领域中引导机器主动提问等，在对话系统中嵌入问题生成模型，可以加强系统与人的交互，帮助系统更准确地判断人的意图，从而使人机对话更加流畅。
[0003]早期的问题生成研究主要是基于规则和模板的方式，该方法是在语法树上定义一些启发式的规则来将某个句子转换成问题句式，该方法的好处是可以保证生成问题的相关性和流利度，但是这类方法严格依赖于人工设定的转换和生成规则，同时生成问题的多样性在很大程度上受到限制，可移植性差。随着一些大规模的高质量的机器阅读理解数据集的出现，如SQuAD、MARCO，基于神经网络的问题生成取得了很大的进展。在之后的研究当中，基于神经网络的问题生成成为主流的研究方法，并且出现了大量的高质量的研究。目前，面向阅读理解

【技术保护点】

【技术特征摘要】
1.一种面向机器阅读理解的问题生成方法，其特征在于，所述方法包括：使用已经构建的阅读理解数据集，包括问题、段落和答案；对数据集中与所述答案相关的三元组知识进行提取；使用seq2seq模型，以所述段落、答案和三元组知识作为模型的输入数据，对所述输入数据进行编码与解码，得到编码向量和问题生成的预测结果；以所述问题作为标签，使用所述问题生成的预测结果计算得出问题生成的损失函数；使用辅助分类模型根据所述编码向量预测目标问题的疑问词类型，得到疑问词类型与辅助分类模型的预测结果；以所述问题作为标签，使用所述疑问词类型与所述辅助分类模型的预测结果计算得出辅助分...

【专利技术属性】
技术研发人员：孙媛，刘思思，
申请(专利权)人：中央民族大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人