当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于文本的问题生成方法及其装置制造方法及图纸

技术编号:27492026 阅读:36 留言:0更新日期:2021-03-02 18:11
本申请公开了一种基于文本的问题生成方法及其装置,所述方法包括:将待处理的文本输入疑惑表征学习组件,获取与所述文本对应的上下文状态信息以及疑惑表征信息;将所述上下文状态信息以及疑惑表征信息输入到问题生成组件,获取所述文本的文本问题。采用本申请,可为文本生成更准确的问题。文本生成更准确的问题。文本生成更准确的问题。

【技术实现步骤摘要】
一种基于文本的问题生成方法及其装置


[0001]本申请涉及计算机
,尤其涉及一种基于文本的问题生成方法及其装置。

技术介绍

[0002]在信息时代,计算机技术高速发展,越来越多从事重复劳动人力可以被计算机替代,解放的人力可以从事更加具有创新新和挑战性的工作。几年来深度学习背景下人工智能的崛起更加加速了这一进程的实现。
[0003]问题生成(Question Generation,QG)是指基于输入文本中所包含的事实,从不同地角度构建问题。QG可应用于很多场景下,例如,在教育领域,帮助学生来提问;在对话领域,作为冷启动来开始一个话题或者通过提问来获得反馈;在医药领域,可以用于自动问诊系统,作为一种辅助工具等等。
[0004]现有的问题生成方法采用序列到序列的结构,简言之,直接将输入文本作为序列进行编码之后解码生成文本,但仅采用这种结构并没有对文本中的语义信息进行明确建模,导致生成过程中有较大不确定性,进而产生和输入文本不太相关并且信息量较少的问题。因此,相关技术需要一种考虑生成的问题与文本的相关性和信息量的问题生成方法。...

【技术保护点】

【技术特征摘要】
1.一种基于文本的问题生成方法,其特征在于,包括:将待处理的文本输入疑惑表征学习组件,获取与所述文本对应的上下文状态信息以及疑惑表征信息;将所述上下文状态信息以及疑惑表征信息输入到问题生成组件,获取所述文本的文本问题。2.如权利要求1所述的方法,其特征在于,所述疑惑表征学习组件包括贡献权重计算模块以及疑惑表征学习模块。3.如权利要求2所述的方法,其特征在于,将待处理的文本输入疑惑表征学习组件获取与所述文本对应的上下文状态信息以及疑惑表征信息包括:获取与所述文本的各个分词对应的分词代表向量;获取与所述文本对应的知识图中的每个元素的代表向量;将所述分词代表向量与所述代表向量输入到所述疑惑表征学习组件获取所述上下文状态信息以及所述疑惑表征信息。4.如权利要求3所述的方法,其特征在于,获取与所述文本的各个分词对应的分词代表向量包括:对所述文本执行分词处理,获取到所述文本的各个输入分词;将每个输入分词执行词嵌入处理,获取到各个输入分词的输入分词向量;利用预设的序列标注模式对各个分词执行标注,获取到各个输入分词对应的标注信息,其中,所述预设的序列标注模式与是否是起始实体和终止实体相关;利用所述输入分词向量与对应的标注信息生成所述分词代表向量。5.如权利要求4所述的方法,其特征在于,获取与所述文本对应的知识图中的每个元素的代表向量包括:确定所述文本中的实体以及实体间的关系;利用所述实体以及实体间的关系作为元素构成所述知识图;通过对每个元素对应的输入分词的分词向量执行全局均值池化,获取所述的代表向量。6.如权利要求5所述的方法,其特征在于,将所述分词代表向量与所述代表向量输入到所述疑惑表征学...

【专利技术属性】
技术研发人员:魏忠钰王思远
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1