辅助阅读的方法、装置、设备及存储介质制造方法及图纸

技术编号:36840653 阅读:20 留言:0更新日期:2023-03-15 15:36
本申请实施例公开了一种辅助阅读的方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:确定目标文档包括的多个正文文本中每个正文文本对应的至少一组位置,每组位置包括一个起始位置和一个结束位置,同一组位置用于指示对应的正文文本中的一个关键文本片段,基于每个正文文本和每个正文文本对应的至少一组位置,构建每个正文文本对应的要素图谱,要素图谱用于指示对应的正文文本中关键文本片段中的要素以及要素间的关系,基于每个正文文本和每个正文文本对应的要素图谱,生成每个正文文本对应的问题和答案,以进行辅助阅读。本申请实施例通过引入大纲和目录来生成问题和答案,这样可以保证生成的问题和答案具有针对性。针对性。针对性。

【技术实现步骤摘要】
辅助阅读的方法、装置、设备及存储介质


[0001]本申请实施例涉及计算机
,特别涉及一种辅助阅读的方法、装置、设备及存储介质。

技术介绍

[0002]辅助阅读是以教育书籍为对象,利用计算机技术解决学生自学时缺乏老师指导的问题。辅助阅读技术包括问题生成和答案生成,其中,问题生成即计算机自动生成与目标文档内容相关的问题。答案生成即计算机自动生成问题对应的答案。通过自动生成大量高质量的问题以及问题对应的答案,来帮助学生检验自身对目标文档的学习程度,完善自身的信息需求。
[0003]在相关技术中,提出了一种问题生成的方法。在该方法中,先根据文本结构识别目标文档的文本类型,文本类型包括结构化和半结构化文本类型、自然语言文本类型等等。其次,从多个问题生成模型中,选择与目标文档的文本类型对应的问题生成模型。最后,将目标文档输入到所选的问题生成模型中,实现问题的生成。
[0004]然而,在上述方法中,利用问题生成模型生成的问题比较简略,而且在某些情况下,生成的问题与目标文档内容的相关性不大,同时生成的问题还缺乏针对性。

技术实现思路

[0005]本申请实施例提供了一种辅助阅读的方法、装置、设备及存储介质,可以解决相关技术生成的问题和答案缺乏针对性的问题。所述技术方案如下:
[0006]一方面,提供了一种辅助阅读的方法,所述方法包括:
[0007]确定目标文档包括的多个正文文本中每个正文文本对应的至少一组位置,每组位置包括一个起始位置和一个结束位置,同一组位置用于指示对应的正文文本中的一个关键文本片段;
[0008]基于每个正文文本和每个正文文本对应的至少一组位置,构建每个正文文本对应的要素图谱,所述要素图谱用于指示对应的正文文本中关键文本片段中的要素以及要素间的关系;
[0009]基于每个正文文本和每个正文文本对应的要素图谱,生成每个正文文本对应的问题和答案,以进行辅助阅读。
[0010]可选地,所述目标文档具有大纲和目录,所述目录包括多个标题,所述多个标题与所述多个正文文本一一对应;所述确定目标文档包括的多个正文文本中每个正文文本对应的至少一组位置,包括:
[0011]将所述大纲和目录作为第一循环神经网络模型的输入,以得到所述第一循环神经网络模型输出的多个第一稠密向量,所述多个第一稠密向量与所述多个标题一一对应,所述第一稠密向量用于指示对应标题的正文文本中的知识要点;
[0012]确定每个正文文本的文本语义信息,所述文本语义信息用于指示对应的正文文本
中各个词的语义;
[0013]基于所述多个第一稠密向量和所述多个正文文本的文本语义信息,确定每个正文文本对应的至少一组位置。
[0014]可选地,所述基于所述多个第一稠密向量和所述多个正文文本的文本语义信息,确定每个正文文本对应的至少一组位置,包括:
[0015]将所述多个第一稠密向量和所述多个正文文本的文本语义信息作为标注生成网络模型的输入,以得到所述标注生成网络模型输出的每个正文文本对应的至少一组位置。
[0016]可选地,所述基于每个正文文本和每个正文文本对应的至少一组位置,构建每个正文文本对应的要素图谱,包括:
[0017]从所述多个正文文本中选择一个正文文本,按照以下操作构建选择的正文文本对应的要素图谱,直至构建出每个正文文本对应的要素图谱为止:
[0018]基于所述选择的正文文本对应的至少一组位置所包括的起始位置和结束位置,从所述选择的正文文本中获取至少一个关键文本片段;
[0019]将所述至少一个关键文本片段作为要素抽取网络模型的输入,以得到所述要素抽取网络模型输出的多个五元组,所述五元组包括主语、主语类别、谓语、宾语和宾语类别;
[0020]基于所述多个五元组之间的关联关系,构建所述选择的正文文本对应的要素图谱。
[0021]可选地,所述基于每个正文文本和每个正文文本对应的要素图谱,生成每个正文文本对应的问题和答案,包括:
[0022]从所述多个正文文本中选择一个正文文本作为目标正文文本,按照以下操作生成所述目标正文文本对应的问题和答案,直至生成每个正文文本对应的问题和答案为止:
[0023]确定目标要素图谱中各个要素对应的第一语义关系向量,以及多个目标五元组中每个目标五元组对应的第二语义关系向量;
[0024]其中,所述第一语义关系向量用于指示对应要素与所述目标要素图谱中其他要素之间的语义关系,所述第二语义关系向量用于指示对应的目标五元组与其他目标五元组之间的语义关系,所述目标要素图谱为所述目标正文文本对应的要素图谱,所述多个目标五元组为用于构建所述目标要素图谱的五元组;
[0025]基于所述目标要素图谱、所述目标要素图谱中各个要素对应的第一语义关系向量、每个目标五元组对应的第二语义关系向量,以及所述目标正文文本,生成所述目标正文文本对应的问题和答案。
[0026]可选地,所述确定目标要素图谱中各个要素对应的第一语义关系向量,以及多个目标五元组中每个目标五元组对应的第二语义关系向量,包括:
[0027]将所述目标要素图谱作为图卷积网络模型的输入,以得到所述图卷积网络模型输出的各个要素对应的第一语义关系向量;
[0028]将所述多个目标五元组作为第二循环神经网络模型的输入,以得到所述第二循环神经网络模型输出的每个目标五元组对应的第二语义关系向量。
[0029]可选地,所述基于所述目标要素图谱、所述目标要素图谱中各个要素对应的第一语义关系向量、每个目标五元组对应的第二语义关系向量,以及所述目标正文文本,生成所述目标正文文本对应的问题和答案,包括:
[0030]将所述目标要素图谱中各个要素对应的第一语义关系向量、每个目标五元组对应的第二语义关系向量,以及所述目标正文文本的文本语义信息作为注意力网络模型的输入,以得到所述注意力网络模型输出的第二稠密向量,所述第二稠密向量用于指示关于所述目标要素图谱的知识要点;
[0031]从所述目标要素图谱中选择至少一个要素作为目标要素;
[0032]基于所述第二稠密向量和所述目标要素,生成所述目标正文文本对应的问题和答案。
[0033]可选地,所述基于所述第二稠密向量和所述目标要素,生成所述目标正文文本对应的问题和答案,包括:
[0034]将所述第二稠密向量和所述目标要素作为问题生成网络模型的输入,以得到所述问题生成网络模型输出的问题;
[0035]将所述第二稠密向量和所述问题作为答案生成网络模型的输入,以得到所述答案生成网络模型输出的答案。
[0036]另一方面,提供了一种辅助阅读的装置,所述装置包括:
[0037]确定模块,用于确定目标文档包括的多个正文文本中每个正文文本对应的至少一组位置,每组位置包括一个起始位置和一个结束位置,同一组位置用于指示对应的正文文本中的一个关键文本片段;
[0038]构建模块,用于基于每个正文文本和每个正文文本对应的至少一组位置,构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种辅助阅读的方法,其特征在于,所述方法包括:确定目标文档包括的多个正文文本中每个正文文本对应的至少一组位置,每组位置包括一个起始位置和一个结束位置,同一组位置用于指示对应的正文文本中的一个关键文本片段;基于每个正文文本和每个正文文本对应的至少一组位置,构建每个正文文本对应的要素图谱,所述要素图谱用于指示对应的正文文本中关键文本片段中的要素以及要素间的关系;基于每个正文文本和每个正文文本对应的要素图谱,生成每个正文文本对应的问题和答案,以进行辅助阅读。2.如权利要求1所述的方法,其特征在于,所述目标文档具有大纲和目录,所述目录包括多个标题,所述多个标题与所述多个正文文本一一对应;所述确定目标文档包括的多个正文文本中每个正文文本对应的至少一组位置,包括:将所述大纲和目录作为第一循环神经网络模型的输入,以得到所述第一循环神经网络模型输出的多个第一稠密向量,所述多个第一稠密向量与所述多个标题一一对应,所述第一稠密向量用于指示对应标题的正文文本中的知识要点;确定每个正文文本的文本语义信息,所述文本语义信息用于指示对应的正文文本中各个词的语义;基于所述多个第一稠密向量和所述多个正文文本的文本语义信息,确定每个正文文本对应的至少一组位置。3.如权利要求2所述的方法,其特征在于,所述基于所述多个第一稠密向量和所述多个正文文本的文本语义信息,确定每个正文文本对应的至少一组位置,包括:将所述多个第一稠密向量和所述多个正文文本的文本语义信息作为标注生成网络模型的输入,以得到所述标注生成网络模型输出的每个正文文本对应的至少一组位置。4.如权利要求1所述的方法,其特征在于,所述基于每个正文文本和每个正文文本对应的至少一组位置,构建每个正文文本对应的要素图谱,包括:从所述多个正文文本中选择一个正文文本,按照以下操作构建选择的正文文本对应的要素图谱,直至构建出每个正文文本对应的要素图谱为止:基于所述选择的正文文本对应的至少一组位置所包括的起始位置和结束位置,从所述选择的正文文本中获取至少一个关键文本片段;将所述至少一个关键文本片段作为要素抽取网络模型的输入,以得到所述要素抽取网络模型输出的多个五元组,所述五元组包括主语、主语类别、谓语、宾语和宾语类别;基于所述多个五元组之间的关联关系,构建所述选择的正文文本对应的要素图谱。5.如权利要求1所述的方法,其特征在于,所述基于每个正文文本和每个正文文本对应的要素图谱,生成每个正文文本对应的问题和答案,包括:从所述多个正文文本中选择一个正文文本作为目标正文文本,按照以下操作生成所述目标正文文本对应的问题和答案,直至生成每个正文文本对应的问题和答案为止:确定目标要素图谱中各个要素对应的第一语义关系向量,以及多个目标五元组中每个目标五元组对应的第二语义关系向量;其中,所述第一语义关系向量用于指示对应要素与所述目标要素图谱中其他要素之间
的语义关系,所述第二语义关系向量用于指示对应的目标五元组与其他目标五元组之间的语义关系,所述目标要素图谱为所述目标正文文本对应的要素图谱,所述多个目标五元组为用于构建所述目标要素图谱的五元组;基于所述目标要素图谱、所述目标要素图谱中各个要素对应的第一语义关系向量、每个目标五元组对应的第二语义关系向量,以及所述目标正文文本,生成所述目标正文文本对应的问题和答案。6.如权利要求5所述的方法,其特征在于,所述确定目标要素图谱中各个要素对应的第一语义关系向量,以及多个目标五元组中每个目标五元组对应的第二语义关系向量,包括:将所述目标要素图谱作为图卷积网络模型的输入,以得到所述图卷积网络模型输出的各个要素对应的第一语义关系向量;将所述多个目标五元组作为第二循环神经网络模型的输入,以得到所述第二循环神经网络模型输出的每个目标五元组对应的第二语义关系向量。7.如权利要求5所述的方法,其特征在于,所述基于所述目标要素图谱、所述目标要素图谱中各个要素对应的第一语义关系向量、每个目标五元组对应的第二语义关系向量,以及所述目标正文文本,生成所述目标正文文本对应的问题和答案,包括:将所述目标要素图谱中各个要素对应的第一语义关系向量、每个目标五元组对应的第二语义关系向量,以及所述目标正文文本的文本语义信息作为注意力网络模型的输入,以得到所述注意力网络模型输出的第二稠密向量,所述第二稠密向量用于指示关于所述目标要素图谱的知识要点;从所述目标要素图谱中选择至少一个要素作为目标要素;基于所述第二稠密向量和所述目标要素,生成所述目标正文文本对应的问题和答案。8.如权利要求7所述的方法,其特征在于,所述基于所述第二稠密向量和所述目标要素,生成所述目标正文文本对应的问题和答案,包括:将所述第二稠密向量和所述目标要素作为问题生成网络模型的输...

【专利技术属性】
技术研发人员:沈力行
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1