一种基于神经网络的导学问答系统及方法技术方案

技术编号:22944506 阅读:69 留言:0更新日期:2019-12-27 17:09
本发明专利技术设计了一种基于神经网络的导学问答系统,包括前端和后端,前端包括注册模块、登录模块、提问模块、回答模块、评价模块和认知评价树模块;所述后端包括三个子系统,分别为认知评价子系统、答案重用子系统和答案生成子系统;本发明专利技术通过对问句的信息提取,检索社区中已存在的问题的答案;如果不存在相似的问题,则使用训练好的模型在离线文档中生成回答,并在返回的答案中引导学习者扩展阅读。

A question answering system and method based on Neural Network

【技术实现步骤摘要】
一种基于神经网络的导学问答系统及方法
本专利技术涉及一种基于神经网络的导学问答系统及方法,属于神经网络和自动问答领域。
技术介绍
学习科学和计算机辅助学习领域的研究提供了证据表明,学习者的对话是其建构知识网络的重要影响因素。在线下教学中,课堂问答是传统线下教学模式中非常重要的组成部分,因此在线学习社区的在线问答技术还原了线下教学的场景,为学习者和老师提供了一个与学习伙伴互动的在线环境,促进了社区中老师与学习者及学习者与学习者之间的知识流动和经验共享。然而,在线问答缺乏实时性,例如由斯坦福大学创办的MOOC平台“Coursera”的问答平台中,学习者提出的问题得到回答的中值时间达22分钟。这使得学习者不能及时解决疑惑,使得教师不能及时了解学习者对知识点的掌握情况,无法达到线下教学“面对面”及时答疑的模式。针对在线问答实时性的弊端,自动问答技术的引入允许学习者通过自然语言进行叙述,系统结合自然语言处理技术“理解”学习者的问题,并检索得到相应的答案实时返回给学习者。但是由于在线学习社区学习者的不断增加,学习者在社区中提出的问题不能及时、准确的得到其他用户的回答。同时,由于不同学习者对于问题的描述不尽相同,使得相同的并且已经存在答案的问题不能及时反馈给学习者。然而,仅仅将问题的答案反馈给学习者只能使其被动的接受答案,而不能使其主动地扩展阅读,也不能反映学习者参与问题讨论的认知变化。因此,需要一种能够既能及时准确解决学习者的疑惑、也能引导学习者扩展阅读,最后将学习者认知的变化及时反映的问答系统,即导学问答系统,来解决上述问题。
技术实现思路
本专利技术的技术解决问题是:克服了在线问答实时性和准确性的弊端,提供一种基于神经网络的导学问答系统及方法,具有能够既能及时准确解决学习者的疑惑、也能引导学习者扩展阅读,最后将学习者认知的变化及时反映的优点。本专利技术技术解决方案:一种基于神经网络的导学问答系统,包括前端和后端,前端包括注册模块、登录模块、提问模块、回答模块、评价模块和认知评价树模块;所述后端包括三个子系统,分别为认知评价子系统、答案重用子系统和答案生成子系统;注册模块,提供学习者注册的功能,学习者必须注册成功后才能登录;登陆模块,提供学习者登录的功能,学习者必须登录成功后才能使用提问模块、回答模块和评价模块的功能;提问模块,提供学习者提问的功能,学习者在提问界面撰写问题标题、问题描述和问题分类;回答模块,提供学习者回答其他学习者的问题的功能,学习者在回答界面撰写回答内容;评价模块,提供学习者评价其他学习者的回答功能,学习者点赞、反对标记为标准答案或者在评价界面撰写评价内容中;评价树模块,提供教师浏览课程中发帖认知程度的功能;认知评价子系统,用于对学习者发帖的认知行为进行评价,最后为每个概念和知识点展示一棵认知评价树,为教师干预在线学习社区中学习者的对话提供依据;认知评价子系统包括认知特征选择模块和认知评价模块;认知特征选择模块根据学生的发帖内容,得到学生认知状态的特征向量;认知评价模块根据学生认知状态,得到认知评价树;答案重用子系统,将在线学习社区中已存在的含有高质量答案的问题进行重复利用,减少答案的冗余并快速相应学习者的提问;答案重用子系统包括:问句向量生成模块和问句相似度计算模块,问句向量生成模块根据问题的文本内容,得到问题的向量表示;问句相似度计算模块根据问题的向量表示,得到问题间相似度的接近程度;答案生成子系统,在无法找到相似问题时根据离线的文档数据对学习者的提问生成回答;答案生成子系统包括文档筛选模块、特征选择模块和答案选择模块;文档筛选模块根据文档间的相似程度,得到相近的文档集合;特征选择模块根据帖子的文本内容,得到帖子的数字向量表示;答案选择模块根据神经网络的输出,得到可能作为答案的片段;前端界面中的模块和后端系统中的各个模块通过HTTP协议进行交互。本专利技术的一种基于神经网络的导学问答方法,步骤为:(1)对于学习者的提问,首选使用布尔表达式进行概念和知识点的分类,对于分好类的问题,并行地进入答案重用子系统和认知评价子系统中;(2)在答案重用子系统中,根据问题的知识点分类筛选出同类并且具有回答并且回答被其他学习者赞同或标记为答案的问题,并和学习者的提问进行相似度计算,筛选出最相似的问题,并返回该问题下点赞数最多或者被标记为标准答案的回答;(3)如果不存在相似问题的答案,则进入答案生成子系统中,根据离线文档生成问题的答案,如果该答案评分大于给定的阈值,则认为答案质量高,并返回答案;(4)如果问题没有学习者回答,或者回答没有被赞同或标记为答案,则放弃自动回答,等待其他学习者对提问进行回答;(5)通过认知评价子系统生成的认知评价树,教师对在线学习社区对话进行干预,从而引导学习者学习;通过答案重用子系统和答案生成子系统返回的答案,在答案中将加入答案来源以引导学习者扩展阅读。本专利技术与现有技术相比的优点在于:(1)本专利技术细分为答案重用和答案生成两大模块,通过改进TF-IDF检索算法查找最相似的问题集合,同时通过神经网络方法在离线文档中寻找最可能的答案,结合两者的结果为学习者的提问提供及时准确的回答;(2)本专利技术的认知分类框架能将不同认知细分为具体的对话行为,并结合社区对话内容的特点对每一个认知行为进行准确定义,使得分类模型能够对在线学习社区中的对话进行准确的认知分类;(3)本专利技术使用神经网络模型,对学习者的提问进行语义分析,根据语义在离线文档中检索相关的内容,然后提取文档和问题的词向量和文本特征,最后通过多层双向循环神经网络得到深层次的隐含层向量特征,最后通过双线性分类器找到答案在文档中出现的位置并返回给学习者。我们通过对答案生成建模的实验验证了模型对比于两个基准模型和两个改进模型的效果提升。附图说明图1为本专利技术的系统的组成框图;图2为本专利技术认知评价子系统实现过程图;图3为本专利技术答案重用子系统实现过程图;图4为本专利技术答案生成子系统实现过程图。具体实施方式下面结合附图及实施过程进行详细说明。如图1所示,本专利技术系统的模型和框架的编写是在MacOS10.12.6平台下的PyCharmIDE使用Python语言和Scala语言开发完成。深度学习的模型等训练是在Ubuntu16.04操作系统下的GTX1080+Cuda8.0环境下完成。在神经网络模型实现上,使用了目前较流行的PyTorch深度学习框架。采集学习者的提问,使用布尔表达式进行概念和知识点的分类,对于分好类的问题,并行地进入答案重用子系统和认知评价子系统中;在答案重用子系统中,根据问题的知识点分类筛选出同类并且具有高质量回答的问题,并和学习者的提问进行相似度计算,筛选出最相似的问题,并返回该问题下点赞数最多或者被标记为标准答案的回答;如果不存在相似问题的答案,则进入答案生成子系统中,根据离线文档生成问题的答案,如果该答案本文档来自技高网
...

【技术保护点】
1.一种基于神经网络的导学问答系统,其特征在于:包括前端和后端,前端包括注册模块、登录模块、提问模块、回答模块、评价模块和认知评价树模块;所述后端包括三个子系统,分别为认知评价子系统、答案重用子系统和答案生成子系统;/n注册模块,提供学习者注册的功能,学习者必须注册成功后才能登录;/n登陆模块,提供学习者登录的功能,学习者必须登录成功后才能使用提问模块、回答模块和评价模块的功能;/n提问模块,提供学习者提问的功能,学习者在提问界面撰写问题标题、问题描述和问题分类;/n回答模块,提供学习者回答其他学习者的问题的功能,学习者在回答界面撰写回答内容;/n评价模块,提供学习者评价其他学习者的回答功能,学习者点赞、反对标记为标准答案或者在评价界面撰写评价内容中;/n评价树模块,提供教师浏览课程中发帖认知程度的功能;/n认知评价子系统,用于对学习者发帖的认知行为进行评价,最后为每个概念和知识点展示一棵认知评价树,为教师干预在线学习社区中学习者的对话提供依据;认知评价子系统包括认知特征选择模块和认知评价模块;认知特征选择模块根据学生的发帖内容,得到学生认知状态的特征向量;认知评价模块根据学生认知状态,得到认知评价树;/n答案重用子系统,将在线学习社区中已存在的含有高质量答案的问题进行重复利用,减少答案的冗余并快速相应学习者的提问;答案重用子系统包括:问句向量生成模块和问句相似度计算模块,问句向量生成模块根据问题的文本内容,得到问题的向量表示;问句相似度计算模块根据问题的向量表示,得到问题间相似度的接近程度;/n答案生成子系统,在无法找到相似问题时根据离线的文档数据对学习者的提问生成回答;答案生成子系统包括文档筛选模块、特征选择模块和答案选择模块;文档筛选模块根据文档间的相似程度,得到相近的文档集合;特征选择模块根据帖子的文本内容,得到帖子的数字向量表示;答案选择模块根据神经网络的输出,得到可能作为答案的片段;/n前端界面中的模块和后端系统中的各个模块通过HTTP协议进行交互。/n...

【技术特征摘要】
20190313 CN 20191018711971.一种基于神经网络的导学问答系统,其特征在于:包括前端和后端,前端包括注册模块、登录模块、提问模块、回答模块、评价模块和认知评价树模块;所述后端包括三个子系统,分别为认知评价子系统、答案重用子系统和答案生成子系统;
注册模块,提供学习者注册的功能,学习者必须注册成功后才能登录;
登陆模块,提供学习者登录的功能,学习者必须登录成功后才能使用提问模块、回答模块和评价模块的功能;
提问模块,提供学习者提问的功能,学习者在提问界面撰写问题标题、问题描述和问题分类;
回答模块,提供学习者回答其他学习者的问题的功能,学习者在回答界面撰写回答内容;
评价模块,提供学习者评价其他学习者的回答功能,学习者点赞、反对标记为标准答案或者在评价界面撰写评价内容中;
评价树模块,提供教师浏览课程中发帖认知程度的功能;
认知评价子系统,用于对学习者发帖的认知行为进行评价,最后为每个概念和知识点展示一棵认知评价树,为教师干预在线学习社区中学习者的对话提供依据;认知评价子系统包括认知特征选择模块和认知评价模块;认知特征选择模块根据学生的发帖内容,得到学生认知状态的特征向量;认知评价模块根据学生认知状态,得到认知评价树;
答案重用子系统,将在线学习社区中已存在的含有高质量答案的问题进行重复利用,减少答案的冗余并快速相应学习者的提问;答案重用子系统包括:问句向量生成模块和问句相似度计算模块,问句向量生成模块根据问题的文本内容,得到...

【专利技术属性】
技术研发人员:吴文峻吴沂楠
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1