一种基于智能问答的虚拟学习环境构建方法技术

技术编号:19425271 阅读:29 留言:0更新日期:2018-11-14 10:37
本发明专利技术涉及一种基于智能问答的虚拟学习环境构建方法,属于人机交互技术领域,包括1.采集并构建特定领域教学问答数据集,对采集的问答对进行预处理;2.构建BI‑LSTM‑CRF模型对问答对进行语义分析和特征提取,实现语句的分词与序列标注;3.构建基于LSTM网络的答案置信度计算模型,输入问答对特征向量,通过模型衡量问答对的匹配程度,将得分最高的答案特征向量转换输出;4.利用基于Unity3D的虚拟现实技术搭建虚拟学习环境,构建智能问答引擎,引入训练好的深度学习问答模型,实现基于智能问答的虚拟学习环境构建。本发明专利技术利用深度学习实现了特定领域语义理解层面的智能问答,并将其应用于面向教学的虚拟学习环境之中,为虚拟课堂与人机交互研究拓展了思路和方法。

【技术实现步骤摘要】
一种基于智能问答的虚拟学习环境构建方法
本专利技术属于人机交互
,涉及一种基于智能问答的虚拟学习环境构建方法。
技术介绍
虚拟学习环境是课堂教学与虚拟现实技术的有机结合,其主要是应用虚拟现实技术在逼真自然的三维虚拟环境中构建教学场景和教学内容,为学生提供特定教学、演习操作及疑难解答。虚拟学习环境的构建涉及到虚拟现实、人机交互、多媒体技术、计算机网络等多方面内容,如何设计出可理解用户意图并具有实时智能交互的虚拟学习环境是当下需要考虑的重要问题。智能问答是自然语言处理领域的一个重要研究方向,与传统搜索引擎不同,问答系统作为满足信息需求的另一种方式,它不仅允许用户以自然语言形式提问,还能为用户直接返回所需的精准答案。从用户角度来看,智能问答是一种简洁高效的信息获取方式,用户无需从密麻冗长的相关文档列表中寻找答案,可有效规避传统搜索引擎的过载问题,提高信息检索效率。在当今互联网+的时代,智能问答可以灵活应用到如智能客服、医疗咨询和聊天机器人等日常生活的诸多方面,为人们开辟更便捷的生活方式。传统的问答技术主要有基于常用知识库、基于web检索和基于关键词检索,它们的核心是关键词识别分析、问题匹配和候选答案排序。由于中文表达方式灵活,具有相同语义的句子其关键词出现的位置不定,关键词按序匹配往往不能满足检索要求,同时汉语中存在着大量的同义词,在问题和答案中完全不同的关键词可能含有相同的语义,这些传统方法普遍缺乏对问答语句语义层面的理解分析,存在着人工标注依赖性强、准确率低下、可扩展性差等弊端。当下国内成熟的面向特定领域的中文智能问答系统不多,问答系统的应用发展也相应受到了掣肘,其主要原因是目前国内开源可供参考的标准中文问答数据集相对较少,构建一定规模的标准问答知识库需要耗费相当的人力物力资源。现有一部分专利提出想法构造智能问答系统,并将其应用到基于虚拟环境的消防、医疗、家居等领域中,为智能问答开辟新的应用模式。其中,将智能问答与虚拟学习环境结合应用的想法也逐渐被提上日程,学生在虚拟学习环境中做实验遇到疑问时,智能问答系统能够为学生提供问题的解决思路和方法,同时学生提问的详细数据也可通过后台自动收集整理,进一步完善问答系统。两者的有利结合跳脱了传统教学时间、空间和教学资源上的限制,让学生在虚拟学习环境进行沉浸式的实时观察、交互、实验、答疑等操作成为了可能,这种情景化的学习过程在节约师资物源成本的基础上更深层次地提高学生的学术知识和思维技巧。综上所述,虽然智能问答在自然语言处理领域取得了一定程度的研究成果,但如何构建特定领域的中文标准问答数据集以训练模型仍然是目前智能问答研究普遍存在的短板,如何合理利用深度学习更深层次地从语义层面分析语句优化语义特征提取过程,如何结合现有技术开辟问答系统发展新方向等关键问题仍需要继续实践探索。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种应用独到、准确性高的基于智能问答的虚拟学习环境构建方法。为达到上述目的,本专利技术提供如下技术方案:一种基于智能问答的虚拟学习环境构建方法,包括以下步骤:S1:采集并构建特定领域教学问答数据集,对采集的问答对进行预处理;S2:构建双向长短时记忆条件随机场BI-LSTM-CRF模型对问答对进行语义分析和特征提取,实现语句的分词与序列标注;S3:构建基于长短时记忆LSTM网络的答案置信度计算模型,输入问答对特征向量,通过模型衡量问答对的匹配程度,将得分最高的答案特征向量转换输出;S4:利用基于Unity3D的虚拟现实技术搭建虚拟学习环境,构建智能问答引擎,引入训练好的深度学习问答模型,完成基于智能问答的虚拟学习环境构建。进一步,在步骤S1中,通过网络爬虫技术和人工收集途径获取问答数据,构建特定领域教学问答数据集。进一步,在步骤S1中,对问答对的预处理首先是对收集的问答对进行去重、去空操作以剔除乱码无回答的数据,最终获得标准问答数据,使用浅层神经网络Word2Vec计算句子的词序列条件概率,将其嵌入并对词向量模型进行训练与计算。进一步,在步骤S2中,对问答对进行语义分析和特征提取,包括以下步骤:S21:利用步骤S1得到的标准问答数据和词向量模型对BI-LSTM-CRF模型进行训练测试;S22:将向量化的问题文本序列X=(x1,x2,...,xn)输入到已训练好的网络模型,BILSTM综合前后词语的相关信息,CRF考虑输出标签之间的前后关系,经模型分词标注后,文本序列X对应的标注序列(又称特征序列)y=(y1,y2,...,yn)预测输出为:其中,A为状态转移矩阵,P为BILSTM网络的输出矩阵,Ai,j表示时序上从第i个状态转移到第j个状态的概率,Pi,j表示输入观察序列中第i个词为第j个标注的概率。进一步,在步骤S3中,通过基于LSTM网络的答案置信度计算模型对候选答案进行置信度排序,同时删除置信度较低的答案,选出最优回答;使用调和余弦相似度和欧几里德距离的置信度计算方法计算问题答案的匹配度,问题答案的置信度cosine和调和余弦相似度和欧几里德距离CosEuclid分别为:Scorecosine(VQ,VA)=0.5(VQ,VA)+0.5(3)其中,VQ和VA分别对应问题答案的文本向量序列,而Scorecosine(VQ,VA)=0.5(VQ,VA)+0.5是将余弦相似度归一化到[0,1]区间。进一步,在步骤S4中,根据特定的实际教学情况,利用虚拟现实技术在Unity3D平台上搭建虚拟的课堂或实验室学习环境;创建可进行人机交互的虚拟教师与学生,在虚拟学习环境中为不同角色配置相应的问答脚本程序及功能;在步骤S1-S3的基础之上,基于Unity3D平台,将构造好的模型通过构建的智能问答引擎与对应的特定虚拟教学环境对接,实现基于智能问答的虚拟学习环境构建。与现有技术相比,本专利技术的优点及有益效果如下:1.通过网站爬虫、文档检索和人工采集等多种方式构建特定教学领域中文问答数据集,相比传统的通用数据集,该数据集在实际应用中更具有实用价值。2.通过结合CRF和深度学习中的双向LSTM网络,实现了对问答语句更深层次的语义理解和特征提取,该模型有助于更好地理解语句含义并进行分词和序列标注,为答案输出准确率做了一定程度的贡献。3.提出将LSTM深度神经网络与CosEuclid相结合的答案置信度排序选择方法,该方法从语义层面解析问题答案之间的关系,并将问题和答案的参数进行共享。相比传统答案选择的关键词匹配模式,此方法不仅可弥补中文表达一词多义难以理解的短板,而且在灵活性、查询效率及查询的准确度方面效果更优良。4.提出将特定领域的中文智能问答系统与虚拟学习环境相结合,不仅精简了课堂教育的过程,使学生们能不约束地点与教师同学进行问答交流,而且学生不必完全依赖翻阅大量的课堂笔记就可得到重难点疑惑的及时解答。此方法拓宽了问答系统的应用领域与开发价值,一定程度丰富了虚拟学习环境的内容,增强了虚拟学习环境的实用价值,为更好地人机交互提供了思路。附图说明为了使本专利技术的目的、技术方案和有益效果更加清楚,本专利技术提供如下附图进行说明:图1为本专利技术提供的基于智能问答的虚拟学习环境构建方法系统框架图;图2为本专利技术提供的基于LSTM网络的答案选择模型框架图。具体实施方式下面将结合附图,对本发本文档来自技高网
...

【技术保护点】
1.一种基于智能问答的虚拟学习环境构建方法,其特征在于:包括以下步骤:S1:采集并构建特定领域教学问答数据集,对采集的问答对进行预处理;S2:构建双向长短时记忆条件随机场BI‑LSTM‑CRF模型对问答对进行语义分析和特征提取,实现语句的分词与序列标注;S3:构建基于长短时记忆LSTM网络的答案置信度计算模型,输入问答对特征向量,通过模型衡量问答对的匹配程度,将得分最高的答案特征向量转换输出;S4:利用基于Unity3D的虚拟现实技术搭建虚拟学习环境,构建智能问答引擎,引入训练好的深度学习问答模型,完成基于智能问答的虚拟学习环境构建。

【技术特征摘要】
1.一种基于智能问答的虚拟学习环境构建方法,其特征在于:包括以下步骤:S1:采集并构建特定领域教学问答数据集,对采集的问答对进行预处理;S2:构建双向长短时记忆条件随机场BI-LSTM-CRF模型对问答对进行语义分析和特征提取,实现语句的分词与序列标注;S3:构建基于长短时记忆LSTM网络的答案置信度计算模型,输入问答对特征向量,通过模型衡量问答对的匹配程度,将得分最高的答案特征向量转换输出;S4:利用基于Unity3D的虚拟现实技术搭建虚拟学习环境,构建智能问答引擎,引入训练好的深度学习问答模型,完成基于智能问答的虚拟学习环境构建。2.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S1中,通过网络爬虫技术和人工收集途径获取问答数据,构建所述特定领域教学问答数据集。3.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S1中,对所述问答对的预处理首先是对收集的问答对进行去重、去空操作以剔除乱码无回答的数据,最终获得标准问答数据,使用浅层神经网络Word2Vec计算句子的词序列条件概率,将其嵌入并对词向量模型进行训练与计算。4.根据权利要求1所述的一种基于智能问答的虚拟学习环境构建方法,其特征在于:在所述步骤S2中,对所述问答对进行语义分析和特征提取,包括以下步骤:S21:利用所述步骤S1得到的标准问答数据和词向量模型对BI-LSTM-CRF模型进行训练测试;S22:将向量化的问题文本序列X=(x1,x2,...,xn)输入到已训练好的网络模型,...

【专利技术属性】
技术研发人员:蔡林沁颜勋陈富丽虞继敏
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1