基于问题求解过程的习题语义化方法技术

技术编号:9489957 阅读:105 留言:0更新日期:2013-12-25 23:43
本发明专利技术公开了一种基于问题求解过程的习题语义化方法,主要包括知识网络(知识点与知识点之间的关系、定理及其推导条件和结论之间的关系)的构建、题目与解题过程的语义化;该方法通过对习题的解题过程进行分析处理,提取解题步骤的推导条件、原因和结论,并语义化,使该习题的解题过程具有详尽的逻辑关系,进而被计算机所识别,便于资源的共享利用。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,主要包括知识网络(知识点与知识点之间的关系、定理及其推导条件和结论之间的关系)的构建、题目与解题过程的语义化;该方法通过对习题的解题过程进行分析处理,提取解题步骤的推导条件、原因和结论,并语义化,使该习题的解题过程具有详尽的逻辑关系,进而被计算机所识别,便于资源的共享利用。【专利说明】
本专利技术涉及一种。
技术介绍
随着信息技术的发展及教学改革的深化,习题语义化技术得到了广泛的应用,同时有关的理论、技术也得到了很大的发展。然而传统习题或题库系统缺少语义或智能性,计算机不能很好地理解;其次,题库的表现形式多种多样,题库资源难以共享。传统习题都是以文本格式进行存储,未考虑题目与解题过程的语义,以及习题之间的关系。习题涵盖了某个学科或课程的知识点或知识网络,而这些题目与解题过程的语义,以及习题之间的关系是进行问题求解时的重要参考和依据。
技术实现思路
本专利技术的目的在于针对于现有技术中存在的问题,提供一种,该方法针对习题的题目及问题求解过程,将所涉及领域的定理的推导条件、原因和结论提取出来,并将所涉及的知识点、知识点之间的关系提取出来,构建知识网络,再利用该知识网络对题目及解题过程进行语义化,变成计算机能识别的语言,有利于资源共享。为了达到上述专利技术目的,本专利技术采用的技术方案如下:提供一种,包括如下步骤:S1:确定一个领域,利用自然语言解析工具对该领域内的定理进行解析并对其进行语义化,形成描述领域知识的知识网络;S2:提取领域内的知识点及知识点之间的关系,将其添加到步骤SI中所建立的知识网络中;S3:输入题目文本信息,对题目中的已知条件和结论进行拆分,并对已知条件划分成段并编号,再利用自然语言解析工具对每个分段及结论进行解析并对其语义化;S4:输入解题过程文本信息,结合步骤S3中的已知条件信息对该解题过程的每一步进行编号,并利用步骤S2中构建的知识网络来构建或查找每个解题步骤的推导条件、结论和对应的定理信息即原因,再利用自然语言解析工具进行解析并对其语义化,从而完成问题求解过程的语义化。步骤SI中,利用自然语言解析工具根据推导条件在前、结论在后的结构对定理进行解析,提取该定理的推导条件和结论,并将推导条件、定理和结论构建成主谓宾结构,存储为RDF三元组,添加到知识网络中,形成该领域的知识网络。步骤S3包括以下步骤:S31:对题目中的已知条件和结论进行拆分;S32:再以标点符号为标志符,对题目的已知条件进行分段,并对其进行编号;S33:再将经步骤S32处理过的已知条件和步骤S31中的结论用自然语言解析工具解析成树,提取其主谓宾,存储为RDF三元组。步骤S4包括以下步骤:S41:对解题过程的每一步进行编号;如果当前步骤为已知条件,则编号为已知条件中对应的序号;如果当前步骤为新生成的结论,则对当前步骤进行自动编号,编号的序号从已知条件最大编号加I开始,直到对解题过程中的所有步骤编号完毕;S42,包括:A:对解题过程中新生成的结论即新步骤进行解析,得到该新步骤的推导条件、原因和结论;Al:如果该新步骤未标注原因,则推导条件为该步骤之前的一个原因或结论步骤对应的编号;再根据此步骤的推导条件和结论,在已构建好的知识网络中找到相应的定理,得到其原因;如果没有找到相应的定理,再继续添加该步骤之前的一个原因或结论步骤之前的原因或结论步骤对应的编号,直到找到相应的定理或推导条件全部添加完为止;A2:如果该新步骤已注明了原因,则对应的定理已知,根据结论和原因在已构建好的知识网络中找到相应的推导条件,且该推导条件为该新步骤之前的一个或多个原因或结论步骤对应的编号;B:再将推导条件、原因和结论构建成一个主谓宾结构,并存储为RDF三元组;其中,三元组主语为推导条件信息,谓语为原因信息,宾语为结论信息;C:将上述三元组信息进行抽象模型提取,并搜索知识网络中是否已存在该三元组,如果不存在,则把该三元组添加到知识网络中;D:重复步骤A到C,直至完成对解题过程中的每个新生成的结论的语义化,即完成问题求解过程的语义化。E:构建此题目及解题过程的XML文档。名词解释知识网络:是知识元之间相互关联形成的网络。如果把知识元看作节点,知识元之间的联系用一条边来表示。那么所有的知识以及它们之间的联系就构成了一个庞大复杂的网络,叫做知识网络。资源描述框架(ResourceDescription Framework, RDF)是由万维网联盟(W3C)制定发展的规范,它用于表达关于网络资源的元数据,表达简单的资源陈述,其中每个陈述都是由主语(subject)、谓语(predicate)和宾语(object)组成的,可标识资源与资源之间的关系,并可作为逻辑推论的基础资料模型。RDF提供了一种基本的结构,用于在Web上对元数据(meta-data)进行编码、交换和重用;RDF的基本句法是〈主语谓词宾语 > 三元组,主语为URI或匿名结点ID,宾语为UR1、匿名结点ID或文字(literal),谓词则是一 URI ;RDF图(RDF Graph)是由RDF三元组组成的集合,RDF的数据模型有三种表示法:作为三元组、作为图和用XML表示,这些表示都具有相同的含义,表示间的映射不会以任何方式约束实现中使用的内部表示。可扩展标记语言(extensible Markup Language, XML),是一种标记语言。标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等;如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性,XML是从标准通用标记语言(SGML)中简化修改出来的。它主要用到的有可扩展标记语言、可扩展样式语言(XSL)、XBRL和XPath等。所述自然语言解析工具为美国斯坦福大学研发的中文自然语言解析工具即Stanford Parser。综上所述,本专利技术具有以下有益效果:I)本专利技术通过对习题的解题过程进行分析处理,提取解题步骤的推导条件、原因和结论,并语义化,使该习题的解题过程具有详尽的逻辑关系,进而被计算机所识别,便于资源的共享利用。2)本专利技术构建的知识网络能很好地展现知识点与知识点之间的关系,可以通过不停的学习加以完善,有利于对知识的挖掘处理。3)本专利技术还对构建的三元组进行抽象模型提取,使得零散的知识得以关联和系统化,更符合认知心理学习的学习方式;另外,抽象模型的构建可以完成多种应用,如进行自动解题与证明。【专利附图】【附图说明】图1为本专利技术构建的知识网络关系图。图2为本专利技术题目语义化流程图。图3为本专利技术解题过程语义化流程图。图4为本专利技术-实施例中的例I的示意图。【具体实施方式】下面结合具体实施例对本专利技术的【具体实施方式】做详细地描述:如图1所示,知识网络的构建:首先确定一个领域,将领域内所涉及的定理用美国斯坦福大学研发的中文自然语言解析工具Stanford Parser进行解析,提取对应定理的推导条件和结论,并将推导条件、定理名称与结论构建成主谓宾,存储为RDF三元组,形成一个知识网络;再将习题所涉及的知识点、知识点之间的关系(此关系不需明确指出)提取出来,添加到上述知识网络中。如图2所示,本本文档来自技高网...

【技术保护点】
基于问题求解过程的习题语义化方法,其特征在于,包括如下步骤:S1:确定一个领域,利用自然语言解析工具对该领域内的定理进行解析并对其进行语义化,形成描述领域知识的知识网络;S2:提取领域内的知识点及知识点之间的关系,将其添加到步骤S1中所建立的知识网络中;S3:输入题目文本信息,对题目中的已知条件和结论进行拆分,并对已知条件划分成段并编号,再利用自然语言解析工具对每个分段及结论进行解析并对其语义化;S4:输入解题过程文本信息,结合步骤S3中的已知条件信息对该解题过程的每一步进行编号,并利用步骤S2中构建的知识网络来构建或查找每个解题步骤的推导条件、结论和对应的定理信息即原因,再利用自然语言解析工具进行解析并对其语义化,从而完成问题求解过程的语义化。

【技术特征摘要】

【专利技术属性】
技术研发人员:符红光钟秀琴王庆先
申请(专利权)人:成都景弘智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1