System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于智能教育领域,具体涉及一种基于内部资源和外部资源的教材智能解析系统及平台。
技术介绍
1、当前,纸质版教材相对于其他类型的教材在教育领域仍然占大多数,然而纸质版教材存在难以检索和拓展的问题。随着手机电脑等设备的普及,电子阅读逐渐成为人们学习生活中的重要阅读方式,其中教材的数字化也开始受到人们的重视,逐渐成为当前的研究热点,市面上也出现了越来越多的数字教材。
2、目前数字教材的主要形态包括静态媒体数字教材、多媒体数字教材和富媒体数字教材。静态媒体数字教材强调对纸质教材的数字化还原,仅将纸质版教材以数字化的形式存储于电子设备中,易于简单检索但缺少交互性。多媒体数字教材以网页的形式组织相关资源,或直接在数字教材中插入多媒体资源,能够有效整合和呈现各类资源,但这些资源之间缺少关联,学习者仍然是被动的接受资源信息。富媒体数字教材更加注重用户体验,在多媒体数字教材的基础上提供了更加丰富的用户交互,让学习者从被动接受转化为主动学习,但构建富媒体数字教材成本较高,且教材资源缺乏体系化知识引导。
3、当前数字教材平台对纸质教材做了数字化管理和展示,但对于教材中资源的利用率不高,尚未形成资源背后知识体系与能力体系,无法进行全视角跨学科的智慧学习引导。该问题主要体现在如下几点:第一,教材中的教育资源呈现出碎片形态、分散各处,各类资源孤立存在,资源之间缺少关联;第二,教材中的资源来源封闭,只包含了教材本身所拥有的内部资源,没有考虑到外部互联网中存在着的大量高质量资源;第三,教材中资源缺乏体系化的知识牵引,资源本质上
技术实现思路
1、本专利技术是为了解决上述问题而进行的,目的在于提供一种基于内部资源和外部资源的教材智能解析系统及平台。
2、本专利技术提供了一种基于内部资源和外部资源的教材智能解析系统,用于根据数字教材、外部互联网的开放数据和基于开放数据的类型标签构建得到教材知识图谱,具有这样的特征,包括:教材预处理模块、教材结构解析模块、内部资源链接模块、外部资源链接模块和教材知识图谱模块,其中,教材预处理模块,包括教材源文件转化子模块、教材页面编排子模块和教材文字识别子模块,教材源文件转化子模块,用于将不同文件形式的数字教材转化为可供搜索的统一格式的数字教材,作为统一格式教材,教材页面编排子模块,用于对统一格式教材的页面进行统一编排,得到格式化教材,教材文字识别子模块,用于通过ocr文字识别将格式化教材的内容进行识别,得到内容中的纯文本内容,作为教材解析文本,教材结构解析模块,包括术语挖掘子模块、关键关系与属性抽取子模块和内部要素挖掘子模块,术语挖掘子模块,用于对教材解析文本进行挖掘,得到教材解析文本中的多个术语作为领域术语,关键关系与属性抽取子模块,用于通过阅读理解方法从教材解析文本中抽取词语作为两个领域术语之间的关系或领域术语的属性,由领域术语与对应的关系构成关系三元组,由两个领域术语与对应的属性构成属性三元组,内部要素挖掘子模块,用于通过文档版面分析工具将格式化教材的内容划分为不同区域,并将不同区域分为仅包含文本内容的文本类资源和包含其他内容的复杂结构数据,内部资源链接模块,用于根据文本类资源在格式化教材中的位置信息,对文本类资源进行ocr文字识别处理,将文本类资源链接到相关的领域术语,作为文本类资源三元组,根据复杂结构数据在格式化教材中的位置信息,将复杂结构数据链接到相关的领域术语,作为复杂结构数据三元组,外部资源链接模块,包括术语和资源类型匹配子模块、外部资源发现子模块和外部资源挂载子模块,术语和资源类型匹配子模块,用于根据类型标签对领域术语进行分类,将各个领域术语匹配对应的类型标签,外部资源发现子模块,用于根据领域术语对应的类型标签,通过搜索引擎检索开放数据,得到与领域术语和类型标签相关的开放数据,作为相关开放数据,外部资源挂载子模块,用于对相关开放数据进一步过滤和筛选,将过滤筛选后的相关开放数据链接到领域术语,作为开放数据三元组,教材知识图谱模块,用于根据关系三元组、属性三元组、文本类资源三元组、复杂结构数据三元组和开放数据三元组构建得到教材知识图谱。
3、在本专利技术提供的基于内部资源和外部资源的教材智能解析系统中,还可以具有这样的特征:其中,在教材文字识别子模块中,教材解析文本为带有位置信息的txt格式文件。
4、在本专利技术提供的基于内部资源和外部资源的教材智能解析系统中,还可以具有这样的特征:其中,在内部资源链接模块中,文本类资源链接到相关的领域术语的具体过程为:将文本类资源进行ocr文字识别处理,根据ocr文字识别处理结果和位置信息,对不同区域的文本类资源进行融合,对融合结果进行文本理解和分类,得到对应的领域术语,将融合结果对应的文本类资源链接到领域术语。
5、在本专利技术提供的基于内部资源和外部资源的教材智能解析系统中,还可以具有这样的特征:其中,在内部资源链接模块中,复杂结构数据链接到相关的领域术语的具体过程为:根据复杂结构数据的位置信息,得到复杂结构数据的标题和上下文信息,将标题与领域术语进行匹配,若匹配成功,则复杂结构术语链接到匹配到的领域术语,若匹配失败,则统计上下文信息中术语词汇的出现频率,将复杂结构术语链接到出现频率最高的术语词汇对应的领域术语。
6、在本专利技术提供的基于内部资源和外部资源的教材智能解析系统中,还可以具有这样的特征:其中,在外部资源挂载子模块中,过滤和筛选相关开放数据的具体过程为:通过多模态表示和对齐算法将不同模态的相关开放数据进行统一表示,根据双塔排序算法将相关开放数据进行过滤并按照质量从高到低排序,选取序列前n个相关开放数据作为过滤筛选后的相关开放数据。
7、本专利技术还提供一种数智教材平台,包括:前端子模块、后端子模块和数据库,其中,前端子模块,用于在线利用阅读器展示数字教材,根据数字教材中被选中的术语向后端子模块发送信息读取请求,展示后端子模块反馈的术语的相关信息,后端子模块,用于根据信息读取请求,从数据库读取教材知识图谱中对应术语的领域术语的相关信息,并反馈给前端子模块,数据库,用于储存教材知识图谱的数据,教材知识图谱为通过将数字教材输入如上任意一项的基于内部资源和外部资源的教材智能解析系统构建得到。
8、在本专利技术提供的数智教材平台中,还可以具有这样的特征:其中,阅读器为pdf阅读器。
9、专利技术的作用与效果
10、根据本专利技术所涉及的基于内部资源和外部资源的教材智能解析系统及平台,因为,一方面,通过内部资源链接模块挖掘数字教材中的重要资源和碎片化资源并加以关联,另一方面,通过外部资源链接模块从外部资源中筛选优质资源与对应数字教材相关联,从而将多源多模态资源与学科知识深度关联融合,进而扩展了数字教材的知识容量。所以,本专利技术的基于内部资源和外部资源的教材智能解析系统及平台能够构建高质量内外部资源的教材知识图谱并向平台用户提供更丰富的数字教材相关信息。
本文档来自技高网...【技术保护点】
1.一种基于内部资源和外部资源的教材智能解析系统,用于根据数字教材、外部互联网的开放数据和基于所述开放数据的类型标签构建得到教材知识图谱,其特征在于,包括:
2.根据权利要求1所述的基于内部资源和外部资源的教材智能解析系统,其特征在于:
3.根据权利要求1所述的基于内部资源和外部资源的教材智能解析系统,其特征在于:
4.根据权利要求1所述的基于内部资源和外部资源的教材智能解析系统,其特征在于:
5.根据权利要求1所述的基于内部资源和外部资源的教材智能解析系统,其特征在于:
6.一种数智教材平台,其特征在于,包括:
7.根据权利要求6所述的数智教材平台,其特征在于:
【技术特征摘要】
1.一种基于内部资源和外部资源的教材智能解析系统,用于根据数字教材、外部互联网的开放数据和基于所述开放数据的类型标签构建得到教材知识图谱,其特征在于,包括:
2.根据权利要求1所述的基于内部资源和外部资源的教材智能解析系统,其特征在于:
3.根据权利要求1所述的基于内部资源和外部资源的教材智能解析...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。