The invention discloses a method for constructing knowledge atlas oriented to subject educational resources, which comprises the following steps: (1) extracting entity and relation information from subject educational resources; (2) cleaning and integrating information, eliminating redundant and wrong information, so as to ensure the quality of information; (3) classifying and language information. Meaning association forms the knowledge representation of the triple-tuple of \entity-relation-entity\ and constructs the knowledge atlas of subject resources with visual tools; (4) Further mining the hidden knowledge through knowledge reasoning, and updating the knowledge atlas by evolution, thus enriching and expanding the knowledge base. This method proposes to construct the knowledge map of subject resources, to realize the continuity and consistency of the content of subject resources, to provide systematic and systematic knowledge map for learners, and to promote the practical application of knowledge map technology in the fields of educational resource management, information retrieval, knowledge recommendation, etc.
【技术实现步骤摘要】
一种面向学科教育资源的知识图谱构建方法
本专利技术涉及中文知识库应用技术,尤其涉及一种面向学科教育资源的知识图谱构建方法。
技术介绍
随着信息技术的快速发展,互联网中的各类学科学习资源愈来愈丰富,在一定程度下解决了大规模用户同时在线学习、获取教学服务、共享教育资源的问题,在提供规模化群体服务的同时也为个性化学习创造了条件。但是在现有的学科学习资源系统中只有简单的资源存储和检索功能,无法为网上海量、异构、动态的教学资源表达、组织、管理以及利用提供了一种更为有效的方式,如何使得资源之间的联系程度更高,更加接近于人类的认知思维,解决学习者“知识迷航”的问题,需要我们寻找合适的方法。幸运地是,中文知识图谱为这一问题的解决提供了合适的方法,这也是本专利技术专利的主要目的和手段。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种面向学科教育资源的知识图谱构建方法。本专利技术解决其技术问题所采用的技术方案是:一种面向学科教育资源的知识图谱构建方法,包括以下步骤:1)学科资源信息抽取:从经过数字化处理、能在多媒体计算机及网络环境下运行的多媒体教学材料中抽取学 ...
【技术保护点】
1.一种面向学科教育资源的知识图谱构建方法,其特征在于,包括以下步骤:1)学科资源信息抽取:从经过数字化处理、能在多媒体计算机及网络环境下运行的多媒体教学材料中抽取学科领域词汇和关系,具体如下:1.1)基于语言学规则的方法对学科资源中的文本信息进行分词和词性标注;1.2)使用TF‑IDF统计学基准比较分析词汇分布特征,计算词汇在资源中的相对重要程度;1.3)对学科资源中的文本信息中的学科领域词汇进行抽取;2)词汇和关系信息的清理整合:对步骤1)中抽取的信息在同一框架规范下进行数据处理操作,形成高质量的知识库;具体步骤如下:2.1)输入抽取的词汇和关系的详细信息,包括数据名称 ...
【技术特征摘要】
2017.05.12 CN 20171033615601.一种面向学科教育资源的知识图谱构建方法,其特征在于,包括以下步骤:1)学科资源信息抽取:从经过数字化处理、能在多媒体计算机及网络环境下运行的多媒体教学材料中抽取学科领域词汇和关系,具体如下:1.1)基于语言学规则的方法对学科资源中的文本信息进行分词和词性标注;1.2)使用TF-IDF统计学基准比较分析词汇分布特征,计算词汇在资源中的相对重要程度;1.3)对学科资源中的文本信息中的学科领域词汇进行抽取;2)词汇和关系信息的清理整合:对步骤1)中抽取的信息在同一框架规范下进行数据处理操作,形成高质量的知识库;具体步骤如下:2.1)输入抽取的词汇和关系的详细信息,包括数据名称、地址和对应的资源,并且给每个预设定的质量维度分配一个权重;2.2)利用专家系统得到实体信息的重要程度,并结合质量维度的权重计算实体信息相应的分值;2.3)统计所有实体信息对应的权重和分值,得到实体数据的得分,然后过滤得分后50%的实体信息;3)根据知识库构建学科资源图谱,构建的具体步骤如下:3.1)在步骤2)高质量知识库的基础上,对这些知识进行语义关联,形成“实体-关系-实体”三元组的知识表现形式;3.2)将知识库中的每个三元组(h,r,t)的头实体和尾实体向关系空间中投影,让其满足头实体h加对应关系r等于尾实体t(h+r≈t)的条件,据此思路构建一个实体表征模型的损失函数:其中,d(h+r,t)是一个距离函数用于度量h+r与t之间的距离,S为知识库中的三元组,S’是负采样的三元组,[x]+表示正值函数;通过使损失函数值趋近于最小值优化上述目标函数即可得到关于知识的特征表达;4)知识图谱进化更新,具体步骤如下:4.1)对知识图谱本体中的元素进行更新,包括概念的增加、修改和删除,以及概念属性的更新;4.2...
【专利技术属性】
技术研发人员:刘海,杨宗凯,刘三女牙,张昭理,舒江波,李志飞,刘婷婷,
申请(专利权)人:华中师范大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。