基于知识图谱的数据处理方法技术

技术编号:20176863 阅读:60 留言:0更新日期:2019-01-23 00:25
本发明专利技术公开了一种基于知识图谱的数据处理方法,包括步骤:基于试题和教研知识、学校教学、教材、试题难易程度的排序构建知识图谱,得到知识库;设定搜索条件,根据搜索条件进行试题提取,其中,当搜索条件包含自然语言时、将搜索条件转化为包括知识点、搜索范围的结构化搜索指令,将所述搜索指令与所述知识图谱中的内容进行匹配,搜索出试题;对所述搜索出的试题进行相似度算法、排序算法、以及综合筛选算法,得到筛选结果;将筛选结果推送给用户。本发明专利技术通过建立试题化的知识图谱,在进行搜索时基于知识点进行搜索,简化了试题检索过程,提高了搜索试题的效率。

Data Processing Method Based on Knowledge Map

The invention discloses a data processing method based on knowledge atlas, which includes steps: building knowledge atlas based on the ranking of test questions and research knowledge, school teaching, textbooks and test questions to obtain knowledge base; setting search conditions and extracting test questions according to search conditions, in which, when search conditions include natural language, the search conditions are transformed into including knowledge points. The structured search instructions of the search scope match the search instructions with the contents of the knowledge map to search for the test questions; carry on the similarity algorithm, ranking algorithm and comprehensive screening algorithm to get the screening results; and push the screening results to the users. The invention simplifies the retrieval process of test questions and improves the efficiency of searching test questions by establishing the knowledge map of test questions and searching based on knowledge points in search.

【技术实现步骤摘要】
基于知识图谱的数据处理方法
本专利技术涉及信息搜索
,更具体地,涉及一种基于知识图谱的数据处理方法。
技术介绍
知识图谱(KnowledgeGraph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。为学科研究提供切实的、有价值的参考。现有技术,公开了一种基于知识图谱的人物关系的搜索方法和装置,在知识图谱中匹配人物关系的属性数据,查找相应地人物关系数据对,利用所述人物关系数据对,查找与所述人物的关系属性数据对应的关系属性赋值,并将所述关系属性赋值作为搜索结果提供给所述用户。现有技术还没有公开基于知识图谱查找试题的技术方案。
技术实现思路
有鉴于此,本专利技术提供了一种基于知识图谱的数据处理方法,包括步骤:基于试题和教本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的数据处理方法,其特征在于,包括步骤:基于试题和教研知识、学校教学、教材、试题难易程度的排序构建知识图谱,得到知识库,其中,所述教研知识包括试题标签、学科知识点、学校等级、地区特化知识树、教材章节、以及学科能力模型;设定搜索条件,根据搜索条件进行试题提取,其中,当搜索条件包含自然语言时、将搜索条件转化为包括知识点、搜索范围的结构化搜索指令,将所述搜索指令与所述知识图谱中的内容进行匹配,搜索出试题;对所述搜索出的试题进行相似度算法、排序算法、以及综合筛选算法,得到筛选结果;将筛选结果推送给用户。

【技术特征摘要】
1.一种基于知识图谱的数据处理方法,其特征在于,包括步骤:基于试题和教研知识、学校教学、教材、试题难易程度的排序构建知识图谱,得到知识库,其中,所述教研知识包括试题标签、学科知识点、学校等级、地区特化知识树、教材章节、以及学科能力模型;设定搜索条件,根据搜索条件进行试题提取,其中,当搜索条件包含自然语言时、将搜索条件转化为包括知识点、搜索范围的结构化搜索指令,将所述搜索指令与所述知识图谱中的内容进行匹配,搜索出试题;对所述搜索出的试题进行相似度算法、排序算法、以及综合筛选算法,得到筛选结果;将筛选结果推送给用户。2.根据权利要求1所述的基于知识图谱的数据处理方法,其特征在于,所述构建知识图谱,进一步包括步骤:模式设计:明确试题领域的基本属性、属性的适用概念、属性值的类别或者范围,其中,所述属性包括试题标签、知识点、学校标签、教材标签;数据来源:主要包括业务数据、教研知识数据、学科知识、第三方来源数据及网络爬取的结构化数据,还包括在教材、教辅、教学文章、教育网页上的非结构化数据,其中,所述业务数据包括试题数据、学校教师及学生用户信息数据、教师组卷数据、以及学生作答记录;教研知识数据为教育领域知识数据,包括试题标签、学科知识点、学校等级、地区特化知识树、教材章节、以及学科能力模型的数据;词汇挖掘:构建各学科的词典,挖掘与试题相关的词汇、同义词及缩略词;实体发现:基于试题文本、学科知识文本使用长短期记忆网络LSTM结合条件随机场CRF进行实体提取建模,提取各学科试题中的实体;关系发现:从试题文本、学科知识文本中抽取一个实体对的关系,使用DeepDive框架进行关系提取;知识融合:基于数据来源,完成实体对齐、属性融合、值规范化,包括步骤本体对齐和实体匹配;质量控制,通过勘误系统进行试题数据和教育领域知识提醒的补全、纠错和更新。3.根据权利要求2所述的基于知识图谱的数据处理方法,其特征在于,当数据来源为教师编辑的数据时模式设计使用自顶向下的知识建模方法;当数据为业务系统数据时模式设计使用自底向上的知识建模方法。4.根据...

【专利技术属性】
技术研发人员:李可佳郭春雪郭晨阳
申请(专利权)人:苏州友教习亦教育科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1