当前位置: 首页 > 专利查询>扬州大学专利>正文

一种面向新工科的教育知识图谱问答系统构建方法技术方案

技术编号:32490243 阅读:25 留言:0更新日期:2022-03-02 09:56
本发明专利技术公开了一种面向新工科的教育知识图谱问答系统构建方法,包括以下步骤:1)上传细分学科数据,使用OCR进行文字识别,将关键信息存入数据表,实现异构数据的知识图谱构建;2)知识补全,进行实体识别与分词和三元组抽取,对问题语义进行分析;3)答案搜索,对问题进行分类,再进行模板匹配以确定输出结果。本发明专利技术能够利用实体识别三元组抽取等方法,实现对问题内容的精准识别,达到对问题精确有效回答的目的。的目的。的目的。

【技术实现步骤摘要】
一种面向新工科的教育知识图谱问答系统构建方法


[0001]本专利技术涉及知识图谱以及问答系统领域,特别涉及一种面向新工科的教育知识图谱问答系统构建方法。

技术介绍

[0002]OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
[0003]信息技术的发展不断推动着互联网技术的变革,Web技术作为互联网时代的标志性技术,正处于这场技术变革的核心。从网页的链接到数据的链接,Web技术正朝着语义网络演变。目前, 同一领域知识分散存储在不同地点, 且以不同的数据类型进行存储, 导致该领域用户获取领域知识困难, 且很难实现共享,因此需要构建一个知识图谱将其结构化。由于领域内用户的数量十分庞大, 而遇到的问题大部分都是重复的,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向新工科的教育知识图谱问答系统构建方法,其特征在于,包括以下步骤:步骤1)上传细分学科数据,使用OCR进行文字识别,将关键信息存入数据表,实现异构数据的知识图谱构建;步骤2)知识补全,进行实体识别与分词和三元组抽取,对问题语义进行分析;步骤3)答案搜索,对问题进行分类,再进行模板匹配以确定输出结果。2.根据权利要求1所述的一种面向新工科的教育知识图谱问答系统构建方法,其特征在于,所述步骤1)具体包括:步骤1.1)将新工科细分专业的所有课程,教学大纲以及各项所需数据作为文本上传,对文本数据进行实体抽取与属性抽取,得到一系列离散的命名实体和其属性值,从结果中提取实体之间的关联信息,将实体之间联系起来,形成网状知识结构;步骤 1.2)对无法进行文本上传的数据,使用OCR进行文字识别后建立图片与文字的关系映射;步骤 1.3)将学生数据与教学数据关联到已有的数据表中,导入图数据库Neo4j,完成异构数据的知识图谱构建。3.根据权利要求2所述的一种面向新工科的教育知识图谱问答系统构建方法,其特征在于,所述步骤2)具体包括:步骤2.1)首先将用户输入信息运用结巴分词工具进行分词,在分词后,对每个分出的词汇与图谱中节点的词汇进行匹配,如果相同则将该实体与节点划等号,并将实体识别结果放入相应模式层;步骤2.2)如果分词结果与图谱中节点的词汇不匹配,则通过条件随机场对标签进行约束, 运用双向长短期记忆网络算法与...

【专利技术属性】
技术研发人员:章永龙金雨扬朱毅陈家合王志孙小兵
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1