基于深度学习的大学计算机基础知识图谱构建方法技术

技术编号：24683979 阅读：105 留言：0更新日期：2020-06-27 08:07

本发明专利技术公开了一种基于深度学习方法的大学计算机基础知识图谱构建方法；采用BERT‑IDCNN‑CRF算法训练知识点实体识别模型，从大学计算机基础课本文本内容中自动抽取知识点实体；采用BERT‑BiLSTM‑CNN算法训练关系识别模型，自动抽取知识点实体之间的关系；基于word2vec生成知识点实体词向量，通过计算知识点实体之间的相似度进行实体消歧。大大减少了人工构建大学计算机基础知识图谱的工作量，省时省力。

The construction method of college computer basic knowledge map based on deep learning

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的大学计算机基础知识图谱构建方法
本专利技术属于人工智能领域的一个重要方向，具体涉及一种基于深度学习的大学计算机基础知识图谱构建方法。
技术介绍
伴随着信息技术发展的突飞猛进，人工智能技术已经延伸到各行各业，并与许多传统行业有效地结合到一起，其中“互联网+教育”的模式应用十分广泛。大学计算机基础对于当代大学生是一门非常重要的基础课，这门课程涵盖了关于计算机的多个方面，包含计算机的起源与发展、硬件组成、操作系统、计算机网络、算法与数据结构、常用的办公软件操作等内容。通过学习大学计算机基础这门课程，学生对计算机的历史，计算机的组成结构、工作方式，计算机网络的工作机制，程序的设计可以有一个科学清楚的认识。但是由于大学计算机基础知识面覆盖广，知识点较为繁杂，大部分学生难以系统地掌握所学知识点，对知识点的理解是孤立零散的，而效果好的学习应该对知识点的掌握是系统化的，结构清晰的。所以将大学计算机基础的知识点构建成知识图谱，利用知识图谱强大的语义处理能力和开放互联能力解决这个问题是十分有必要的。而人工构建知识图谱的工作量是十分巨大的，需要耗费大量的人力物力。本专利技术采用基于深度学习的方法训练模型，经过训练的模型可以自动抽取大学计算机基础课本文本内容中的实体以及实体之间的关系，减少了人工构建图谱的工作量。
技术实现思路
本专利技术的目的是提供一种基于深度学习方法的大学计算机基础知识图谱构建方法，解决了现有技术中存在的人工构建知识图谱工作量大，费时费力的问题。本专利技术一种基于深度学习...

【技术保护点】
1.一种基于深度学习方法的大学计算机基础知识图谱构建方法其特征在于，采用BERT-IDCNN-CRF算法训练知识点实体识别模型，从大学计算机基础课本文本内容中自动抽取知识点实体；采用BERT-BiLSTM-CNN算法训练关系识别模型，自动抽取知识点实体之间的关系；基于word2vec生成知识点实体词向量，通过计算知识点实体之间的相似度进行实体消歧。/n

【技术特征摘要】
1.一种基于深度学习方法的大学计算机基础知识图谱构建方法其特征在于，采用BERT-IDCNN-CRF算法训练知识点实体识别模型，从大学计算机基础课本文本内容中自动抽取知识点实体；采用BERT-BiLSTM-CNN算法训练关系识别模型，自动抽取知识点实体之间的关系；基于word2vec生成知识点实体词向量，通过计算知识点实体之间的相似度进行实体消歧。

2.根据权利要求1所述的一种基于深度学习方法的大学计算机基础知识图谱构建方法，其特征在于，所述知识图谱构建方法具体包括以下步骤：
步骤1，对知识点实体识别训练集的语料进行预处理，分离文本中的标点符号，将文本以句号划分以及词性标注；
步骤2，使用BERT-IDCNN-CRF算法进行训练生成知识点实体识别模型；
步骤3，对关系识别训练集的语料进行预处理，分离文本中的标点符号，将文本以句号划分以及词性标注；
步骤4，使用BERT-BiLSTM-CNN算法进行训练生成关系识别模型；
步骤5，对大学计算机基础课本文本内容进行预处理，分离文本中的标点符号以及将文本以句号划分；
步骤6，将步骤5预处理过的大学计算机基础课本内容输入步骤2生成的知识点实体识别模型中，抽取知识点实体；
步骤7，对步骤6获取到的知识点实体采用基于word2vec计算知识点实体相似度的方法对知识点实体表达的歧义进行消除；
步骤8，对大学计算机基础课本的各级目录通过人工筛选的方式获取知识面实体；
步骤9，将步骤6、步骤7提取的知识点实体、知识面实体储存到实体数据库；
步骤10，将步骤5预处理过的大学计算机基础课本内容输入步骤4生成的关系识别模型中，抽取知识点之间的关系；
步骤11，基于匹配算法提取知识面实体之间，知识面实体与知识点实体之间的关系；
步骤12，对步骤9、步骤10提取的关系信息，存入关系信息数据库；
步骤...

【专利技术属性】
技术研发人员：朱磊，刘尧林，黑新宏，吕泓瑾，冯林林，张晋源，王一川，姬文江，孟海宁，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人