计算领域知识点的相关知识点的方法及系统技术方案

技术编号：13113186 阅读：61 留言：0更新日期：2016-04-01 09:06

本发明专利技术提供一种计算领域知识点的相关知识点的方法，首先获取领域知识点，再从参考文本中分词得到所有知识点，这些知识点中包含了领域知识点和其他知识点，然后依次为分词结果中的每个知识点建立索引，再根据所述每个知识点的索引和顺序，通过神经网络模型训练的方式，得到领域知识点的语义向量，从而将知识点的语义信息进行量化，通过数字化的方式来体现其语义特征，这样，在后续对知识点进行分析时，可以更加方便。然后，根据各个领域知识点的语义向量，确定领域知识点之间的相似度，然后根据该相似度的大小便能轻易的区分哪些是相关的知识点，根据需要选择相关知识点的个数。该方式计算简单方便，准确性高，适用于推荐、检索等方面。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种电数据加工处理领域，具体地说一种计算领域知识点的相关知识点的方法。
技术介绍
数字出版资源已成为信息提供的主要方式之一。人们已从纸质阅读大量地转向电子阅读。数字出版资源包含电子图书、数字百科全书、数字期刊、数字报刊等。数字出版资源提供的信息通常比互联网更加权威和正确。因此，如何根据数字出版资源的特点提高人们学习或阅读体验变得尤为重要。在技术增强学习（Technology Enhanced Learning)中，开发推荐系统越来越得到更多的重视。但是，大部分的推荐系统使用用户的偏好或用户的历史访问数据进行计算，女口中国专利文献CN101661483A中公开了一种推荐系统及方法，包括：保存从源历史数据集中选择的部分源历史数据组成的样本历史数据集；建立样本历史数据集中的样本历史数据与源历史数据集中的源历史数据之间的链接，每一个样本历史数据与每一个源历史数据之间的链接具有各自的第一权值；基于用户当前输入的查询信息，从样本历史数据集中选择至少一个样本历史数据组成第一推荐结果，第一推荐结果中的每个样本历史数据对于用户当前输入的查询信息具有各自的第二权值；根据第一权值和第二权值从源历史数据中选择至少一个源历史数据组成第二推荐结果。该方案基于用户的历史访问数据进行推荐，当数字资源刚刚上线，没有阅读历史，不存在历史访问数据时，则无法完成上述推荐。现有的数字资源中，存在一些汇集了多种知识信息的数据知识资源，如百科全书，百科全书是一种数字出版资源，通常领域百科全书包含了该领域内的重要知识点。此外，像百度百科、维...

【技术保护点】
一种计算领域知识点的相关知识点的方法，其特征在于，包括获取领域知识点；确定参考文本，根据所述领域知识点对所述参考文本进行分词，得到分词结果，将所述分词结果中的词作为知识点，所述知识点包括所述领域知识点和其他知识点；依次为分词结果中的每个知识点建立索引；根据所述知识点的索引和所述知识点在参考文本中出现的顺序确定每个领域知识点的语义向量；对于每个领域知识点，根据其语义向量确定该领域知识点与其他领域知识点的相似度；根据所述相似度确定每个领域知识点的相关知识点。

【技术特征摘要】

【专利技术属性】
技术研发人员：叶茂，汤帜，徐剑波，马佳乐，杨亮，
申请(专利权)人：北大方正集团有限公司，北京方正阿帕比技术有限公司，北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人