一种基于朴素贝叶斯算法的资源管理方法和系统技术方案

技术编号:26690593 阅读:53 留言:0更新日期:2020-12-12 02:41
本申请实施例公开了一种基于朴素贝叶斯算法的资源管理方法和系统,通过接收需要分类管理的目标文档;对目标文档进行特征选择;根据目标文档特征进行概率统计;从目标文档集中选出设定特征的作为训练集;对训练集相应本体元知识做初步分类,得到特征值;将特征值输入朴素贝叶斯模型以分类。通过对基于贝叶斯分类的改进,不仅理论上易于建立和更新,而且分类的精确率也得到了提高。

【技术实现步骤摘要】
一种基于朴素贝叶斯算法的资源管理方法和系统
本申请实施例涉及计算机
,具体涉及一种基于朴素贝叶斯算法的资源管理方法和系统。
技术介绍
资源管理中最基本的两项工作就是分类和聚类,几乎在所有资源管理的应用领域都离不开资源的分类和聚类。资源分类是资源管理的一个重要内容,是指按照预先定义的主题类别,为文档集合中的每个文档确定一个类别。通过自动资源系统把文档进行归类,可以帮助人们更好地寻找需要的信息和知识。随着资源信息的快速增长,特别是网络上在线资源信息的激增,资源自动分类已经成为处理和组织大量文档数据的关键技术。与此同时,人们对于内容搜索的准确率、查全率等方面的要求会越来越高,因而对资源分类技术需求大为增加,如何构造一个有效的资源分类系统仍然是资源管理的一个主要研究方向。近年来,国内外研究人员对资源分类问题进行深入研究,采用很多不同方法来构造分类器。在资源分类系统中,资源被表示成一个资源特征向量,资源特征用词来表示,即资源表示采BOW模型。目前,大多数资源分类系统都是使用这种资源特征表示方法等。本文主要是以改进的朴素贝叶斯方法来实现资源分本文档来自技高网...

【技术保护点】
1.一种基于朴素贝叶斯算法的资源管理方法,其特征在于,所述方法包括:/n接收需要分类管理的目标文档;/n对目标文档进行特征选择;/n根据目标文档特征进行概率统计;/n从目标文档集中选出设定特征的作为训练集;/n对训练集相应本体元知识做初步分类,得到特征值;/n将特征值输入朴素贝叶斯模型以分类。/n

【技术特征摘要】
1.一种基于朴素贝叶斯算法的资源管理方法,其特征在于,所述方法包括:
接收需要分类管理的目标文档;
对目标文档进行特征选择;
根据目标文档特征进行概率统计;
从目标文档集中选出设定特征的作为训练集;
对训练集相应本体元知识做初步分类,得到特征值;
将特征值输入朴素贝叶斯模型以分类。


2.如权利要求1所述的方法,其特征在于,所述对目标文档进行特征选择,包括:
在目标文档中,按照如下公式对所有与类别c相关的词汇t按x2值进行排序:



其中,t为词汇,c为资源分类,N为训练资源总数,A为在所有属于c类的训练资源中t出现的次数,B为在所有不属于c类的训练文档中t出现的次数,C为所有属于c类且没有t出现的训练文档数,D为所有不属于c类且没有t出现的训练文档数。


3.如权利要求1所述的方法,其特征在于,所述根据目标文档特征进行概率统计,包括:
根据目标文档d按照概率值排序的前N个类别作为目标文档d的分类。


4.如权利要求1所述的方法,其特征在于,从目标文档集中选出设定特征的作为训练集,包括:
按文档资源所在网站的分类作为人工分类结果,除去作为训练种子的文件,其余的用于作为训练集。


5.一种基于朴素贝叶斯算法的资源管理系统,其特征在于,所述系统包括:
接收模块,用于接收需要分类管理的目标文档;
特征选择模块,用于对目标文档进行特征选择;
概率统计模块,用于根据目标文档特征进行概率统计;

【专利技术属性】
技术研发人员:吴潇王泽赵亮汤俊凯宋东力
申请(专利权)人:国家计算机网络与信息安全管理中心长安通信科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1