基于机器学习知识的分类装置制造方法及图纸

技术编号:21832801 阅读:38 留言:0更新日期:2019-08-10 18:03
本发明专利技术提供一种基于机器学习知识的分类装置,该装置包括:分类规则模块,用于采集用户的分类行为推导分类推理规则;获取模块,用于获取待分类的知识;提取模块,用于根据分词法提取知识内容中的关键字词,其中,关键字词包含关键字与词组;计算处理模块,用于计算关键字词出现的频率与位置;检测输出模块,用于检测满足预设频率与预设位置的关键字词,输出关键字词作为分类结果。采用分词法提取知识内容中的关键字词,根据用户的分类行为建立最近邻居集合,结合关键字词加权、变换、混合、特征、元级别进行综合分析,得到最优组合的关键字词,既提高了知识的标签分类的精准度,又提高了检索准确率,便于信息推荐以及过滤信息。

Classification Device Based on Machine Learning Knowledge

【技术实现步骤摘要】
基于机器学习知识的分类装置
本专利技术涉及人工智能
,特别是涉及一种基于机器学习知识的分类装置。
技术介绍
将知识按预先指定的类别归类的技术可以追溯到上世纪60年代。不过,在最近的10年里,由于文本知识数字化而带来的海量数据,导致我们不得不将这些知识进行分类。由此,知识的自动分类得到了广泛的关注和快速的发展。目前,为了解决知识分类主要有以下两种方法:一种,是基于知识工程的方法,通过专业人员,为每个类别定义大量的推理规则,如果知识能满足这些推理规则,则可以判定属于该类别;另一种,是基于知识库的知识分类,即首先根据知识内容建立关键字和类目号的对应关系,形成主题词、类目号、隶属度3元组所构成的知识库,然后根据待分类知识给出的主题词,累加主题词所在类目的隶属度,隶属度总值最高的即为该知识所在的类目。上述现有做法虽然可以在一定程度上解决知识分类的问题,但这两种方法都存在明显缺陷:(1)分类的质量依赖于专业人员指定的规则;(2)不具备可推广性,不同的领域需要构建不同的分类系统;(3)待分类知识给出的主题词中,只有小部分对分类具有积极的意义,有必要对待分类给出的关键词去重、加权。
技术实现思路
本文档来自技高网
...

【技术保护点】
1.一种基于机器学习知识的分类装置,其特征在于,所述装置包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行指令,所述一个或多个处理器执行的指令包括以下程序模块:分类规则模块,用于采集用户的分类行为推导分类推理规则;获取模块,用于获取待分类的知识;提取模块,用于根据分词法提取所述知识内容中的关键字词,其中,所述关键字词包含关键字与词组;计算处理模块,用于计算所述关键字词出现的频率与位置;检测输出模块,用于检测满足预设频率与预设位置的关键字词,输出所述关键字词作为分类结果。

【技术特征摘要】
1.一种基于机器学习知识的分类装置,其特征在于,所述装置包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行指令,所述一个或多个处理器执行的指令包括以下程序模块:分类规则模块,用于采集用户的分类行为推导分类推理规则;获取模块,用于获取待分类的知识;提取模块,用于根据分词法提取所述知识内容中的关键字词,其中,所述关键字词包含关键字与词组;计算处理模块,用于计算所述关键字词出现的频率与位置;检测输出模块,用于检测满足预设频率与预设位置的关键字词,输出所述关键字词作为分类结果。2.根据权利要求1所述的基于机器学习知识的分类装置,其特征在于,所分类规则模块包括:数据采集单元,用于在知识管理平台采集大量用户知识分类行为数据;字词提取单元,用于提取所述数据中知识的关键字词;计算所述关键字词出现频率确定其与分类行为关系;分类规则单元,用于根据所述数据中各类知识的关键字词与分类行为关系的权重,构建加权因子、变换、混合规则,得到知识分类推理规则。3.根据权利要求1所述的基于机器学习知识的分类装置,其特征在于,所述提取模块包括...

【专利技术属性】
技术研发人员:冉露吴晟昊吕宏轮刘旭赵瑞娜余黎阳
申请(专利权)人:重庆南华中天信息技术有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1