基于知识工程的大数据采集方法技术

技术编号:11584826 阅读:86 留言:0更新日期:2015-06-10 18:16
本发明专利技术公开了一种基于知识工程的大数据采集方法,包括:对知识工程中的数据进行分类;采集用户信息、用户输入的搜索关键字或浏览内容;对用户信息与部门信息进行关联;对搜索关键字或浏览内容与知识工程的分类进行匹配;对关搜索键字或浏览内容对应的分类进行聚类;根据聚类结果分别对分类数据进行统计,将数据与用户信息统一存储,形成大数据库;将用户信息关联的部门信息与大数据库建立关联,其适于知识工程的需求。

【技术实现步骤摘要】
【专利说明】
本专利技术涉及数据采集方法领域,具体地,涉及一种浊点萃取仪。
技术介绍
现有的很多研发型企业,在其多年的研发过程中,用到或存储积淀有很多的知识,不仅知识遍布各专业、各领域,知识的形态众多,且由于研发部门多,知识分布在众多的业务系统中。在知识工程中,需对知识进行存储,现有的知识存储系统,其有很多弊端。其缺乏对知识体系化、系统化的管理;缺乏对知识与业务的关联,仅仅是简单的知识的堆砌,不能满足研发人员多控件快捷创建知识的需要,且使用效率低、对研发人员的设计工作贡献低。为了提高知识工程中数据的利用率,采用对知识进行智能推送的方式,即将知识主动推送给研发人员。对知识的推送基于大数据原理,现有的大数据采集方法不适合知识工程的数据采集。
技术实现思路
本专利技术所要解决的技术问题是提供一种。本专利技术解决上述问题所采用的技术方案是: ,其特征在于,包括: 对知识工程中的数据进行分类; 采集用户信息、用户输入的搜索关键字或浏览内容; 对用户信息与部门信息进行关联; 对搜索关键字或浏览内容与知识工程的分类进行匹配; 对关搜索键字或浏览内容对应的分类进行聚类;根据聚类结果分别对分类数据进行统计,将数据与用户信息统一存储,形成大数据库; 将用户信息关联的部门信息与大数据库建立关联。在本专利技术的方法中,对知识数据进行分类,使用户信息与所述部门信息相关联,并对部门的成员的搜索、浏览信息进行采集,形成个人和部门的大数据,便于现有的知识过程的推送模块根据大数据对相关知识的推送,满足部门研发项目需求的同时也满足个人对知识的偏好的需求。作为优选,在采集用户的浏览内容时,对浏览内容的关键字进行提取。在对成员,即用户的浏览内容进行采集时,其数据量大,直接对浏览内容的关键字进行提取,便于与分类的匹配。作为优选,通过网页输入采集用户输入的搜索关键字。用户对内容进行检索,其通过网页搜索栏进行搜索,直接通过搜索栏键入的关键字即可对搜索关键字进行采集。作为优选,所述的关键字与知识工程的分类匹配采用近似匹配原则。作为优选,为了进一步的使该方法满足知识过程的需求,使得推送内容与项目业务相关联,所述的知识工程中的分类按项目类型进行分类。综上,本专利技术的有益效果是: 在本专利技术的方法中,对知识数据进行分类,使用户信息与所述部门信息相关联,并对部门的成员的搜索、浏览信息进行采集,形成个人和部门的大数据,便于现有的知识过程的推送模块根据大数据对相关知识的推送,满足部门研发项目需求的同时也满足个人对知识的偏好的需求。【具体实施方式】下面结合实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1: ,其特征在于,包括: 对知识工程中的数据进行分类; 采集用户信息、用户输入的搜索关键字或浏览内容; 对用户信息与部门信息进行关联; 对搜索关键字或浏览内容与知识工程的分类进行匹配; 对关搜索键字或浏览内容对应的分类进行聚类; 根据聚类结果分别对分类数据进行统计,将数据与用户信息统一存储,形成大数据库; 将用户信息关联的部门信息与大数据库建立关联。在本专利技术的方法中,对知识数据进行分类,使用户信息与所述部门信息相关联,并对部门的成员的搜索、浏览信息进行采集,形成个人和部门的大数据,便于现有的知识过程的推送模块根据大数据对相关知识的推送,满足部门研发项目需求的同时也满足个人对知识的偏好的需求。实施例2: 为了便于直接对浏览内容的关键字进行提取,便于与分类的匹配,本实施例在上述实施例的基础上做了优化,即在采集用户的浏览内容时,对浏览内容的关键字进行提取。实施例3: 本实施例在上述实施例的基础上做了细化,即通过网页输入采集用户输入的搜索关键字。所述的关键字与知识工程的分类匹配采用近似匹配原则。实施例4: 为了进一步的使该方法满足知识过程的需求,使得推送内容与项目业务相关联,本实施例在上述实施例的基础上做了优化,即所述的知识工程中的分类按项目类型进行分类。如上所述,可较好的实现本专利技术。【主权项】1.,其特征在于,包括: 对知识工程中的数据进行分类; 采集用户信息、用户输入的搜索关键字或浏览内容; 对用户信息与部门信息进行关联; 对搜索关键字或浏览内容与知识工程的分类进行匹配; 对关搜索键字或浏览内容对应的分类进行聚类; 根据聚类结果分别对分类数据进行统计,将数据与用户信息统一存储,形成大数据库; 将用户信息关联的部门信息与大数据库建立关联。2.根据权利要求1所述的,其特征在于:在采集用户的浏览内容时,对浏览内容的关键字进行提取。3.根据权利要求1所述的,其特征在于:通过网页输入采集用户输入的搜索关键字。4.根据权利要求1所述的,其特征在于:所述的关键字与知识工程的分类匹配采用近似匹配原则。5.根据权利要求1所述的,其特征在于:所述的知识工程中的分类按项目类型进行分类。【专利摘要】本专利技术公开了一种,包括:对知识工程中的数据进行分类;采集用户信息、用户输入的搜索关键字或浏览内容;对用户信息与部门信息进行关联;对搜索关键字或浏览内容与知识工程的分类进行匹配;对关搜索键字或浏览内容对应的分类进行聚类;根据聚类结果分别对分类数据进行统计,将数据与用户信息统一存储,形成大数据库;将用户信息关联的部门信息与大数据库建立关联,其适于知识工程的需求。【IPC分类】G06F17-30【公开号】CN104699859【申请号】CN201510163404【专利技术人】朱焰冰 【申请人】成都卡莱博尔信息技术有限公司【公开日】2015年6月10日【申请日】2015年4月9日本文档来自技高网...

【技术保护点】
基于知识工程的大数据采集方法,其特征在于,包括:对知识工程中的数据进行分类;采集用户信息、用户输入的搜索关键字或浏览内容;对用户信息与部门信息进行关联;对搜索关键字或浏览内容与知识工程的分类进行匹配;对关搜索键字或浏览内容对应的分类进行聚类;根据聚类结果分别对分类数据进行统计,将数据与用户信息统一存储,形成大数据库;将用户信息关联的部门信息与大数据库建立关联。

【技术特征摘要】

【专利技术属性】
技术研发人员:朱焰冰
申请(专利权)人:成都卡莱博尔信息技术有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1