【技术实现步骤摘要】
一种多标签融合的主题库建设方法
本专利技术涉及数据处理
,具体的说是一种多标签融合的主题库建设方法。
技术介绍
为了便于运营监测分析业务的开展,研发人员计划根据电力公司的运营目标、业务职能以及业务能力,并基于可参考的流程层级建设理论,对电力公司运营监测主题库的架构进行详细设计,形成从公司运营目标到业务职能、业务能力、业务环节、指标/核心数据等五层级的关联网,为电力公司运营监测主题库的架构设计提供参考依据。但是,由于现在数据量大、数据结构并不是那么统一和整齐,尚无法对据的筛选、统一和对整体数据进行细分。
技术实现思路
本专利技术针对现有数据仓库常规建设思路下,结合当下数据量大、数据结构复杂的特点,提供一种多标签融合的主题库建设方法,旨在针对各种类型的数据,进行数据标签规则的配置和查询导出,筛选出跟实际业务更贴合的细分数据。本专利技术的一种多标签融合的主题库建设方法,解决上述技术问题采用的技术方案如下:一种多标签融合的主题库建设方法,该方法基于标签规则配置组件、搜索筛选组件、主题库导出组
【技术保护点】
1.一种多标签融合的主题库建设方法,其特征在于,该方法基于标签规则配置组件、搜索筛选组件、主题库导出组件,其过程包括:/n首先,所述标签规则配置组件,一方面将数据按照一定的逻辑配置相应的规则,并给符合规则的数据打上相应的标签,另一方面,对数据配置规则这一过程进行执行和管控;/n其次,所述搜索筛选组件对打过标签的数据进行查询和筛选,得到符合要求数据结果;/n最后,所述主题库导出组件从所述搜索筛选组件得到的数据结果中进行选择,并将选中数据结果导出,随后存储于主题库。/n
【技术特征摘要】 【专利技术属性】
1.一种多标签融合的主题库建设方法,其特征在于,该方法基于标签规则配置组件、搜索筛选组件、主题库导出组件,其过程包括:
首先,所述标签规则配置组件,一方面将数据按照一定的逻辑配置相应的规则,并给符合规则的数据打上相应的标签,另一方面,对数据配置规则这一过程进行执行和管控;
其次,所述搜索筛选组件对打过标签的数据进行查询和筛选,得到符合要求数据结果;
最后,所述主题库导出组件从所述搜索筛选组件得到的数据结果中进行选择,并将选中数据结果导出,随后存储于主题库。
2.根据权利要求1所述的一种多标签融合的主题库建设方法,其特征在于,一条数据包含多个值,所述标签规则配置组件按照配置的规则将任一条数据的第N个值定义为指标,其中,N表示任一自然数,随后把所有数据中定义为指标的第N个值的聚合值定义为变量,最后根据指标和变量的关系确定相应的标签。
3.根据权利要求2所述的一种多标签融合的主题库建设方法,其特征在于,一条数据多个值根据配置的规则进行定义后,可以确定至少一个标签,且一条数据确定的标签数小于该条数据所包含的值数。
4.根据权利要求3所述的一种多标签融合的主题库建设方法,其特征在于,所述搜索筛选组件可以选择至少一个标签作为关键词对所有数据进行查询和筛选,所述主题库导出组件将根据不同关键词数量筛选得到的数据结果存储于不同的主题库单元,多个主题库单元同属于一个主题库。
5.根据权利要求4所述的一种多标签融合的主题库建设方法,其特征在于,所述主题库的名称可以依据数据的描述人群和关键词进行命名。
技术研发人员:杨勤,宋设,祖佳征,
申请(专利权)人:浪潮卓数大数据产业发展有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。