一种用户监察标签分类的方法和装置制造方法及图纸

技术编号:29491190 阅读:11 留言:0更新日期:2021-07-30 19:03
本发明专利技术公开了用户监察标签分类的方法和装置,涉及计算机技术领域。该方法的具体实施方式包括:构建用户监察标签体系;对所述用户监察标签体系进行标签分类并根据所述标签分类生成模型规则;基于所述模型规则以可视化展示所述用户监察标签体系。该实施方式降低了大数据管理的复杂度,提高了业务数据分类的管理效率和使用效率。

【技术实现步骤摘要】
一种用户监察标签分类的方法和装置
本专利技术涉及计算机
,尤其涉及一种用户监察标签分类的方法和装置。
技术介绍
现有的大数据平台,例如用户监察大数据平台,数据来源广泛、类型复杂。然而现有的大数据平台各类数据参差不齐,数据模型不统一,给用户展示的信息繁杂。现有的数据集成可视化无法有效的利用各类数据,从而造成数据浪费。
技术实现思路
有鉴于此,本专利技术实施例提供一种用户监察标签分类的方法和装置,能够采用机器学习的分类、聚类算法,运用大数据技术和标签技术,实现全面概括和准确性高的用户监察标签类别,及时发现干部员工日常工作的异常行为,辅助提升用户监察工作科学化和智能化管理。降低了大数据管理的复杂度,提高了业务数据分类的管理效率和使用效率。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种用户监察标签分类的方法,包括:构建用户监察标签体系;对所述用户监察标签体系进行标签分类并根据所述用户监察标签分类生成模型规则;基于所述模型规则以可视化展示所述用户监察标签体系。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述构建用户监察标签体系包括:获取源数据;对所述源数据标准化以生成标准化数据;获取所述标准化数据的特征值;基于所获取的特征值对所述标准化数据进行聚类;形成聚类标签。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述用户监察标签分类是多层次的分类,至少包括以下中的一种或多种:基础标签,所述基础标签是基于简单规则应用的标签分类;刻画标签,所述刻画标签是基于机器学习算法应用的标签分类;用户标签,所述用户标签是用于数据整合处理的标签分类。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,基于所述模型规则以可视化展示所述用户监察标签体系包括:在数据仓库层面进行数据预加载,在可视化展示前端对数据接口进行关联展示;展示数据来源和加工规则以查看和校验标签溯源。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述获取源数据包括:获取一个或多个数据源;在所述一个或多个数据源中选择满足以下条件的数据源优先接入:可直接使用的数据源,或者,关注度高的数据源;获取来自所述数据源的源数据。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述对所述源数据标准化包括:将来自所述数据源的数据在企业级数据仓库中统一标准化处理。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述基于所获取的特征值对所述标准化数据进行聚类包括:基于所述标准化数据生成一个或多个第一数据集;基于第一预设条件将所述一个或多个第一数据集拆分成一个或多个第二数据集,所述第二数据集小于所述第一数据集;利用聚类分析,根据预定原则对所述一个或多个第二数据集进行二次分类,直到满足第二预设条件。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述聚类分析是层次聚类分析。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述预定原则至少包括以下中的一项或多项:最小连接距离;最大连接距离;平均连接距离。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述满足第二预设条件包括:满足业务预设条件;或者所述一个或多个第二数据集的数目达到预设阈值;或者任意两个第二数据集之间的距离达到预设阈值。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述多层次的分类至少包括标签大类、标签中类、标签细类。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,基于所述模型规则以可视化展示所述用户监察标签体系还包括:根据用户的权限和/或响应于用户输入的查询条件显示查询结果来展示搜索用户监察标签分类体系,所述查询结果与所述用户的权限相关联。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述校验标签溯源包括:在线实时查看和校验标签溯源,和/或,下载标签分类以溯源。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述用户监察标签是用户监察系统数据标签,所述用户监察标签体系是与用户监察系统相关联的标签体系,所述数据源是用户监察系统数据源。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种标签分类的装置,包括:用户监察标签体系模块,所述用户监察标签体系模块用于构建用户监察标签体系;用户监察标签分类模块,所述用户监察标签分类模块用于对所述用户监察标签体系进行分类并根据所述用户监察标签分类生成模型规则;可视化展示模块,所述可视化展示模块用于基于所述模型规则以可视化展示所述用户监察标签体系。根据本专利技术实施例的一个方面的标签分类的装置,其中,所述用户监察标签体系模块包括:数据源子模块,用于获取源数据;机器学习子模块,用于对所述源数据标准化以生成标准化数据;获取所述标准化数据的特征值;聚类子模块,用于基于所获取的特征值对所述标准化数据进行聚类;形成聚类标签。根据本专利技术实施例的一个方面的用户监察标签分类的装置,其中,所述可视化展示模块还用于:在数据仓库层面进行数据预加载,在可视化展示前端对数据接口进行关联展示;展示数据来源和加工规则以查看和校验标签溯源。根据本专利技术实施例的一个方面的用户监察标签分类的装置,其中,所述数据源子模块还用于:获取一个或多个数据源;在所述一个或多个数据源中选择满足以下条件的数据源优先接入:可直接使用的数据源,或者,关注度高的数据源;获取来自所述数据源的源数据。根据本专利技术实施例的一个方面的用户监察标签分类的装置,其中,所述聚类子模块还用于:基于所述标准化数据生成一个或多个第一数据集;基于第一预设条件将所述一个或多个第一数据集拆分成一个或多个第二数据集,所述第二数据集小于所述第一数据集;利用聚类分析,根据预定原则对所述一个或多个第二数据集进行二次分类,直到满足第二预设条件。上述专利技术中的一个实施例具有如下优点或有益效果:因为采用机器学习的分类、聚类算法,运用大数据技术和用户监察标签技术,以用户监察数据集市为核心,涵盖各条业务线数据,形成用户监察角度的用户监察标签模型体系。通过海量数据信息的抽取、转换和加载,构建用户统一数据模型的用户监察数据集市和用户监察标签体系,充分利用现有数据,实现全面概括和准确性高的用户监察标签类别,能够及时发现干部员工日常工作的异常行为,辅助提升用户监察工作科学化和智能化管理。降低了大数据管理的复杂度,提高了业务数据分类的管理效率和使用效率。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的用户监察标签分类的方法的主要流程的示意图;本文档来自技高网...

【技术保护点】
1.一种用户监察标签分类的方法,其特征在于,包括:/n构建用户监察标签体系;/n对所述用户监察标签体系进行用户监察标签分类并根据所述用户监察标签分类生成模型规则;/n基于所述模型规则以可视化展示所述用户监察标签体系。/n

【技术特征摘要】
1.一种用户监察标签分类的方法,其特征在于,包括:
构建用户监察标签体系;
对所述用户监察标签体系进行用户监察标签分类并根据所述用户监察标签分类生成模型规则;
基于所述模型规则以可视化展示所述用户监察标签体系。


2.根据权利要求1所述的方法,其特征在于,所述构建用户监察标签体系包括:
获取源数据;
对所述源数据标准化以生成标准化数据;
获取所述标准化数据的特征值;
基于所获取的特征值对所述标准化数据进行聚类;
形成聚类标签。


3.根据权利要求1所述的方法,其特征在于,所述用户监察标签分类是多层次的分类,至少包括以下中的一种或多种:
基础标签,所述基础标签是基于简单规则应用的标签分类;
刻画标签,所述刻画标签是基于机器学习算法应用的标签分类;
用户标签,所述用户标签是用于数据整合处理的标签分类。


4.根据权利要求1所述的方法,其特征在于,基于所述模型规则以可视化展示所述用户监察标签体系包括:
在数据仓库层面进行数据预加载,在可视化展示前端对数据接口进行关联展示;
展示数据来源和加工规则以查看和校验标签溯源。


5.根据权利要求2所述的方法,其特征在于,所述获取源数据包括:
获取一个或多个数据源;
在所述一个或多个数据源中选择满足以下条件的数据源优先接入:可直接使用的数据源,或者,关注度高的数据源;
获取来自所述数据源的源数据。


6.根据权利要求2所述的方法,其特征在于,所述对所述源数据标准化包括:
将来自所述数据源的数据在企业级数据仓库中统一标准化处理。


7.根据权利要求2所述的方法,其特征在于,所述基于所获取的特征值对所述标准化数据进行聚类包括:
基于所述标准化数据生成一个或多个第一数据集;
基于第一预设条件将所述一个或多个第一数据集拆分成一个或多个第二数据集,所述第二数据集小于所述第一数据集;
利用聚类分析,根据预定原则对所述一个或多个第二数据集进行二次分类,直到满足第二预设条件。


8.根据权利要求7所述的方法,其特征在于,所述聚类分析是层次聚类分析。


9.根据权利要求7所述的方法,其特征在于,所述预定原则至少包括以下中的一项或多项:
最小连接距离;
最大连接距离;
平均连接距离。


10.根据权利要求9所述的方法,其特征在于,所述满足第二预设条件包括:
满足业务预设条件;或者
所述一个或多个第二数据集的数目达到预设阈值;或者
任意两个第二数据集之间的距离达到预设阈值。


11.根据权利要求3所述的方法,其特征在于,所述多层次的分类至少包括标签大类、标签中类、标签细类。


12.根据权利要求...

【专利技术属性】
技术研发人员:王怡冰朱克鹏王德刚申中华张雨贾飞金亮陆亦敏刘水泉魏聪惠刘洋薛飞朱佳
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1