一种基于数据资产智能治理方法及系统技术方案

技术编号:24497805 阅读:48 留言:0更新日期:2020-06-13 03:44
本发明专利技术公开了一种基于数据资产智能治理方法及系统,其中,方法具体包括以下步骤:接收上传的不同格式、内容源数据并做基础分类;将分类后不同类别的源数据与对应类别预设的特征库进行特征匹配,并得到匹配成功系数;将所述成功系数与第一预设系数进行比较;若所述成功系数大于或等于预设成功系数,标记为成功匹配,并将所述源数据与对应特征库中的数据关联形成价值链库;反之,标记为不成功匹配,并人工更新所述源数据对应的特征库。通过上述方法,能将不同格式、内容的各系统数据在一个系统上实现数据资产的收集、智能分析和治理,系统可复制性高,可有效降低开发成本及系统负载。

An intelligent governance method and system based on data assets

【技术实现步骤摘要】
一种基于数据资产智能治理方法及系统
本专利技术属于计算机应用
,具体涉及一种基于数据资产智能治理方法及系统。
技术介绍
当前,世界已全面进入以大数据共享,信息爆炸为特点的互联网信息时代。富有智能化和人性化的计算机网络技术服务,即人工智能,成为各行各业青睐和关注的焦点。随着时间的推移,人工智能的应用将在公共部门产生巨大变化,它能将数据规范化形成政务性数据资产,产生数据价值,以此完成数据的快速分析指导员工工作的方向。但目前,由于各政府系统数据内容及存储格式各不相同,在现有技术中,若要对其进行深入分析,均客制化建立相应数据库收集数据并逐项分析,即一对一建立数据库,客制化开发系统,具体方案可参考图1。在此过程中,各单一系统会大量耗费政府与数据运营平台的人力资源,加重系统负载,同时对政府系统数据的保密也存在一定风险,各组群用户需要先与数据运营企业协商数据上传格式及内容,数据运营企业再对其进行数据库建立,存储,进一步开发可视化界面进行分析展示。当存在N个用户组群时,需定义N个数据格式及内容,同时需要N个团队进行开发测试,并针对不同的用户组群开本文档来自技高网...

【技术保护点】
1.一种基于数据资产智能治理方法,其特征在于,包括以下步骤:/n接收上传的不同格式、内容源数据并做基础分类;/n将分类后不同类别的源数据与对应类别预设的特征库进行特征匹配,并得到匹配成功系数;/n将所述成功系数与第一预设系数进行比较;/n若所述成功系数大于或等于预设成功系数,标记为成功匹配,并将所述源数据与对应特征库中的数据关联形成价值链库;/n反之,标记为不成功匹配,并人工更新所述源数据对应的特征库。/n

【技术特征摘要】
1.一种基于数据资产智能治理方法,其特征在于,包括以下步骤:
接收上传的不同格式、内容源数据并做基础分类;
将分类后不同类别的源数据与对应类别预设的特征库进行特征匹配,并得到匹配成功系数;
将所述成功系数与第一预设系数进行比较;
若所述成功系数大于或等于预设成功系数,标记为成功匹配,并将所述源数据与对应特征库中的数据关联形成价值链库;
反之,标记为不成功匹配,并人工更新所述源数据对应的特征库。


2.根据权利要求1所述的治理方法,其特征在于,所述成功系数的计算方式为:



其中;O为成功系数;Xi代表关键字段维度占比;n表示标准关键特征库维度系数;XN表示标准关键特征库标准系数;j表示自动检测特征库维度系数;Yj代表自动特征维数;m表示自动检测特征库维度;YM为自动检测特征库标准系数;i代表特征关键匹配的维度系数;μ为标准关键特征库的偏差值;μ1为自动检测特征库的偏差值。


3.根据权利要求1所述的方法,其特征在于,所述人工更新所述源数据对应的特征库的步骤还包括:
将源数据与更新的特征库进行特征匹配,得到新的成功系数;
将新的成功系数与第一预设系数进行比较。


4.根据权利要求1-3任一项所述的方法,其特征在于,还包括步骤:
计算预设时间内的所述不成功匹配数量占所有匹配数量的比率;
将所述比率与第二预设系数对比;
若所述比率大于第二预设系数,则人工维护对应的特征库,新建特征逻辑算法。


5.根据权利要求1所述的治理方法,其特征在于,还包括步骤:
直接使用所述价值链库中的数据;和/或,对所述价值链库中的数据进行综合评估,当综合评估达到对应业务的预设标准后使用。


6.一种基于数据资产智能治理系统,其特征在于,包...

【专利技术属性】
技术研发人员:程俊孙金树余力
申请(专利权)人:启迪数华科技有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1