一种基于数据资产智能治理方法及系统技术方案

技术编号：24497805 阅读：48 留言：0更新日期：2020-06-13 03:44

本发明专利技术公开了一种基于数据资产智能治理方法及系统，其中，方法具体包括以下步骤：接收上传的不同格式、内容源数据并做基础分类；将分类后不同类别的源数据与对应类别预设的特征库进行特征匹配，并得到匹配成功系数；将所述成功系数与第一预设系数进行比较；若所述成功系数大于或等于预设成功系数，标记为成功匹配，并将所述源数据与对应特征库中的数据关联形成价值链库；反之，标记为不成功匹配，并人工更新所述源数据对应的特征库。通过上述方法，能将不同格式、内容的各系统数据在一个系统上实现数据资产的收集、智能分析和治理，系统可复制性高，可有效降低开发成本及系统负载。

An intelligent governance method and system based on data assets

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据资产智能治理方法及系统
本专利技术属于计算机应用
，具体涉及一种基于数据资产智能治理方法及系统。
技术介绍
当前，世界已全面进入以大数据共享，信息爆炸为特点的互联网信息时代。富有智能化和人性化的计算机网络技术服务，即人工智能，成为各行各业青睐和关注的焦点。随着时间的推移，人工智能的应用将在公共部门产生巨大变化，它能将数据规范化形成政务性数据资产，产生数据价值，以此完成数据的快速分析指导员工工作的方向。但目前，由于各政府系统数据内容及存储格式各不相同，在现有技术中，若要对其进行深入分析，均客制化建立相应数据库收集数据并逐项分析，即一对一建立数据库，客制化开发系统，具体方案可参考图1。在此过程中，各单一系统会大量耗费政府与数据运营平台的人力资源，加重系统负载，同时对政府系统数据的保密也存在一定风险，各组群用户需要先与数据运营企业协商数据上传格式及内容，数据运营企业再对其进行数据库建立，存储，进一步开发可视化界面进行分析展示。当存在N个用户组群时，需定义N个数据格式及内容，同时需要N个团队进行开发测试，并...

【技术保护点】
1.一种基于数据资产智能治理方法，其特征在于，包括以下步骤：/n接收上传的不同格式、内容源数据并做基础分类；/n将分类后不同类别的源数据与对应类别预设的特征库进行特征匹配，并得到匹配成功系数；/n将所述成功系数与第一预设系数进行比较；/n若所述成功系数大于或等于预设成功系数，标记为成功匹配，并将所述源数据与对应特征库中的数据关联形成价值链库；/n反之，标记为不成功匹配，并人工更新所述源数据对应的特征库。/n

【技术特征摘要】
1.一种基于数据资产智能治理方法，其特征在于，包括以下步骤：
接收上传的不同格式、内容源数据并做基础分类；
将分类后不同类别的源数据与对应类别预设的特征库进行特征匹配，并得到匹配成功系数；
将所述成功系数与第一预设系数进行比较；
若所述成功系数大于或等于预设成功系数，标记为成功匹配，并将所述源数据与对应特征库中的数据关联形成价值链库；
反之，标记为不成功匹配，并人工更新所述源数据对应的特征库。

2.根据权利要求1所述的治理方法，其特征在于，所述成功系数的计算方式为：

其中；O为成功系数；Xi代表关键字段维度占比；n表示标准关键特征库维度系数；XN表示标准关键特征库标准系数；j表示自动检测特征库维度系数；Yj代表自动特征维数；m表示自动检测特征库维度；YM为自动检测特征库标准系数；i代表特征关键匹配的维度系数；μ为标准关键特征库的偏差值；μ1为自动检测特征库的偏差值。

3.根据权利要求1所述的方法，其特征在于，所述人工更新所述源数据对应的特征库的步骤还包括：
将源数据与更新的特征库进行特征匹配，得到新的成功系数；
将新的成功系数与第一预设系数进行比较。

4.根据权利要求1-3任一项所述的方法，其特征在于，还包括步骤：
计算预设时间内的所述不成功匹配数量占所有匹配数量的比率；
将所述比率与第二预设系数对比；
若所述比率大于第二预设系数，则人工维护对应的特征库，新建特征逻辑算法。

5.根据权利要求1所述的治理方法，其特征在于，还包括步骤：
直接使用所述价值链库中的数据；和/或,对所述价值链库中的数据进行综合评估，当综合评估达到对应业务的预设标准后使用。

6.一种基于数据资产智能治理系统，其特征在于，包...

【专利技术属性】
技术研发人员：程俊，孙金树，余力，
申请(专利权)人：启迪数华科技有限公司，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人