主数据识别方法、装置、设备及存储介质制造方法及图纸

技术编号：34406567 阅读：16 留言：0更新日期：2022-08-03 21:53

本发明专利技术涉及数据处理，提供一种主数据识别方法、装置、设备及存储介质。该方法获取多个场景对象中的字段特征；抽取所述字段特征中的目标特征；从多个预设数据源中获取与所述目标特征对应的特征数据进行聚类处理，得到多个数据群及每个数据群所对应的数据类别；基于所述多个数据群及所述数据类别生成主数据识别模型；当接收到主数据识别请求时，根据所述主数据识别请求获取待识别数据及待识别场景；将所述待识别数据及所述待识别场景输入至所述主数据识别模型中，得到所述待识别场景的场景主数据，提高了识别效率及识别效果。此外，本发明专利技术还涉及区块链技术，所述场景主数据可存储于区块链中。链中。链中。

全部详细技术资料下载

【技术实现步骤摘要】
主数据识别方法、装置、设备及存储介质

[0001]本专利技术涉及数据处理
，尤其涉及一种主数据识别方法、装置、设备及存储介质。

技术介绍

[0002]主数据是指企业中各业务部门共用的、具有高价值、高共享、高稳定、高质量特性的基础数据。随着数据化进程的不断推进，对主数据进行识别是非常有必要的。在现有的主数据识别方案中，主要依赖于专家对定性特征进行评分以确定出主数据，然而，这种方式缺乏客观性，导致识别效果不佳，此外，这种方式需要耗费大量时间人力成本，导致识别效率低下。

技术实现思路

[0003]鉴于以上内容，有必要提供一种主数据识别方法、装置、设备及存储介质，能够提高场景主数据的识别效果及识别效率。
[0004]一方面，本专利技术提出一种主数据识别方法，所述主数据识别方法包括：
[0005]获取多个场景对象中的字段特征；
[0006]抽取所述字段特征中的目标特征；
[0007]从多个预设数据源中获取与所述目标特征对应的特征数据进行聚类处理，得到多个数据群及每个数据群所对应的数据类别；
[0008]基于所述多个数据群及所述数据类别生成主数据识别模型；
[0009]当接收到主数据识别请求时，根据所述主数据识别请求获取待识别数据及待识别场景；
[0010]将所述待识别数据及所述待识别场景输入至所述主数据识别模型中，得到所述待识别场景的场景主数据。
[0011]根据本专利技术优选实施例，所述获取多个场景对象中的字段特征包括：
[0012...

【技术保护点】

【技术特征摘要】
1.一种主数据识别方法，其特征在于，所述主数据识别方法包括：获取多个场景对象中的字段特征；抽取所述字段特征中的目标特征；从多个预设数据源中获取与所述目标特征对应的特征数据进行聚类处理，得到多个数据群及每个数据群所对应的数据类别；基于所述多个数据群及所述数据类别生成主数据识别模型；当接收到主数据识别请求时，根据所述主数据识别请求获取待识别数据及待识别场景；将所述待识别数据及所述待识别场景输入至所述主数据识别模型中，得到所述待识别场景的场景主数据。2.如权利要求1所述的主数据识别方法，其特征在于，所述获取多个场景对象中的字段特征包括：获取预设场景库中的所有场景作为所述多个场景对象；从字段库中获取与每个场景对象对应的字段作为场景字段，并获取与所述场景对象所对应的特征作为所述字段特征。3.如权利要求1所述的主数据识别方法，其特征在于，所述从多个预设数据源中获取与所述目标特征对应的特征数据进行聚类处理，得到多个数据群及每个数据群所对应的数据类别包括：基于所述目标特征构建正则表达式；基于所述正则表达式并行搜索所述多个预设数据源，得到多个初始数据；对所述多个初始数据进行清洗，得到所述特征数据；获取与所述多个场景对象对应的目标聚类模型；基于所述目标聚类模型对所述特征数据进行聚类处理，得到所述多个数据群及每个数据群所对应的数据类别。4.如权利要求3所述的主数据识别方法，其特征在于，在获取与所述多个场景对象对应的目标聚类模型之前，所述主数据识别方法还包括：从所述多个场景对象中获取场景训练数据；基于多个预设聚类算法构建的预设聚类模型对所述场景训练数据进行聚类处理，得到每个预设聚类模型的多个数据集，所述多个数据集包括第一数据集及第二数据集；对于每个预设聚类模型，根据每个数据集中的任意两个数据构建第一协方差矩阵；根据所述第一数据集中的任意数据及所述第二数据集中的任意数据构建第二协方差矩阵；根据所述第一协方差矩阵及所述第二协方差矩阵生成每个预设聚类算法的算法分值；将所述算法分值最大的预设聚类模型确定为初始聚类模型；根据所述场景训练数据调整所述初始聚类模型，直至所述初始聚类模型的损失值不再降低，得到所述目标聚类模型。5.如权利要求4所述的主数据识别方法，其特征在于，所述算法分值的计算公式为：
其中，y...

【专利技术属性】
技术研发人员：李健荣，曾庆华，
申请(专利权)人：中国平安财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人