数据识别方法以及装置制造方法及图纸

技术编号:30322576 阅读:12 留言:0更新日期:2021-10-09 23:48
本说明书实施例提供数据识别方法以及装置,其中所述数据识别方法包括:数据采集模块、模型训练模块以及数据识别模块,所述模型训练模块从所述数据采集模块获取目标项目的历史训练数据进行模型训练,获得数据识别模型;所述数据识别模块从所述数据采集模块获取所述目标项目的待识别数据,以及从所述模型训练模块获取所述数据识别模型,并将所述待识别数据输入所述数据识别模型,获得所述目标项目的识别结果。别结果。别结果。

【技术实现步骤摘要】
数据识别方法以及装置


[0001]本说明书实施例涉及计算机
,特别涉及一种数据识别方法。本说明书一个或者多个实施例同时涉及一种数据识别装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着大数据时代的到来,在资源服务平台给用户提供资源服务的过程中,需要获取用户的单源数据作为增强信用的来源,该单源数据可包括用户属性数据、资产数据、资源流水数据等,且资源服务平台针对上述数据进行充分分析、评估,确保可以在用户无抵押的情况下为用户提供信用资源值,但往往资源服务平台通过用户上传的方式获取到的单源数据,可能存在虚假数据,只能通过宽泛的硬规则进行校验,进而导致资源服务平台获取到的用户数据质量较差,计算机处理效率较低,也极大地影响计算机资源,后续不仅会影响用户的资源服务,也无法保证向监管部门呈报数据的真实性。

技术实现思路

[0003]有鉴于此,本说明书施例提供了一种数据识别方法。本说明书一个或者多个实施例同时涉及一种数据识别装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种数据识别方法,包括:数据采集模块、模型训练模块以及数据识别模块,
[0005]所述模型训练模块从所述数据采集模块获取目标项目的历史训练数据进行模型训练,获得数据识别模型;
[0006]所述数据识别模块从所述数据采集模块获取所述目标项目的待识别数据,以及从所述模型训练模块获取所述数据识别模型,并将所述待识别数据输入所述数据识别模型,获得所述目标项目的识别结果。
[0007]根据本说明书实施例的第二方面,提供了一种数据识别装置,包括:数据采集模块、模型训练模块以及数据识别模块,
[0008]所述模型训练模块,被配置为从所述数据采集模块获取目标项目的历史训练数据进行模型训练,获得数据识别模型;
[0009]所述数据识别模块,被配置为从所述数据采集模块获取所述目标项目的待识别数据,以及从所述模型训练模块获取所述数据识别模型,并将所述待识别数据输入所述数据识别模型,获得所述目标项目的识别结果。
[0010]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0011]存储器和处理器;
[0012]所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,其中,所述处理器执行所述计算机可执行指令时实现所述数据识别方法的步骤。
[0013]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现任意一项所述数据识别方法的步骤。
[0014]本说明书一个实施例通过模型训练模块对数据识别模型进行训练获得数据识别模型,再利用数据识别模型对待识别数据进行识别,以确定待识别数据是否异常的识别结果,通过上述数据识别模型识别出待识别数据的质量,不仅实现了对待识别数据的校验,也提高了对待识别数据的识别效率,在将待识别数据质量提高的情况下,以减少后续对质量较差的待识别数据的利用,降低资源服务平台对用户的资源服务的影响,提升用户体验。
附图说明
[0015]图1是本说明书一个实施例提供的一种数据识别方法的结构示意图;
[0016]图2是本说明书一个实施例提供的一种数据识别方法的流程图;
[0017]图3是本说明书一个实施例提供的一种数据识别方法的处理过程的流程示意图;
[0018]图4是本说明书一个实施例提供的一种数据识别方法的的单源数据与服务平台的关联示意图;
[0019]图5是本说明书一个实施例提供的一种数据识别方法的单源数据处理结构层示意图;
[0020]图6是本说明书一个实施例提供的一种数据识别装置的结构示意图;
[0021]图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0022]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0023]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0024]应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0025]首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0026]单源数据:即单一源头数据,也可以理解为输入型数据。
[0027]DRC:为单元化项目提供稳定的秒级的保证事务一致性的实时数据同步服务,以实现对异构数据源进行实时迁移同步,及数据流订阅的数据管道基础技术设施。
[0028]目前,在资源服务平台为用户提供资源服务的场景中,资源服务平台通过获取用户数据,再结合用户输入、大数据平台等单源数据(外部数据)作为增加信用的来源,充分进
行分析、评估和授信,确保可以在无抵押的情况下,实现为用户提供资源服务,其中,大数据平台中产生的数据是否正常,农业资源服务中的农户输入数据是否为农户真实数据,或者是用户在其他平台的资源服务数据是否真实,这些问题都会直接或者间接地影响到资源服务项目的发展,因此,获取的用户数据(即单源数据)可能会存在质量问题,一方面会影响对用户资源的提额、降额,比如,是否尽可能地满足用户的需求,是否及时降额避免引发坏账造成的资源损失,另一方面,保证向监管部门呈报的数据真实无误,进而可以证明,单源数据的质量保证是极其必要的。
[0029]单源数据的来源不但多种多样,而且人、软硬件每日产生的数据达到了数千万的量级,平台内的数据可以通过自身的监控、核对等方式保证其质量,但是单源数据想要保证其质量,通过传统的方式几乎无法做到,原因在于,想要核对单源数据的正确性没有核对的对手方,传统的核对方式是当上游数据不等于下游数据就报异常,而在单源数据的场景下,我们只能拿到下游数据,无法拿到源头数据,所以无法做一致性核对,当前仅能靠一些宽泛的硬规则校验,进而在宽泛的规则治理下,势必会有漏网之鱼,会有一些隐蔽的不正确的数据混杂在其中,综上,本说明书实施例提供的数据识别方法,通过获取到的历史训练数据以及待识别数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据识别方法,包括:数据采集模块、模型训练模块以及数据识别模块,所述模型训练模块从所述数据采集模块获取目标项目的历史训练数据进行模型训练,获得数据识别模型;所述数据识别模块从所述数据采集模块获取所述目标项目的待识别数据,以及从所述模型训练模块获取所述数据识别模型,并将所述待识别数据输入所述数据识别模型,获得所述目标项目的识别结果。2.根据权利要求1所述的数据识别方法,还包括:数据优化模块,所述数据优化模块接收所述目标项目的识别结果,将所述目标项目的识别结果展示给目标用户;接收所述目标用户对所述目标项目的识别结果打标后形成的判定结果,且将所述判定结果返回至所述模型训练模块。3.根据权利要求2所述的数据识别方法,所述将所述判定结果返回至所述模型训练模块之后,还包括:所述模型训练模块将所述历史训练数据作为样本训练数据,并将所述判定结果作为所述样本训练数据对应的样本标签;基于所述样本训练数据以及所述样本标签调整所述数据识别模型的模型参数,完成对所述数据识别模型的优化,并将优化后的数据识别模型进行存储。4.根据权利要求1所述的数据识别方法,所述模型训练模块从所述数据采集模块获取目标项目的历史训练数据进行模型训练,获得数据识别模型之前,还包括:所述数据采集模块基于数据采集接口获取初始数据,并基于预设风险评级工具对所述初始数据进行风险评级,将风险级别满足预设需求条件的数据作为候选数据;基于预设优化算法对所述候选数据进行优化,并基于预设数据格式工具对优化后的候选数据进行格式处理,生成目标数据,其中,所述目标数据包括所述目标业务的历史训练数据以及待识别数据。5.根据权利要求1

4任意一项所述的数据识别方法,所述模型训练模块从所述数据采集模块获取目标项目的...

【专利技术属性】
技术研发人员:牛弘
申请(专利权)人:浙江网商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1