企业识别方法、装置及存储介质制造方法及图纸

技术编号:31928691 阅读:54 留言:0更新日期:2022-01-15 13:17
本发明专利技术实施例公开了一种企业识别方法、装置及计算机可读存储介质,所述方法包括:获取待识别企业数据,所述待识别企业数据包含多个属性字段;按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;根据待识别企业数据创建对应的企业名称变更记录表,所述企业名称变更记录表包括待识别企业数据对应的企业名称变更的数据;基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符。采用本发明专利技术实施例,可提高对不同数据来源的企业数据的企业识别准确性。的企业识别准确性。的企业识别准确性。

【技术实现步骤摘要】
企业识别方法、装置及存储介质


[0001]本专利技术涉及大数据
,尤其涉及一种企业识别方法、装置及计算机可读存储介质。

技术介绍

[0002]在日常的数据处理中,尤其是在工商记录、企业数据等数据的处理过程中,由于是人工的处理,很容易处理数据错误或错漏;在不同的数据来源中,企业数据的记录更存在不同,例如,由于新旧名称的不同、大小写的不同,字符顺序颠倒以及名称中包含了非法字符而导致同一个企业在各个数据来源中的数据不同。根据上述企业数据来源的多样化,在对企业进行识别时,会因为数据的错漏、来源不同等,会导致无法对企业进行准确的识别,无法对不同数据来源的企业数据进行准确的企业识别和处理。

技术实现思路

[0003]基于此,在本专利技术实施例中,提供了一种企业识别方法,可对不同的企业数据进行识别,提高企业识别的准确性。
[0004]在本专利技术的第一部分,提供了一种企业识别方法,所述方法包括:获取待识别企业数据,所述待识别企业数据包含多个属性字段;按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;根据待识别企业数据创建对应的企业名称变更记录表,所述企业名称变更记录表包括待识别企业数据对应的企业名称变更的数据;基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符。
[0005]可选的,所述待识别企业数据包含的多个属性字段包括与待识别企业数据的数据来源对应的来源企业标识符;所述方法还包括:根据目标企业标识符与来源企业标识符之间的对应关系,创建企业标识符映射表。
[0006]可选的,所述按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理的步骤,还包括:按照预设的清洗规则,对所述待识别企业数据的多个属性字段中的至少一个属性字段进行处理,以使多个属性字段下的数据满足预设的字段要求;其中,对至少一个属性字段进行处理包括转换、补全、更正中的一个或多个。
[0007]可选的,所述根据待识别企业数据创建对应的企业名称变更记录表的步骤,还包括:根据待识别企业数据,确定所述多个属性字段的字段名称变更记录,并生成企业名称变更记录表。
[0008]可选的,所述基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别的步骤,还包括:根据所述待识别企业数据的多个属性字段中指定的至少一个属性字段是否相同、以及企业名称变更记录表中是否存在变更记录,对所述待识别企业数据进行识别。
[0009]可选的,所述方法还包括:若所述企业名称变更记录表中不存在变更记录,则将所述待识别企业数据发送至预设接口,以进行人工识别;接收人工识别结果,并根据人工识别结果生成对所述待识别企业数据进行识别的识别结果。
[0010]可选的,所述基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符的步骤,还包括:对于识别为相同企业的待识别企业数据,分配相同的唯一的目标企业标识符。
[0011]可选的,所述方法还包括:将识别为相同企业的多条待识别企业数据中更新时间最近的目标待识别企业数据;保留所述目标待识别企业数据,删除除所述目标待识别企业数据之外的识别为相同企业的多条待识别企业数据中的企业待识别企业数据;根据目标待识别企业数据对所述企业名称变更记录表进行更新。
[0012]在本专利技术的第二部分,提供了一种企业识别装置,所述装置包括:数据获取模块,用于获取待识别企业数据,所述待识别企业数据包含多个属性字段;数据清洗模块,用于按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;数据变更模块,用于根据待识别企业数据创建对应的企业名称变更记录表,所述企业名称变更记录表包括待识别企业数据对应的企业名称变更的数据;企业识别模块,用于基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符。
[0013]在本专利技术的第三部分,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待识别企业数据,所述待识别企业数据包含多个属性字段;按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;根据待识别企业数据创建对应的企业名称变更记录表,所述企业名称变更记录表包括待识别企业数据对应的企业名称变更的数据;基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符。
[0014]在本专利技术的第四部分,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待识别企业数据,所述待识别企业数据包含多个属性字段;按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;根据待识别企业数据创建对应的企业名称变更记录表,所述企业名称变更记录表包括待识别企业数据对应的企业名称变更的数据;基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符。
[0015]采用本专利技术实施例,具有如下有益效果:采用了本专利技术实施例提供的企业识别方法、装置、计算机设备及计算机可读存储介质之后,在对待识别企业数据进行企业识别的情况下,首先按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;然后创建包括待识别企业数据对应的企业名称变更的数据的企业名称变更记录表;基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行企业识别,并为所述待识别企业数据分配唯一的目标企业标识符。也就是说,通过按照预设的数据格式加载待识别企业数据并对待识别企业数据按照预设的规则进行预处理,以使得不同数据来源的企业在实质相同的情况下能被识别为同一家企业,而不是因为不同数据来源的字段上的形式不同而被识别为不同企业而出现识别错误,提高了企业识别的准确性。
[0016]进一步的,在本实施例中,在对企业进行准确的识别之后,还针对不同数据来源的数据之间构建企业标识符之间的映射关系,以便于其他与企业基本信息相关联的子表信息能够得到企业标识符。
附图说明
[0017]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]其中:图1为一个实施例中一种企业识别方法的流程示意图;图2为一个实施例中一种企业识别方法的流程示意图;图3为一个实施例中一种企业识别装置的结构示意图;图4为一个实施例中运行上述企业识别方法的计算机设备的结构示意图。
...

【技术保护点】

【技术特征摘要】
1.一种企业识别方法,其特征在于,所述方法包括:获取待识别企业数据,所述待识别企业数据包含多个属性字段;按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理;根据待识别企业数据创建对应的企业名称变更记录表,所述企业名称变更记录表包括待识别企业数据对应的企业名称变更的数据;基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别,并为所述待识别企业数据分配唯一的目标企业标识符。2.根据权利要求1所述的企业识别方法,其特征在于,所述待识别企业数据包含的多个属性字段包括与待识别企业数据的数据来源对应的来源企业标识符;所述方法还包括:根据目标企业标识符与来源企业标识符之间的对应关系,创建企业标识符映射表。3.根据权利要求1所述的企业识别方法,其特征在于,所述按照预设的数据格式加载待识别企业数据,对待识别企业数据进行处理的步骤,还包括:按照预设的清洗规则,对所述待识别企业数据的多个属性字段中的至少一个属性字段进行处理,以使多个属性字段下的数据满足预设的字段要求;其中,对至少一个属性字段进行处理包括转换、补全、更正中的一个或多个。4.根据权利要求1所述的企业识别方法,其特征在于,所述根据待识别企业数据创建对应的企业名称变更记录表的步骤,还包括:根据待识别企业数据,确定所述多个属性字段的字段名称变更记录,并生成企业名称变更记录表。5.根据权利要求1所述的企业识别方法,其特征在于,所述基于所述企业名称变更记录表和所述待识别企业数据的多个属性字段,对所述待识别企业数据进行识别的步骤,还包括:根据所述待识别企业数据的多个属性字段中指定的至少一个属性字段是否相同、以及企业名称变更记录表中是否存在变更记录,对所述待识别企业数据进行...

【专利技术属性】
技术研发人员:施震张在翔
申请(专利权)人:中证信用增进股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1