一种基于神经符号的身份证号码补全方法技术

技术编号:39001250 阅读:35 留言:0更新日期:2023-10-07 10:33
本发明专利技术公开了一种基于神经符号的身份证号码补全方法,包括以下步骤:(1)、数据集构建与预处理,使用Python函数定义画板,绘制数字0~9以及大写字母X各1000张,保存作为训练数据;利用随机函数生成有效身份证号;对身份证号的前17位的随机位置设置缺失,构建json文件作为数据集;(2)、模型构建与训练,根据身份证的数字组成,构造输出层为11的卷积神经网络作为字符识别模型;读取train.json,构造遮挡的训练数据;根据身份证号码规则,构造逻辑损失加入训练过程;更新参数,完成模型训练。本发明专利技术通过利用卷积神经网络对身份证数字进行识别和预测,以补全缺失的身份证号码信息,从而提高身份证号码的识别和运用的准确性和效率。高身份证号码的识别和运用的准确性和效率。

【技术实现步骤摘要】
一种基于神经符号的身份证号码补全方法


[0001]本专利技术涉及神经网络和数字识别
,具体讲是一种基于神经符号的身份证号码补全方法。

技术介绍

[0002]目前,身份证号码的识别和应用过程中,常常会因为身份证号码的缺失或遮掩等问题引发不便和误解。在数字识别和人工智能技术的发展下,利用卷积神经网络等技术对身份证数字进行识别和预测已成为一种切实可行的解决方案。相比于传统的方法,基于神经符号的身份证号码补全方法可以高效、快速地对身份证号码进行补全和验证,提高身份证号码的识别和运用的准确性和效率,具有广泛的应用前景。

技术实现思路

[0003]鉴于上述现有技术的缺陷,本专利技术的一个目的在于:提供一种基于神经符号的身份证号码补全方法。
[0004]为解决上述问题,本专利技术的技术解决方案是:一种基于神经符号的身份证号码补全方法,包括以下步骤:
[0005](1)、数据集构建与预处理,使用Python函数定义画板,绘制数字0~9以及大写字母X各1000张,保存作为训练数据;利用随机函数生成有效身份证号;对身份证号的前本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于神经符号的身份证号码补全方法,其特征在于包括以下步骤:(1)、数据集构建与预处理,使用Python函数定义画板,绘制数字0~9以及大写字母X各1000张,保存作为训练数据;利用随机函数生成有效身份证号;对身份证号的前17位的随机位置设置缺失,构建json文件作为数据集;(2)、模型构建与训练,根据身份证的数字组成,构造输出层为11的卷积神经网络作为字符识别模型;读取train.json,构造遮挡的训练数据;根据身份证号码规则,构造逻辑损失加入训练过程;更新参数,完成模型训练。2.根据权利要求1所述的一种基于神经符号的身份证号码补全方法,其特征在于,步骤(1)包括:(1.1)、利用Python的OpenCV库设置48
×
48大小的画布,5号黑体字体进行数据集图片绘制,调用OpenCV库中的putText()函数为每个数字和字母X进行绘制;(1.2)、采用随机旋转、水平翻转、随机缩放等数据增强方法,将每类图片增加至1000张,并储存在数据集文件夹下的0~9以及X的文件夹中;(1.3)、利用Python函数随机生成省份、出生日期、以及三位顺序码,通过ISO7064:1983,Mod11

2算法生成身份证的校验码,组合成18位有效身份证号码;(1.4)、重复步骤(1.3),随机生成5000个有效身份证号,并且针对每个身份证号,随机设置1~17位的随机遮挡位置;(1.5)、根据步骤(1.1)至(1.4)构造的身份证号,生成包括5000个json字符串的json文件作为数据集,json字符串如:{“train_id”:“train00001”,“img_seq”:[

3/002.jpg

,

2/008.jpg

,

,

X/064.jpg

],“id_num”:32

X,“mask_pos”:[0,4,13]},其中“train_id”是训练数据的序号,“img_seq”身份证数字的图像序列,由步骤1

2中存储的文件路径组成,“id_num”是身份证号码,“mask_pos”是随机遮挡的身份证数字索引。(1.6)按照80:20的比例,将步骤(1.1)至(1.5)生成的json文件进行分割,存储为训练数据集和测试数据集的json,分别为“trainset.json”以及“testset.json”。3.根据权利要求1所述的一种基于神经符号的身份证号码补全方法,...

【专利技术属性】
技术研发人员:吴茂念彭蔚朱绍郑博吴涛
申请(专利权)人:湖州市吴兴区数字经济技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1