【技术实现步骤摘要】
一种基于深度学习的营业执照数据处理方法及系统
[0001]本专利技术涉及数据处理
,尤其涉及一种基于深度学习的营业执照数据处理方法及系统。
技术介绍
[0002]深度学习是一种机器学习的方法,其核心思想是通过构建和训练深层神经网络来模拟和学习人类的认知能力。深度学习的主要目标是通过对大量数据进行学习,从中提取抽象的特征和模式,以便对新的、未知的数据进行预测、分类、识别等任务。营业执照数据识别是指利用计算机技术和算法对营业执照中的信息进行自动化提取和识别的过程。营业执照通常包含了企业或组织的基本信息,如名称、注册号码、地址、法定代表人等。传统上,人们需要手动阅读和录入这些信息,费时费力且容易出错。而营业执照数据识别技术通过图像处理、文本识别和机器学习等方法,可以自动地从营业执照图像中提取和识别这些信息,实现快速、准确和高效的数据录入和处理。在实际应用过程中,由于图像质量问题、扫描或拍摄角度问题、字体模糊或变形、光照不均匀的问题,常常面临输入的营业执照数据不清楚或者不完整的情况。
技术实现思路
[0003] ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的营业执照数据处理方法,其特征在于,包括以下步骤:步骤S1:获取营业执照数据,其中营业执照数据包括营业执照图像数据以及营业执照基本数据;步骤S2,包括:对营业执照图像数据进行二值化计算,从而生成营业执照二值化图像数据;对营业执照二值化图像数据进行边缘检测,从而生成营业执照图像形状数据;根据营业执照图像形状数据对营业执照图像数据进行图像区域切割,从而生成营业执照图像区域数据;对营业执照图像区域数据进行噪点情况处理,从而生成噪点情况数据;确定噪点情况数据为低频噪点情况时,对营业执照图像数据进行第一去噪处理,从而生成营业执照去噪数据;确定噪点情况数据为高频噪点情况时,对营业执照图像数据进行第二去噪处理,从而生成营业执照去噪数据;确定噪点情况数据为复合噪点情况时,对营业执照图像数据进行第三去噪处理,从而生成营业执照去噪数据;第一去噪处理的步骤具体为通过营业执照低频图像去噪计算公式对营业执照图像数据进行去噪处理,从而生成营业执照去噪数据,其中营业执照低频图像去噪计算公式具体为:;为营业执照去噪数据,为第一权重系数,为营业执照图像数据频率参数,为历史营业执照图像数据频率参数,为调节参数,为营业执照图像数据像素变化率,为历史营业执照图像数据像素变化率,为第二权重系数,为高频噪声衰变参数,为营业执照图像数据噪声估计值,为营业执照去噪数据的修正项;步骤S3:对营业执照去噪图像数据进行误差校验,从而生成误差校验数据,若确定误差校验数据高于或等于误差阈值范围时,则返回步骤S1,若确定误差校验数据小于误差阈值范围时,则对营业执照去噪图像数据进行像素纠正,从而生成营业执照校准图像数据;步骤S4:对营业执照校准图像数据以及营业执照基本数据进行营业执照完善度检测,从而生成营业执照完善度数据,若确定营业执照完善度数据为存在异常的营业执照完善度数据时,则返回步骤S1,若确定营业执照完善度数据为不存在异常的营业执照完善度数据时,确定营业执照校准数据为营业执照待识别数据,以发送至营业执照数据识别系统执行营业执照数据识别作业。2.根据权利要求1所述的方法,其特征在于,步骤S1具体为:生成营业执照输入数据获取控件,并利用营业执照输入数据获取控件进行营业执照输入数据采集,从而获得营业执照输入数据;对营业执照输入数据进行数据去重处理,从而生成营业执照去重数据;对营业执照去重数据进行数据异常处理,从而生成营业执照正常数据;对营业执照正常数据进行数据增强处理,从而生成营业执照增强数据;对营业执照增强数据进行数据标准转换,从而生成营业执照标准数据。3.根据权利要求1所述的方法,其特征在于,其中第二去噪采集处理的步骤具体为:
对营业执照图像数据进行第一高频噪点检测,从而生成第一高频噪点检测数据;确定第一高频噪点检测数据为连续高频噪点检测数据时,则生成第一高频滤波器,并利用第一高频滤波器对营业执照图像数据进行第一高频去噪处理,从而生成第一高频去噪图像数据;对第一高频去噪图像数据进行第二高频噪点检测,从而生成第二高频噪点检测数据;确定第二高频噪点检测...
【专利技术属性】
技术研发人员:张昆,叶祖焕,孙海鹏,刘佳,
申请(专利权)人:湖南华菱电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。