【技术实现步骤摘要】
一种基于人工智能技术的电子单证的数据处理系统
本专利技术涉及数据处理领域,更具体的说是涉及一种基于人工智能技术的电子单证的数据处理系统。
技术介绍
电子装箱单是根据国家交通部规定格式,结合本港业务运作情况制定的出口装箱单电子单证,出口装箱单电子单证上存在有字符不变的特征字符,若干个特征字符形成特征数据;为对电子单证上的数据进行更加有效的存储和分析,需要提取电子单证上的数据,一般在对电子单证上的数据进行提取的过程中,电子单证数据以PDF或图片形式输入,会有一定的倾斜,需要对电子单证数据进行角度矫正。
技术实现思路
针对现有技术存在的不足,本专利技术的目的在于提供一种基于人工智能技术的电子单证的数据处理系统,用于对电子单证数据进行角度矫正。为实现上述目的,本专利技术提供了如下技术方案:一种基于人工智能技术的电子单证的数据处理系统,包括输入端、选取端、预处理端、文字集成端和后处理端,所述输入端配置有输入单元,所述输入单元输入电子单证数据并生成动态数据库;所述选取端配置有常用数据库,所述常用数据库内存储有常用数据,所述常用数据包括位置数据和特征数据,所述位置数据表征了特征字符在标准电子单证上的位置;所述预处理端配置有版面数据库和预处理单元,所述版面数据库内存储有版面数据,所述版面数据表征了标准电子单证的版面尺寸;所述预处理单元从所述常用数据库调取所述常用数据,并从所述动态数据库调取电子单证数据;所述文字集成端配置有集成单元,所述集成单元根据字符生成对应的图像 ...
【技术保护点】
1.一种基于人工智能技术的电子单证的数据处理系统,包括输入端、选取端、预处理端、文字集成端和后处理端,其特征在于:/n所述输入端配置有输入单元,所述输入单元输入电子单证数据并生成动态数据库;/n所述选取端配置有常用数据库,所述常用数据库内存储有常用数据,所述常用数据包括位置数据和特征数据,所述位置数据表征了特征字符在标准电子单证上的位置;/n所述预处理端配置有版面数据库和预处理单元,所述版面数据库内存储有版面数据,所述版面数据表征了标准电子单证的版面尺寸;所述预处理单元从所述常用数据库调取所述常用数据,并从所述动态数据库调取电子单证数据;/n所述文字集成端配置有集成单元,所述集成单元根据字符生成对应的图像,并根据图像为每个字符建立对应的图像映射关系表,根据图像映射关系表建立数据集基础库;/n所述预处理单元根据所述特征数据从所述数据集基础库调取与所述特征数据对应的图像,并根据图像确定所述特征数据在所述电子单证数据中的位置,根据所述位置数据对所述电子单证数据中的每一个字符进行切割并存储于识别数据库中;/n所述后处理端配置有矫正单元和识别单元,矫正单元包括检查策略和矫正策略,所述识别单元从所 ...
【技术特征摘要】
1.一种基于人工智能技术的电子单证的数据处理系统,包括输入端、选取端、预处理端、文字集成端和后处理端,其特征在于:
所述输入端配置有输入单元,所述输入单元输入电子单证数据并生成动态数据库;
所述选取端配置有常用数据库,所述常用数据库内存储有常用数据,所述常用数据包括位置数据和特征数据,所述位置数据表征了特征字符在标准电子单证上的位置;
所述预处理端配置有版面数据库和预处理单元,所述版面数据库内存储有版面数据,所述版面数据表征了标准电子单证的版面尺寸;所述预处理单元从所述常用数据库调取所述常用数据,并从所述动态数据库调取电子单证数据;
所述文字集成端配置有集成单元,所述集成单元根据字符生成对应的图像,并根据图像为每个字符建立对应的图像映射关系表,根据图像映射关系表建立数据集基础库;
所述预处理单元根据所述特征数据从所述数据集基础库调取与所述特征数据对应的图像,并根据图像确定所述特征数据在所述电子单证数据中的位置,根据所述位置数据对所述电子单证数据中的每一个字符进行切割并存储于识别数据库中;
所述后处理端配置有矫正单元和识别单元,矫正单元包括检查策略和矫正策略,所述识别单元从所述识别数据库中调取字符,并通过OCR识别模型对字符进行识别,得到字符识别结果,所述检查策略用以检查所述字符识别结果中字符的组合逻辑,所述矫正单元用以矫正所述字符识别结果中字符的组合逻辑。
2.根据权利要求1所述的一种基于人工智能技术的电子单证的数据处理系统,其特征在于:所述预处理单元包括角度矫正策略,所述角度矫正策略根据确定的所述特征数据在所述电子单证数据中的位置,通过预设的角度矫正算法得到所述特征数据在水平位置上的角度偏差,并根据角度偏差计算得出所述电子单证数据中版面所处的位置,对所述电子单证数据中版面水平的角度进行调整。
3.根据权利要求2所述的一种基于人工智能技术的电子单证的数据处理系统,其特征在于:所述预处理单元还包括分析策略,所述分析策略用以检测所述电子单证数据中的页眉和页脚信息,根据页眉和页脚信息中字符的朝向来判断所述电子单证数据中的文本朝向,所述页眉和页脚信息包括页眉区域的长宽和页脚区域的长宽,所述分析策略包括分析算法,所述分析算法通过所述页眉区域的长宽和所述页脚区域的长宽得到所述电子单证数据中版面的长宽,获得所述电子单证数据版面位置并选取所述电子单证数据版面。
4.根据权...
【专利技术属性】
技术研发人员:徐明,孟宁,龙启斌,
申请(专利权)人:万汇链智能科技苏州有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。