【技术实现步骤摘要】
基于文本识别的目标单据获取方法、装置及存储介质
本申请涉及但不限于单据审计领域,尤其是涉及一种基于文本识别的目标单据获取方法、装置及存储介质。
技术介绍
在单据审计领域中多采用人工抽样检查的方式对目标单据进行选择和处理,当前的单据审计方式缺乏对非结构化数据的处理能力,存在目标单据的选择效率较低的问题。
技术实现思路
本申请旨在至少解决现有技术中存在的技术问题之一。为此,本申请提出一种基于文本识别的目标单据获取方法,能够提高目标单据的选择效率。根据本申请第一方面实施例的基于文本识别的目标单据获取方法,所述方法包括:获取多个待处理单据的扫描件;识别每一所述扫描件的原始内容;获取每个所述原始内容中的车牌号数据;所述车牌号数据包括至少两个不同的车牌号;计算出每个所述车牌号出现的次数;根据每个所述车牌号出现的次数从所述多个待处理单据的扫描件中选择目标扫描件。根据本申请实施例的基于文本识别的目标单据获取方法,至少具有如下技术效果:基于文本识别的目标单据获取方法提高了目标单据的选择效率。根据本申 ...
【技术保护点】
1.基于文本识别的目标单据获取方法,其特征在于,包括:/n获取多个待处理单据的扫描件;/n识别每一所述扫描件的原始内容;/n获取每个所述原始内容中的车牌号数据;所述车牌号数据包括至少两个不同的车牌号;/n计算出每个所述车牌号出现的次数;/n根据每个所述车牌号出现的次数从所述多个待处理单据的扫描件中选择目标扫描件。/n
【技术特征摘要】
1.基于文本识别的目标单据获取方法,其特征在于,包括:
获取多个待处理单据的扫描件;
识别每一所述扫描件的原始内容;
获取每个所述原始内容中的车牌号数据;所述车牌号数据包括至少两个不同的车牌号;
计算出每个所述车牌号出现的次数;
根据每个所述车牌号出现的次数从所述多个待处理单据的扫描件中选择目标扫描件。
2.根据权利要求1所述的基于文本识别的目标单据获取方法,其特征在于,所述根据每个所述车牌号出现的次数从所述多个待处理单据的扫描件中选择目标扫描件,包括:
根据每个所述车牌号出现的次数得到目标车牌;
从所述多个待处理单据的扫描件中选择对应所述目标车牌的扫描件作为所述目标扫描件。
3.根据权利要求2所述的基于文本识别的目标单据获取方法,其特征在于,所述根据每个所述车牌号出现的次数得到目标车牌,包括:
根据每个所述车牌号出现的次数从大到小进行排序,得到对应所述车牌号的排序表;
根据所述排序表从多个所述车牌号中选择所述目标车牌。
4.根据权利要求3所述的基于文本识别的目标单据获取方法,其特征在于,所述根据所述排序表从多个所述车牌号中选择所述目标车牌,包括:
获取预设排序参数;
从所述排序表选择对应所述预设排序参数的所述车牌号作为所述目标车牌。
5.根据权利要求1所述的基于文本识别的目标单据获取方法,其特征在于,所述获取多个待处理单据的扫描件,还包括:
获取所述待处理单据的单...
【专利技术属性】
技术研发人员:李硕鑫,傅达,
申请(专利权)人:南方电网深圳数字电网研究院有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。