【技术实现步骤摘要】
票据自动分类训练方法、装置及自动分类方法、装置
本专利技术涉及图像处理技术,具体涉及一种票据自动分类训练方法、装置及自动分类方法、装置。
技术介绍
在需要财务费用报账,寿险理赔等操作中,在对批量上传的票据图片进行集中业务处理前,往往需要预先对发票图片进行分类,再做集中业务处理,如发票核算,票面信息录入等。现有技术中,基于机器视觉技术的分类方案通常使用手工设计出的特征,如LBP(局部二值模式)等作为下一步分类操作的输入,该方案在图像质量好时分类效果好。然而,在现实中,由于不可避免的因素,图片质量好的票据数量占比较低,仅仅使用这些手工设计的特征作为分类的前一步输入就显示出了弊端,直接带来的影响就是在票面图像质量较差,有噪声污染时无法准确分类。
技术实现思路
本专利技术所要解决的技术问题是:提出一种票据自动分类训练方法、装置及自动分类方法、装置,解决传统技术中基于机器视觉技术的分类方案在票面图像质量较差,有噪声污染时无法准确分类的问题。本专利技术解决上述技术问题所采用的技术方案是:第一方面,本专利技术提出了一种票据自动分类训练装置,其包括:第一获取模块,用于获取训练票据图片 ...
【技术保护点】
1.票据自动分类训练装置,其特征在于,包括:第一获取模块,用于获取训练票据图片的归属分类库标签,并提取所述训练票据图片的第一特征信息;第二获取模块,用于获取与训练票据图片的类别对应的第一分类标注数据;第一提取模块,用于提取所述训练票据图片的第二特征信息;训练模块,用于根据所述第一特征信息、第二特征信息和第一分类标注数据进行训练,以生成自动分类模型。
【技术特征摘要】
1.票据自动分类训练装置,其特征在于,包括:第一获取模块,用于获取训练票据图片的归属分类库标签,并提取所述训练票据图片的第一特征信息;第二获取模块,用于获取与训练票据图片的类别对应的第一分类标注数据;第一提取模块,用于提取所述训练票据图片的第二特征信息;训练模块,用于根据所述第一特征信息、第二特征信息和第一分类标注数据进行训练,以生成自动分类模型。2.如权利要求1所述的票据自动分类训练装置,其特征在于,还包括:第三获取模块,用于获取测试票据图片,并提取所述测试票据图片的第三特征信息;第四获取模块,用于获取与所述测试票据图片类别对应的第二分类标注数据;第二提取模块,用于提取所述测试票据图片的第四特征信息;第一生成模块,用于将所述第三特征信息和所述第四特征信息输入至所述自动分类模型,以通过所述自动分类模型生成所述测试票据图片的分类结果;计算模块,用于根据所述测试票据图片的分类结果和第二分类标注数据计算所述自动分类模型分类的准确度;判断模块,用于判断所述自动分类模型分类的准确度是否超过预设阈值;第一处理模块,用于在判断所述自动分类模型分类的准确度未超过预设阈值时,重新训练所述自动分类模型,直至所述模型分类的准确度超过预设阈值。3.票据自动分类训练方法,应用于如权利要求1或2所述的票据自动分类训练装置,其特征在于,包括以下步骤:a.获取训练图片的归属分类库标签,并提取所述训练图片的第一特征信息;b.获取与训练图片的类别对应的第一分类标注数据;c.提取训练图片的第二特征信息;d.根据所述第一特征信息、第二特征信息和第一分类标注数据进行训练,以生成用于票据图片的自动分类模型。4.如权利要求3所述的票据自动分类训练方法,其特征在于,在步骤d之后还包括:步骤e:对生成的所述自动分类模型进行准确性测试:e1.获取测试票据图片,并提取所述测试票据图片的第三特征信息;e2.获取与所述测试票据图片的类别对应的第二分类标注数据;e3.提取所述测试票据图片的第四特征信息;e4.将所述第三特征信息和所述第四特征信息输入至自动分类模型,通过所述自动分类模型自...
【专利技术属性】
技术研发人员:梁欢,
申请(专利权)人:四川长虹电器股份有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。