一种购物小票识别方法及系统技术方案

技术编号：39048323 阅读：14 留言：0更新日期：2023-10-10 12:01

本发明专利技术公开了一种购物小票识别方法及系统，包括以下步骤：A、图片处理；B、图片布局分析；C、模板对比：将步骤B中得到的图片b与模板进行布局对比，如无相同布局的模板则将步骤B中得到的图片b制作成模板，人工框定图片b上的矩形区域为模板，并指定数据采集区，对数据采集区的数据进行采集，保存关键字域以及关键字域与数值域之间的向量差；如有相同布局的模板则按照模板指定的数据采集区采集数据，具体分为两步：第一步、通过OpenCV的相关性算法找到关键字域；第二步根据关键字域和数值域的向量差，计算出小票的数值域；D、将步骤C中采集的像素数据转化为文字并存入数据库。素数据转化为文字并存入数据库。素数据转化为文字并存入数据库。

全部详细技术资料下载

【技术实现步骤摘要】
一种购物小票识别方法及系统

[0001]本专利技术涉及电子商务操作系统
，尤其涉及一种购物小票识别方法及系统。

技术介绍

[0002]商城、超市、门店在售出商品时会将商品明细和价格打印在小票上，客户可通过小票核对消费内容。小票信息在商家结算系统中有存根，商家可通过小票编号调取小票内容。但商家结算系统属于机密，不会透露给外人。
[0003]零售商在选址时会委托第三方做市场调查，第三方为了解商区客流量、消费水平、消费内容、消费特点等信息，通常会采用以下方式采集信息：1、送礼品吸引志愿者，填写调查表；2、回收购物小票，然后统计小票上的信息；3、其他方法。
[0004]方式2中需要对购物小票进行数据统计，人工统计的方法效率底下，采用自动化设备可提高效率，购物小票信息的采集属于图像处理技术，是一种对小票进行关键数据提取的技术。关键数据是指单笔消费金额、小票流水号、交易时间、交易明细等数据。通过对数据的汇总，可以获得商户的单笔消费金额、营收、客单价，并可绘制交易时间曲线。从而为零售商提供有说服力的调查报告。
[0005]现有技术已经可以对图片中的数字、文字进行采集并转化为数据。如附图1所示，现有技术包括图片识别模块、文本处理模块，“图片识别模块”先对小票图片进行识别成文本，然后“文本处理模块”对识别后的文本内容进行关键数据提取。该技术存在的不足是：1.需要人工校准导致成本高；2.识别整个小票图片涉及大量计算，耗时长。

技术实现思路

[0006]本专利技术针对现有技术需要人工校准导致数...

【技术保护点】

【技术特征摘要】
1.一种购物小票图片识别方法，其特征是，包括以下步骤：A、图片处理，先后对购物小票图片进行灰度化、二值化处理，得到一张黑白两色的图片a，此时图片a的文字为黑色，背景为白色；B、图片布局分析：通过纵轴和横轴的像素投影对图片a进行计算，像素投影的谷底部分既为文字边界，应用间隔阀值将同一行连续的文字划分为一个矩形区域，区域的边界与文字的边界一致，得到一系列具备矩形区域的图片b；C、模板对比：将步骤B中得到的图片b与模板进行布局对比，如无相同布局的模板则根据步骤B中得到的图片b制作模板，人工框定图片b上的矩形区域为模板，并指定数据采集区，对数据采集区的数据进行采集；如有相同布局的模板则按照模板指定的数据采集区采集数据；D、将步骤C中采集的像素数据转化为文字并存入数据库。2.根据权利要求1所述的一种购物小票识别方法，其特征是，所述步骤C中“制作模板”还包括：保存关键字域以及关键字域与数值域之间的向量差。3.根据权利要求2所述的一种购物小票识别方法，其特征是，所述C中“有相同布局的模板则按照模板指定的数据采集区采集数据”具体分为两步：第一步、通过OpenCV的相关性算法找到关键字域；第二步根据关键字域和数值域的向...

【专利技术属性】
技术研发人员：刘振国，赵润泽，高涛，
申请(专利权)人：上海谦贸信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人