文档图像识别系统技术方案

技术编号:38459726 阅读:11 留言:0更新日期:2023-08-11 14:36
文档图像识别系统(100)包含用户终端(10)、中心服务器(20)和云API(31),其中,中心服务器(20)具有选择数据库(24),该选择数据库(24)存储有在进行了输入文档图像的字符识别处理时字符识别的正解率最大的字符识别云API(31),用户终端(10)将取得的文档图像作为处理对象文档图像发送到中心服务器(20),中心服务器(20)从处理对象文档图像中提取特征,根据提取出的特征选择一个字符识别云API(31),向选择出的一个字符识别云API(31)发送处理对象文档图像。档图像。档图像。

【技术实现步骤摘要】
【国外来华专利技术】文档图像识别系统


[0001]涉及利用字符识别云API的文档图像识别系统。

技术介绍

[0002]公知有利用云服务提供的字符识别功能应用程序接口(以下称作字符识别云API)的文档图像识别系统。在该系统中,多数情况下,使用事先准备的试验用图像对多个字符识别云API的正解率、处理速度进行评价,选定字符识别云API,使选定的字符识别云API执行字符识别处理(例如参照专利文献1)。
[0003]现有技术文献
[0004]专利文献
[0005]专利文献1:日本特开2008

293354号公报

技术实现思路

[0006]专利技术要解决的课题
[0007]另一方面,在字符识别云API中,字符识别的正解率有时根据文档图像的特征而不同。因此,在事先输入了具有与在评价字符识别云API时使用的试验用图像不同的特征的文档图像的情况下,有时与事先评价不同的字符识别云API成为最佳。因此,文档图像识别系统的字符识别精度有时降低。
[0008]因此,本专利技术的目的在于,提供字符识别精度高的文档图像识别系统。
[0009]用于解决课题的手段
[0010]本专利技术的文档图像识别系统包含:用户终端,其取得文档图像;中心服务器,其利用通信线路与所述用户终端连接;以及多个字符识别云API,它们利用通信线路与所述中心服务器连接,进行被输入的文档图像的字符识别处理,输出字符识别结果,其特征在于,所述中心服务器具有选择数据库,该选择数据库存储有输入文档图像的特征和在进行了所述输入文档图像的字符识别处理时字符识别的正解率在多个字符识别云API中最大的字符识别云API的组,所述用户终端将取得的文档图像作为处理对象文档图像发送到所述中心服务器,所述中心服务器在从所述用户终端接收到的所述处理对象文档图像中提取所述处理对象文档图像的特征,从所述选择数据库中存储的所述输入文档图像的特征中选择与所述处理对象文档图像的特征最相似的所述输入文档图像的特征,选择与选择出的所述输入文档图像的特征成组的一个字符识别云API,向选择出的一个字符识别云API发送所述处理对象文档图像,从一个字符识别云API接收字符识别结果,将接收到的字符识别结果发送到所述用户终端。
[0011]这样,选择最适合于从用户终端接收到的处理对象文档图像的字符识别处理的字符识别云API,使该字符识别云API进行字符识别处理,因此,能够提高文档图像识别系统的字符识别精度。
[0012]在本专利技术的文档图像识别系统中,也可以是,所述用户终端在从所述中心服务器
接收到字符识别结果时,将用户输入的所述处理对象文档图像中包含的正解字符串输出到所述中心服务器,所述中心服务器在被所述用户终端输入了所述正解字符串的情况下,将所述处理对象文档图像发送到各字符识别云API,所述中心服务器从各字符识别云API分别接收字符识别结果,所述中心服务器根据接收到的字符识别结果的正解度,进行与所述选择数据库的各字符识别云API成组的各输入文档图像的各特征的更新、以及向所述选择数据库追加输入文档图像的特征与字符识别云API的组中的任意一方或双方。
[0013]由此,能够实现选择数据库的最佳化,能够提高文档图像识别系统的字符识别精度。
[0014]在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从选择出的一个字符识别云API以外的其他字符识别云API接收到的字符识别结果中的至少一方为正解的情况下,并且处理对象文档图像的特征和与选择出的一个字符识别云API成组的输入文档图像的特征的相似值为规定的阈值以上的情况下,所述中心服务器根据处理对象文档图像的特征对与选择出的一个字符识别云API成组的输入文档图像的特征进行更新。
[0015]此外,在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从其他字符识别云API接收到的字符识别结果中的至少一方为正解的情况下,并且处理对象文档图像的特征和与选择出的一个字符识别云API成组的输入文档图像的特征的相似值小于规定的阈值的情况下,所述中心服务器将处理对象文档图像的特征与选择出的一个字符识别云API的组追加到选择数据库中。
[0016]此外,在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从选择出的一个字符识别云API以外的其他字符识别云API接收到的字符识别结果中的至少一方为正解的情况下,并且处理对象文档图像的特征和与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征的相似值为规定的阈值以上的情况下,根据处理对象文档图像的特征,对与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征进行更新。
[0017]此外,在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从其他字符识别云API接收到的字符识别结果中的至少一方为正解的情况下,并且处理对象文档图像的特征和与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征的相似值小于规定的阈值的情况下,所述中心服务器将处理对象文档图像的特征与其他字符识别云API中字符识别结果为正解的字符识别云API的组追加到选择数据库中。
[0018]此外,在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从选择出的一个字符识别云API以外的其他字符识别云API接收到的字符识别结果中没有正解的情况下,并且处理对象文档图像的特征和与选择出的一个字符识别云API成组的输入文档图像的特征的相似值为规定的阈值以上的情况下,所述中心服务器根据处理对象文档图像的特征对与选择出的一个字符识别云API成组的输入文档图像的特征进行更新。
[0019]此外,在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云
API接收到的字符识别结果为正解,且从选择出的一个字符识别云API以外的其他字符识别云API接收到的字符识别结果中没有正解的情况下,并且处理对象文档图像的特征和与选择出的一个字符识别云API成组的输入文档图像的特征的相似值小于规定的阈值的情况下,所述中心服务器将处理对象文档图像的特征与选择出的一个字符识别云API的组追加到选择数据库中。
[0020]此外,在本专利技术的文档图像识别系统中,也可以是,在从选择出的一个字符识别云API接收到的字符识别结果为非正解,且从选择出的一个字符识别云API以外的其他字符识别云API接收到的字符识别结果中的至少一方为正解的情况下,并且处理对象文档图像的特征和与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征的相似值为规定的阈值以上的情况下,所述中心服务器根据处理对象文档图像的特征,对与其他字符识别云API中字符识别结果为正解的字符识别云A本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种文档图像识别系统,该文档图像识别系统包含:用户终端,其取得文档图像;中心服务器,其利用通信线路与所述用户终端连接;以及多个字符识别云API,它们利用通信线路与所述中心服务器连接,进行被输入的文档图像的字符识别处理,输出字符识别结果,其特征在于,所述中心服务器具有选择数据库,该选择数据库存储有输入文档图像的特征与在进行了所述输入文档图像的字符识别处理时字符识别的正解率在多个字符识别云API中最大的字符识别云API的组,所述用户终端将取得的文档图像作为处理对象文档图像发送到所述中心服务器,所述中心服务器在从所述用户终端接收到的所述处理对象文档图像中提取所述处理对象文档图像的特征,从所述选择数据库中存储的所述输入文档图像的特征中选择与所述处理对象文档图像的特征最相似的所述输入文档图像的特征,选择与选择出的所述输入文档图像的特征成组的一个字符识别云API,向选择出的一个字符识别云API发送所述处理对象文档图像,从一个字符识别云API接收字符识别结果,将接收到的字符识别结果发送到所述用户终端。2.根据权利要求1所述的文档图像识别系统,其特征在于,所述用户终端在从所述中心服务器接收到字符识别结果时,将用户输入的所述处理对象文档图像中包含的正解字符串输出到所述中心服务器,所述中心服务器在被所述用户终端输入了所述正解字符串的情况下,将所述处理对象文档图像发送到各字符识别云API,所述中心服务器从各字符识别云API分别接收字符识别结果,所述中心服务器根据接收到的字符识别结果的正解度,进行所述选择数据库的与各字符识别云API成组的各输入文档图像的各特征的更新、以及输入文档图像的特征与字符识别云API的组向所述选择数据库的追加中的任意一方或双方。3.根据权利要求2所述的文档图像识别系统,其特征在于,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从选择出的一个字符识别云API以外的其他字符识别云API接收到的字符识别结果中的至少一方为正解,并且处理对象文档图像的特征和与选择出的一个字符识别云API成组的输入文档图像的特征的相似值为规定的阈值以上的情况下,所述中心服务器根据处理对象文档图像的特征对与选择出的一个字符识别云API成组的输入文档图像的特征进行更新。4.根据权利要求3所述的文档图像识别系统,其特征在于,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从其他字符识别云API接收到的字符识别结果中的至少一方为正解,并且处理对象文档图像的特征和与选择出的一个字符识别云API成组的输入文档图像的特征的相似值小于规定的阈值的情况下,所述中心服务器将处理对象文档图像的特征与选择出的一个字符识别云API的组追加到选择数据库中。5.根据权利要求2所述的文档图像识别系统,其特征在于,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从选择出的一个
字符识别云API以外的其他字符识别云API接收到的字符识别结果中的至少一方为正解,并且处理对象文档图像的特征和与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征的相似值为规定的阈值以上的情况下,所述中心服务器根据处理对象文档图像的特征,对与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征进行更新。6.根据权利要求5所述的文档图像识别系统,其特征在于,在从选择出的一个字符识别云API接收到的字符识别结果为正解,且从其他字符识别云API接收到的字符识别结果中的至少一方为正解,并且处理对象文档图像的特征和与其他字符识别云API中字符识别结果为正解的字符识别云API成组的输入文档图像的特征的相似值小于规定的阈值的情况下,所述中心服务器将处理对象文档图像的特征与其他字符识别云API中字符识别结果为正...

【专利技术属性】
技术研发人员:岩村光贵横田守真三轮刚久长谷川康次小田仁己奥村诚司小平孝之齐藤启太榎本嵩久
申请(专利权)人:三菱电机楼宇解决方案株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1