场景文字识别方法、装置、设备和计算机可读介质制造方法及图纸

技术编号:27536287 阅读:20 留言:0更新日期:2021-03-03 11:23
本发明专利技术公开的实施例公开了场景文字识别方法、装置、设备和计算机可读介质。该方法包括:对获取的输入图像进行预处理,得到处理后的输入图像;将所述处理后的输入图像输入至预先训练的场景文字识别模型,输出识别结果;将所述识别结果传输至目标显示设备,以及控制所述目标显示设备显示所述识别结果。该实施方式实现了针对图像的场景文字识别,满足用户对文字识别的需求。另外,通过选择设备进行训练,基于训练得到的参数生成场景文字识别模型,避免了大数据量的数据传输,降低了通信代价,也提高了对边缘设备上数据的利用率。高了对边缘设备上数据的利用率。高了对边缘设备上数据的利用率。

【技术实现步骤摘要】
场景文字识别方法、装置、设备和计算机可读介质


[0001]本专利技术公开的实施例涉及计算机领域,具体涉及场景文字识别方法、装置、设备和计算机可读介质。

技术介绍

[0002]目前场景文字识别技术已经广泛应用到工业和商业中,但目前的场景文字识别技术安全性低、数据传输资源网络宽带消耗高。从而严重影响了场景文字识别技术的快速进步和发展。

技术实现思路

[0003]本专利技术公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本专利技术公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0004]本专利技术公开的实施例提出了场景文字识别方法、装置、设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题。
[0005]第一方面,本专利技术公开的实施例提供了一种场景文字识别方法,该方法包括:对获取的输入图像进行预处理,得到处理后的输入图像;将所述处理后的输入图像输入至预先训练的场景文字识别模型,输出识别结果,其中,所述场景文字识别模型是通过联合学习训练得到的,所述场景文字识别模型的训练包括:响应于接收到目标用户的训练请求,选择至少一个设备作为目标设备;控制所述目标设备开始训练;响应于确定所述训练完成,获取训练得到的设备模型的参数;基于所述设备模型的参数,生成所述场景文字识别模型;将所述识别结果传输至目标显示设备,以及控制所述目标显示设备显示所述识别结果。
[0006]第二方面,本专利技术公开的实施例提供了一种场景文字识别装置,装置包括:处理单元,被配置成对获取的输入图像进行预处理,得到处理后的输入图像;生成单元,被配置成将所述处理后的输入图像输入至预先训练的场景文字识别模型,输出识别结果,其中,所述场景文字识别模型是通过联合学习训练得到的,所述场景文字识别模型的训练包括:响应于接收到目标用户的训练请求,选择至少一个设备作为目标设备;控制所述目标设备开始训练;响应于确定所述训练完成,获取训练得到的设备模型的参数;基于所述设备模型的参数,生成所述场景文字识别模型;显示单元,被配置成将所述识别结果传输至目标显示设备,以及控制所述目标显示设备显示所述识别结果。
[0007]第三方面,本专利技术公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中所描述的方法。
[0008]第四方面,本专利技术公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中所描述的方法。
[0009]本专利技术公开的上述各个实施例中的一个实施例具有如下有益效果:通过对输入图
像的预处理,得到用于输入场景文字识别模型的输入图像,从而得到识别结果。实现了针对图像的场景文字识别,满足用户对文字识别的需求。另外,通过选择设备进行训练,基于训练得到的参数生成场景文字识别模型,避免了大数据量的数据传输,降低了通信代价,也提高了对边缘设备上数据的利用率。
附图说明
[0010]结合附图并参考以下具体实施方式,本专利技术公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0011]图1是根据本专利技术公开的实施例的场景文字识别方法的一个应用场景的示意图;
[0012]图2是根据本专利技术公开的场景文字识别方法的实施例的流程图;
[0013]图3是根据本专利技术公开的场景文字识别方法的生成场景文字识别模型的实施例的流程图;
[0014]图4是根据本专利技术公开的场景文字识别装置的实施例的结构示意图;
[0015]图5是适于用来实现本专利技术公开的实施例的电子设备的结构示意图。
具体实施方式
[0016]下面将参照附图更详细地描述本专利技术公开的实施例。虽然附图中显示了本专利技术公开的某些实施例,然而应当理解的是,本专利技术公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本专利技术公开的附图及实施例仅用于示例性作用,并非用于限制本专利技术公开的保护范围。
[0017]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本专利技术公开中的实施例及实施例中的特征可以相互组合。
[0018]需要注意,本专利技术公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0019]需要注意,本专利技术公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0020]本专利技术公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0021]下面将参考附图并结合实施例来详细说明本公开。
[0022]图1是根据本专利技术公开一些实施例的场景文字识别方法的一个应用场景的示意图。
[0023]在图1的应用场景中,首先,计算设备101可以对获取的输入图像102进行预处理,如附图标记103所示,得到处理后的输入图像104。然后,计算设备101可以将处理后的输入图像104输入至预先训练的场景文字识别模型105,输出识别结果106。最后,计算设备101可以将识别结果106传输至目标显示设备107,以及控制目标显示设备107显示识别结果106。
[0024]需要说明的是,上述计算设备101可以是硬件,也可以是软件。当计算设备为硬件
时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当计算设备体现为软件时,可以安装在上述所列举的硬件设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
[0025]应该理解,图1中的计算设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的计算设备。
[0026]继续参考图2,示出了根据本专利技术公开的场景文字识别方法的实施例的流程200。该方法可以由图1中的计算设备101来执行。该场景文字识别方法,包括以下步骤:
[0027]步骤201,对获取的输入图像进行预处理,得到处理后的输入图像。
[0028]在实施例中,场景文字识别方法的执行主体(如图1所示的计算设备101)可以对获取的输入图像进行预处理,得到处理后的输入图像。这里,预处理可以是对输入图像进行图像二值化处理。输入图像可以是待识别的包含文字的图像。
[0029]在实施例的可选的实现方式中,上述执行主体可以通过有线连接方式或无线连接方式获取上述输入图像。
[0030本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种场景文字识别方法,其特征在于,包括:对获取的输入图像进行预处理,得到处理后的输入图像;将所述处理后的输入图像输入至预先训练的场景文字识别模型,输出识别结果,其中,所述场景文字识别模型是通过联合学习训练得到的,所述场景文字识别模型的训练包括:响应于接收到目标用户的训练请求,选择至少一个设备作为目标设备;控制所述目标设备开始训练;响应于确定所述训练完成,获取训练得到的设备模型的参数;基于所述设备模型的参数,生成所述场景文字识别模型;将所述识别结果传输至目标显示设备,以及控制所述目标显示设备显示所述识别结果。2.根据权利要求1所述的一种场景文字识别方法,其特征在于,所述控制所述目标设备开始训练,包括:获取初始模型和所述初始模型的模型参数;将所述模型参数传输至所述目标设备;基于所述目标设备的本地数据,控制所述目标设备开始训练。3.根据权利要求2所述的一种场景文字识别方法,其特征在于,所述基于所述设备模型的参数,生成所述场景文字识别模型,包括:将所述设备模型的参数传输至中心服务器;控制所述中心服务器对所述设备模型的参数进行聚合,得到聚合参数;基于所述聚合参数,生成所述场景文字识别模型。4.根据权利要求3所述的一种场景文字识别方法,其特征在于,所述将所述设备模型的参数传输至中心服务器,包括:基于预设加密方法,对所述设备模型的参数进行加密;响应于确定所述加密完成,将加密后的设备模型的参数传输至所述中心服务器。5.根据权利要求3所述的一种场景文字识别方法,其特征在于,所述控制所述中心服务器对所述设备模型的参数进行聚合,得到聚合参数,包括:基于预设聚合...

【专利技术属性】
技术研发人员:李振飞张金义王瑞杨刘伟赫
申请(专利权)人:新智数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1