文本标注方法、装置及存储介质制造方法及图纸

技术编号:24757933 阅读:42 留言:0更新日期:2020-07-04 09:33
本发明专利技术实施例公开了一种文本标注方法、装置及存储介质。本发明专利技术实施例可以获取基准图像,标注基准图像中目标区域的多个角点坐标以及目标区域中的文本位置坐标,获取目标图像,分别标记目标图像中目标区域的多个角点,以得到目标图像中的多个角点坐标,根据基准图像中的多个角点坐标和目标图像中的多个角点坐标计算透视变换矩阵,根据透视变换矩阵和基准图像中的文本位置坐标计算目标图像中的文本位置坐标。本申请实施例可以通过对基准图像进行预处理后,计算与目标图像之间的透视变换矩阵,从而计算出目标图像中的文本位置,可以快速对图像中的文本位置进行识别并标注,大幅提升了文本标注的效率。

Text annotation method, device and storage medium

【技术实现步骤摘要】
文本标注方法、装置及存储介质
本专利技术涉及数据处理领域,具体涉及一种文本标注方法、装置及存储介质。
技术介绍
目前,随着人工智能进程的不断发展,文字识别也成为了该进程中不可或缺的一环。文字识别便是依靠计算机视觉技术,其主要分为图像中文字检测和文字内容识别两个部分。其中,文字检测的主要作用是定位图像中文字的位置便于后期对文字的识别。因此,文字检测在整个文字识别过程中有着至关重要的作用。比如在检测证件当中的文本时,可以通过大量样本训练后的证件文本检测算法模型来进行识别。在训练证件文本检测算法模型时,需要对拍摄到的大量证件照中的文本位置进行标注,但目前标注工作一直是以人工标注的方式来进行,一人一天能标注约200张,以每天工作6小时算,平均标注一张需要108秒。若采集证件图片较多时,人工标注将耗费大量的时间,效率非常低。如需对算法使用大量全面的训练样本集进行训练,所需时间非常长,不利于对算法进行快速的参数调优验证。
技术实现思路
本专利技术实施例提供一种文本标注方法、装置及存储介质,旨在快速对图像中的文本位置进行识别并标注,大幅提升了文本标注的效率。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种文本标注方法,所述方法包括:获取基准图像,标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标;获取目标图像,分别标记所述目标图像中所述目标区域的多个角点,以得到所述目标图像中的多个角点坐标;根据所述基准图像中的多个角点坐标和所述目标图像中的多个角点坐标计算透视变换矩阵;根据所述透视变换矩阵和所述基准图像中的文本位置坐标计算所述目标图像中的文本位置坐标。一种文本标注装置,包括:第一获取单元,用于获取基准图像,标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标;第二获取单元,用于获取目标图像,分别标记所述目标图像中所述目标区域的多个角点,以得到所述目标图像中的多个角点坐标;第一计算单元,用于根据所述基准图像中的多个角点坐标和所述目标图像中的多个角点坐标计算透视变换矩阵;第二计算单元,用于根据所述透视变换矩阵和所述基准图像中的文本位置坐标计算所述目标图像中的文本位置坐标。一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述文本标注方法中的步骤。本申请提供的实施例可以获取基准图像,标注基准图像中目标区域的多个角点坐标以及目标区域中的文本位置坐标,获取目标图像,分别标记目标图像中目标区域的多个角点,以得到目标图像中的多个角点坐标,根据基准图像中的多个角点坐标和目标图像中的多个角点坐标计算透视变换矩阵,根据透视变换矩阵和基准图像中的文本位置坐标计算目标图像中的文本位置坐标。本申请实施例可以通过对基准图像进行预处理后,计算与目标图像之间的透视变换矩阵,从而计算出目标图像中的文本位置,可以快速对图像中的文本位置进行识别并标注,大幅提升了文本标注的效率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的文本标注系统的一种场景示意图;图2是本专利技术实施例提供的文本标注方法的一种流程示意图;图3是本专利技术实施例提供的文本标注方法的另一流程示意图;图4为本申请实施例提供的一种基准图像的示意图;图5为本专利技术实施例提供的文本标注装置的结构示意图;图6为本专利技术实施例提供的文本标注装置的另一种结构示意图;图7是本专利技术实施例提供的终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本专利技术实施例提供一种文本标注方法,该文本标注方法的执行主体可以是本专利技术实施例提供的文本标注装置,或者集成了该文本标注装置的服务器,其中该文本标注装置可以采用硬件或者软件的方式实现。请参阅图1,图1为本专利技术实施例所提供的文本标注系统的场景示意图,包括:终端10和服务器20,比如上述终端10可以为基于安卓系统的终端或者基于IOS系统的终端,还可以为基于Windows系统或者MAC系统的PC等等。终端10与服务器20之间可以通过通信网络连接,该通信网络,包括无线网络以及有线网络,其中无线网络包括无线广域网、无线局域网、无线城域网、以及无线个人网中的一种或多种的组合。网络中包括路由器、网关等等网络实体,图中并未示意出。终端10可以通过通信网络与服务器20进行信息交互,比如可以从服务器20下载应用。该文本标注系统可以包括文本标注装置,该文本标注装置具体可以集成在平板电脑、电视、手机、笔记本电脑、台式电脑等具备储存单元并安装有微处理器而具有运算能力的终端中,在图1中,该终端即为图1中的终端10,该终端10中可以包括摄像头,用来拍摄目标图像。该终端10可以通过摄像头获取目标图像后发送至服务器20,并接收服务器20根据目标图像返回的目标图像中的文本位置坐标,终端10接收到文本位置坐标后可以根据坐标生成标注框并展示。该文本标注系统还可以包括服务器20,主要用于接收终端10发送的目标图像,然后根据存储的基准图像计算基准图像中的多个角点坐标和目标图像中的多个角点坐标之间的透视变换矩阵,最终根据上述变换矩阵计算目标图像中的文本位置坐标并发送至终端10。该文本标注系统还可以包括存储器,用于存储基准图像以及该基准图像中标注的目标区域的多个角点坐标以及目标区域中的文本位置坐标,以使得服务器可以从存储器中根据基准图像进行计算。需要说明的是,图1所示的文本标注系统的场景示意图,仅仅是一个示例,本专利技术实施例描述的文本标注系统以及场景是为了更加清楚的说明本专利技术实施例的技术方案,并不构成对于本专利技术实施例提供的技术方案的限定,本领域普通技术人员可知,随着文本标注系统的演变和新业务场景的出现,本专利技术实施例提供的技术方案对于类似的技术问题,同样适用。比如在其他实施例当中,上述基准图像也可以存储在终端当中,并且在终端拍摄目标图像后在终端当中进行计算并生成目标图像中的文本位置坐标,而不需要服务器以及存储器等等。以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。本文档来自技高网...

【技术保护点】
1.一种文本标注方法,其特征在于,所述方法包括:/n获取基准图像,标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标;/n获取目标图像,分别标记所述目标图像中所述目标区域的多个角点,以得到所述目标图像中的多个角点坐标;/n根据所述基准图像中的多个角点坐标和所述目标图像中的多个角点坐标计算透视变换矩阵;/n根据所述透视变换矩阵和所述基准图像中的文本位置坐标计算所述目标图像中的文本位置坐标。/n

【技术特征摘要】
1.一种文本标注方法,其特征在于,所述方法包括:
获取基准图像,标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标;
获取目标图像,分别标记所述目标图像中所述目标区域的多个角点,以得到所述目标图像中的多个角点坐标;
根据所述基准图像中的多个角点坐标和所述目标图像中的多个角点坐标计算透视变换矩阵;
根据所述透视变换矩阵和所述基准图像中的文本位置坐标计算所述目标图像中的文本位置坐标。


2.根据权利要求1所述的文本标注方法,其特征在于,获取基准图像,标注所述基准图像中目标区域的多个角点坐标的步骤,包括:
在所述基准图像中以不同颜色分别标记目标区域的多个角点;
分别计算每个颜色标记的坐标以得到所述基准图像中目标区域的多个角点坐标。


3.根据权利要求2所述的文本标注方法,其特征在于,获取目标图像,分别标记所述目标图像中所述目标区域的多个角点,以得到所述目标图像中的多个角点坐标的步骤,包括:
以所述不同颜色轮流标记所述目标区域的多个角点并在同一位置分别对所述目标区域进行拍摄,以得到多张目标图像;
分别对所述多张目标图像进行处理,识别出每张图像中对应颜色标记的坐标,以得到所述目标图像中目标区域的多个角点坐标。


4.根据权利要求3所述的文本标注方法,其特征在于,分别对所述多张目标图像进行处理,识别出每张图像中对应颜色标记的坐标的步骤包括:
分别将多所述多张目标图像转换为HSV颜色空间;
根据所述HSV颜色空间在所述每张目标图像中提取出对应的目标颜色;
通过霍夫圆变换计算所述每张目标图像中提取出对应的目标颜色在所述目标图像中对应颜色标记的坐标。


5.根据权利要求3所述的文本标注方法,其特征在于,在以所述不同颜色轮流标记所述目标区域的多个角点并在同一位置分别对所述目标区域进行拍摄,以得到多张目标图像的步骤之后,所述方法还包括:
根据所述基准图像中多个角...

【专利技术属性】
技术研发人员:唐嘉龙鲁四喜
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1