文本标注方法、装置及存储介质制造方法及图纸

技术编号：24757933 阅读：42 留言：0更新日期：2020-07-04 09:33

本发明专利技术实施例公开了一种文本标注方法、装置及存储介质。本发明专利技术实施例可以获取基准图像，标注基准图像中目标区域的多个角点坐标以及目标区域中的文本位置坐标，获取目标图像，分别标记目标图像中目标区域的多个角点，以得到目标图像中的多个角点坐标，根据基准图像中的多个角点坐标和目标图像中的多个角点坐标计算透视变换矩阵，根据透视变换矩阵和基准图像中的文本位置坐标计算目标图像中的文本位置坐标。本申请实施例可以通过对基准图像进行预处理后，计算与目标图像之间的透视变换矩阵，从而计算出目标图像中的文本位置，可以快速对图像中的文本位置进行识别并标注，大幅提升了文本标注的效率。

Text annotation method, device and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
文本标注方法、装置及存储介质
本专利技术涉及数据处理领域，具体涉及一种文本标注方法、装置及存储介质。
技术介绍
目前，随着人工智能进程的不断发展，文字识别也成为了该进程中不可或缺的一环。文字识别便是依靠计算机视觉技术，其主要分为图像中文字检测和文字内容识别两个部分。其中，文字检测的主要作用是定位图像中文字的位置便于后期对文字的识别。因此，文字检测在整个文字识别过程中有着至关重要的作用。比如在检测证件当中的文本时，可以通过大量样本训练后的证件文本检测算法模型来进行识别。在训练证件文本检测算法模型时，需要对拍摄到的大量证件照中的文本位置进行标注，但目前标注工作一直是以人工标注的方式来进行，一人一天能标注约200张，以每天工作6小时算，平均标注一张需要108秒。若采集证件图片较多时，人工标注将耗费大量的时间，效率非常低。如需对算法使用大量全面的训练样本集进行训练，所需时间非常长，不利于对算法进行快速的参数调优验证。
技术实现思路
本专利技术实施例提供一种文本标注方法、装置及存储介质，旨在快速对图像中的文本位置进行识别并标注，大幅提升了文本标注的效率。为解决上述技术问题，本专利技术实施例提供以下技术方案：一种文本标注方法，所述方法包括：获取基准图像，标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标；获取目标图像，分别标记所述目标图像中所述目标区域的多个角点，以得到所述目标图像中的多个角点坐标；根据所述基准图像中的多个角点坐标和所述目标...

【技术保护点】
1.一种文本标注方法，其特征在于，所述方法包括：/n获取基准图像，标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标；/n获取目标图像，分别标记所述目标图像中所述目标区域的多个角点，以得到所述目标图像中的多个角点坐标；/n根据所述基准图像中的多个角点坐标和所述目标图像中的多个角点坐标计算透视变换矩阵；/n根据所述透视变换矩阵和所述基准图像中的文本位置坐标计算所述目标图像中的文本位置坐标。/n

【技术特征摘要】
1.一种文本标注方法，其特征在于，所述方法包括：
获取基准图像，标注所述基准图像中目标区域的多个角点坐标以及所述目标区域中的文本位置坐标；
获取目标图像，分别标记所述目标图像中所述目标区域的多个角点，以得到所述目标图像中的多个角点坐标；
根据所述基准图像中的多个角点坐标和所述目标图像中的多个角点坐标计算透视变换矩阵；
根据所述透视变换矩阵和所述基准图像中的文本位置坐标计算所述目标图像中的文本位置坐标。

2.根据权利要求1所述的文本标注方法，其特征在于，获取基准图像，标注所述基准图像中目标区域的多个角点坐标的步骤，包括：
在所述基准图像中以不同颜色分别标记目标区域的多个角点；
分别计算每个颜色标记的坐标以得到所述基准图像中目标区域的多个角点坐标。

3.根据权利要求2所述的文本标注方法，其特征在于，获取目标图像，分别标记所述目标图像中所述目标区域的多个角点，以得到所述目标图像中的多个角点坐标的步骤，包括:
以所述不同颜色轮流标记所述目标区域的多个角点并在同一位置分别对所述目标区域进行拍摄，以得到多张目标图像；
分别对所述多张目标图像进行处理，识别出每张图像中对应颜色标记的坐标，以得到所述目标图像中目标区域的多个角点坐标。

4.根据权利要求3所述的文本标注方法，其特征在于，分别对所述多张目标图像进行处理，识别出每张图像中对应颜色标记的坐标的步骤包括：
分别将多所述多张目标图像转换为HSV颜色空间；
根据所述HSV颜色空间在所述每张目标图像中提取出对应的目标颜色；
通过霍夫圆变换计算所述每张目标图像中提取出对应的目标颜色在所述目标图像中对应颜色标记的坐标。

5.根据权利要求3所述的文本标注方法，其特征在于，在以所述不同颜色轮流标记所述目标区域的多个角点并在同一位置分别对所述目标区域进行拍摄，以得到多张目标图像的步骤之后，所述方法还包括：
根据所述基准图像中多个角...

【专利技术属性】
技术研发人员：唐嘉龙，鲁四喜，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人