【技术实现步骤摘要】
一种弱监督文本检测方法
本专利技术涉及图像识别领域,尤其涉及一种弱监督文本检测方法。
技术介绍
文字承载了丰富和准确的高级语义信息,人们可以通过文字传达思想和情感,它代表着人类文明的发展,是人与人交流的载体。文字检测是多项计算机智能任务的前置步骤,其目标是从给定的图像中,尽可能定位出文字所在区域。场景文本检测是以自然场景为背景进行文字定位,在即时视觉翻译、图像检索、场景解析、自动阅卷、地理位置和无人驾驶等众多应用中,有着至关重要的作用。场景文字检测,其难度远大于检测扫描文档图像中的文字位置,其文字表达方式更为丰富多变,如:·允许多种语言文本混合,字符可以有不同的大小、字体、颜色、亮度、对比度等。·文本行可能有横向、竖向、弯曲、旋转、扭曲等式样,相比于常规物体,文字行长度、长宽比例变化范围很大。·图像中的文字区域还可能会产生变形(透视、仿射变换)、残缺、模糊等现象。·自然场景图像的背景极其多样。如文字可以出现在平面、曲面或折皱面上;文字区域附近有复杂的干扰纹理、或者非文字区域有近似文字的 ...
【技术保护点】
1.一种弱监督文本检测方法,其特征在于,包括:/n构建感受野生成器,将待检测图像输入所述感受野生成器,获取一个或多个感受野,并根据所述一个或多个感受野感知文本区域;/n构建感受野判别器,将所述文本区域输入所述感受野判别器,根据文本在所述文本区域的分布,获取识别结果;/n将所述识别结果反馈给所述感受野生成器,对所述一个或多个感受野进行校正,通过校正后的所述感受野生成器输出文本特征图。/n
【技术特征摘要】
1.一种弱监督文本检测方法,其特征在于,包括:
构建感受野生成器,将待检测图像输入所述感受野生成器,获取一个或多个感受野,并根据所述一个或多个感受野感知文本区域;
构建感受野判别器,将所述文本区域输入所述感受野判别器,根据文本在所述文本区域的分布,获取识别结果;
将所述识别结果反馈给所述感受野生成器,对所述一个或多个感受野进行校正,通过校正后的所述感受野生成器输出文本特征图。
2.根据权利要求1所述的弱监督文本检测方法,其特征在于,可将所述文本特征图输入一个或多个文本识别模型,获取所述文本特征图中的文本信息。
3.根据权利要求1所述的弱监督文本检测方法,其特征在于,采用U型全卷积网络构建所述感受野生成器。
4.根据权利要求1所述的弱监督文本检测方法,其特征在于,所述感受野判别器包括卷积层、循环层和转录层,通过所述卷积层进行特征提取,获取所述文本区域的特征序列;
通过所述循环层对所述特征序列进行分类,判断所述文本区域内是否包含文本,若是,则获...
【专利技术属性】
技术研发人员:李莉,朱世宇,陈善雄,许枭飞,帅鹏举,
申请(专利权)人:西南大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。