【技术实现步骤摘要】
一种文本检测模型的建立方法、文本检测方法及装置
[0001]本专利技术涉及人工智能
,具体涉及一种文本检测模型的建立方法、文本检测方法及装置。
技术介绍
[0002]文本检测是图像处理领域中一个分支,随着技术的发展,文本检测得到了越来越广泛的应用,比如车牌识别、发票识别和拍图识字等。
[0003]现有技术中,文本检测是基于人工标注的文本图片作为模型的训练数据,然后对训练数据进行特征提取,基于提取的特征数据对模型进行训练得到文本检测模型。在特征提取的时候,由于特征提取不够充分,导致训练得到的文本检测模型的准确率不高。
技术实现思路
[0004]针对现有技术中的问题,本专利技术实施例提供一种文本检测模型的建立方法、文本检测方法及装置,能够至少部分地解决现有技术中存在的问题。
[0005]第一方面,本专利技术提出一种文本检测模型的建立方法,包括:
[0006]获取文本检测训练数据;
[0007]基于所述文本检测训练数据和原始模型,训练获得文本检测模型;其中,所述原始模型包括特征 ...
【技术保护点】
【技术特征摘要】
1.一种文本检测模型的建立方法,其特征在于,包括:获取文本检测训练数据;基于所述文本检测训练数据和原始模型,训练获得文本检测模型;其中,所述原始模型包括特征提取模块,所述特征提取模块包括多个级联的特征提取单元,每个特征提取单元包括依次相连的卷积池化子单元和注意力子单元。2.根据权利要求1所述的方法,其特征在于,所述基于所述文本检测训练数据和原始模型,训练获得文本检测模型包括:通过每个特征提取单元包括的卷积池化子单元对输入图像进行特征提取,获得特征提取图;通过每个特征提取单元包括的注意力子单元对特征提取图进行特征增强处理,获得增强特征图。3.根据权利要求2所述的方法,其特征在于,每个注意力子单元包括权重提取通道和时序特征提取通道,其中:所述权重提取通道包括第一卷积层、第一图像重构层、第二卷积层、第二图像重构层、归一化层、第三卷积层、第一标准化层、第一激活层和第四卷积层;所述时序特征提取通道包括时序提取层;所述第一卷积层、所述第二卷积层和所述时序提取层的输入端分别与对应的卷积池化子单元的输出端相连;所述第一卷积层的输出端与所述第一图像重构层的输入端相连,所述第二卷积层的输出端与所述第二图像重构层的输入端相连,所述第二图像重构层的输出端与所述归一化层的输入端相连,所述第一图像重构层的输出结果与所述归一化层的输出结果的叉乘结果作为所述第三卷积层的输入,所述第三卷积层的输入端与所述第一标准化层的输入端相连,所述第一标准化层的输出端与所述第一激活层的输入端相连,所述第一激活层的输出结果与所述时序提取层的输出结果的点乘结果作为所述第四卷积层的输入。4.根据权利要求2所述的方法,其特征在于,每个注意力子单元包括权重提取通道和时序特征提取通道,其中:所述权重提取通道包括依次连接的第五卷积层、全局池化层、第六卷积层、第二标准化层和第二激活层,所述时序特征提取通道包括时序提取层;所述第五卷积层和所述时序提取层的输入端与对应的卷积池化子单元的输出端相连;所述...
【专利技术属性】
技术研发人员:唐月标,叶泽锐,黄镜澄,张丹枫,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。