【技术实现步骤摘要】
文本检测方法、设备、存储介质及装置
[0001]本专利技术涉及文本检测
,尤其涉及一种文本检测方法、设备、存储介质及装置。
技术介绍
[0002]目前,可以利用深度学习目标检测技术完成相关自然场景文本检测。但是,在实际应用中,上述技术存在对小目标文本漏检,长文本检测效果差的缺陷。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0004]本专利技术的主要目的在于提供一种文本检测方法、设备、存储介质及装置,旨在解决现有场景文本检测方式存在对小目标文本漏检,长文本检测效果差的技术问题。
[0005]为实现上述目的,本专利技术提供一种文本检测方法,所述文本检测方法包括以下步骤:
[0006]在接收到文本检测指令时,获取待检测图像;
[0007]通过预设残差网络模型对所述待检测图像进行文本检测,获得文本检测结果,所述预设残差网络模型中包含特征金字塔结构和多头注意力结构。
[0008]可选地,所述通过预设残差网络模型 ...
【技术保护点】
【技术特征摘要】
1.一种文本检测方法,其特征在于,所述文本检测方法包括以下步骤:在接收到文本检测指令时,获取待检测图像;通过预设残差网络模型对所述待检测图像进行文本检测,获得文本检测结果,所述预设残差网络模型中包含特征金字塔结构和多头注意力结构。2.如权利要求1所述的文本检测方法,其特征在于,所述通过预设残差网络模型对所述待检测图像进行文本检测,获得文本检测结果的步骤,包括:通过预设残差网络模型中的特征金字塔结构对所述待检测图像进行处理,获得多张特征图;通过预设残差网络模型中的多头注意力结构对所述特征图进行检测,获得文本检测结果。3.如权利要求2所述的文本检测方法,其特征在于,所述通过预设残差网络模型中的多头注意力结构对所述特征图进行检测,获得文本检测结果的步骤,包括:对所述特征图进行处理,获得关键图、查询图以及值图;根据所述关键图、所述查询图以及所述值图通过预设残差网络模型中的多头注意力结构,获得文本检测结果。4.如权利要求3所述的文本检测方法,其特征在于,所述根据所述关键图、所述查询图以及所述值图通过预设残差网络模型中的多头注意力结构,获得文本检测结果的步骤,包括:通过预设相似度模型确定所述关键图与所述查询图的相似度,并根据所述相似度确定所述多头注意力结构的权重值;根据所述权重值、所述关键图、所述查询图以及所述值图通过预设残差网络模型中的多头注意力结构,获得文本检测结果。5.如权利要求1至4中任一项所述的文本检测方法,其特征在于,所述在接收到文本检测指令时,获取待检测图像...
【专利技术属性】
技术研发人员:江大山,胡传锐,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。