一种病理切片标签识别方法技术

技术编号：25309744 阅读：24 留言：0更新日期：2020-08-18 22:28

本发明专利技术公开一种一种病理切片标签识别方法，采用深度学习方法对病理切片标签图像进行识别，所述深度学习采用的模型的基础网络为基于ResNet‑50的RetinaNet网络，以及用于帮助基础网络识别方向敏感的字符的模块，所述模块包括垂直自注意力机制分支、水平自注意力机制分支和中间分支，模块的融合方法为：O＝C

全部详细技术资料下载

【技术实现步骤摘要】
一种病理切片标签识别方法
本专利技术涉及医疗检测领域，尤其涉及一种病理切片标签识别方法。
技术介绍
目前病理切片标签识别的方法之一为光学字符识别(OCR)。主流的OCR算法都包含以下两步：1、检测场景中的文字；2、识别检测出来的文字。上述步骤中第一步的输出通常为一个词或一行文字的位置信息，目前使用的技术大多基于通用的目标检测算法；第二根据第一步的检测结果将相应的文字从图中裁剪出来并缩放为固定高度的图像后使用基于CTC或注意力机制的方法进行识别，并且它们在识别的时候通常都假定文字是满足正向并且是从左向右的。目前大多数的研究都关注于第一步，并且主要的关注点在于如何识别不规则的文字。主流的OCR算法直接应用于病理切片标签识别存在着以下问题：1、目前主流的OCR技术需要大量的训练数据，通常第一步需要10k～50k的标注数据，而第二步通常需要超过1000k的训练数据，要收集这个量级的病理切片数据几乎是不可能的，本专利所使用的标注数据不到2000个，远远小于主流OCR技术所使用的数据量；2、主流的OCR技术大多专注于如何检测不规则的文字，如图1所示，病理切片的标签是通过数字切片扫描仪扫描出来的，如图2所示，几乎不存在变形；3、病理切片的标签中的文字可以为任何方向(在同一个标签中可能同时存在不同的方向)，主流的OCR技术对这方面关注较少，大多数OCR方法直接假定文字是向上，从左到右排列的；4、主流的OCR检测的多为自然语言，识别的目标为词，词与词之间存在语义相关性，而...

【技术保护点】
1.一种病理切片标签识别方法，其特征在于：采用深度学习方法对病理切片标签图像进行识别，所述深度学习采用的模型的基础网络为基于ResNet-50的RetinaNet网络，以及用于帮助基础网络识别方向敏感的字符的模块，所述模块包括垂直自注意力机制分支、水平自注意力机制分支和中间分支，模块的融合方法为：/nO＝C

【技术特征摘要】
1.一种病理切片标签识别方法，其特征在于：采用深度学习方法对病理切片标签图像进行识别，所述深度学习采用的模型的基础网络为基于ResNet-50的RetinaNet网络，以及用于帮助基础网络识别方向敏感的字符的模块，所述模块包括垂直自注意力机制分支、水平自注意力机制分支和中间分支，模块的融合方法为：
O＝Cvβ+Ch(1-β)(1)
式(1)中：O表示输出，Cv表示垂直自注意力机制分支，Ch表示水平自注意力机制分支，β为中间分支的输出结果。

2.根据权利要求1所述的病理切片标签识别方法，其特征在于：所述模型的最顶层Anchorbox的比例为1:1,1:7,和7:1，中间层的Anchorbox比例为1:1,1:5和5:1；最底层的Anchorbox比例为1:1,1:2和2:1。

3.根据权利要求1所述的病理切片标签识别方法，其特征在于：所述基础网络的最顶层输出网络与中间层输出网络共享权重，最底层的网络使用单独的权重。

4.根据权利要求1-3任一项所述的病理切片标签识别方法，其特征在于：训练网络的损失函数如下：
L＝Lcls(p,u)+λ[u≥1]Lloc(tu,v)+γLdre(p,w)(2)
式(2)中：Lcls(p,u)＝-logpu,u为输出结果中目标框的类型，其中背景的类别编号为0,Lloc为目标框的回归损失，Ldre(p,w)＝-logpw，w为输出结果中目标框的方向，λ，γ为相应损失的权重。

5.根据权利要求4所述的病理切片标签识别方法，其特征在于：λ为10，γ为1。...

【专利技术属性】
技术研发人员：王杰，郑众喜，向旭辉，陈杰，
申请(专利权)人：四川大学华西医院，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人