当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向医疗图像的光学字符识别方法技术

技术编号:42651713 阅读:34 留言:0更新日期:2024-09-06 01:44
本发明专利技术公开了一种面向医疗图像的光学字符识别方法,方法如下:首先训练一个卷积神经网络模型,对于给定医学图像进行图像朝向的识别,并按图像的朝向进行旋转,然后将旋转后的图像分为文档类和场景类,文档类如出院小结、门诊病例等图像或扫描件,场景类如药品包装照片。根据图像类别使用针对性的方法进行文本检测,识别出包含医学文本的图像部分,形成文本检测框。再使用基于Seq2Seq的文本识别模型,根据文本检测框识别并提取出文本内容。最后基于Transformer的关键信息抽取模型,捕捉上下文语义信息和图像的空间结构信息,推断出不同文本检测框内文本的语义关系和层次结构,组合语义相关的文本进行结构化的输出,从而完成医疗图像的光学字符识别任务。

【技术实现步骤摘要】

本专利技术涉及一种面向医疗图像的光学字符识别方法,属于光学字符识别领域。


技术介绍

1、近年来,随着数字化医疗信息的快速增长,从医疗图像中提取和识别文本的需求日益迫切。医学报告、病历、处方笺和医疗影像等都包含了大量的文本信息。然而,传统的医疗图像是以图像形式存储的,无法直接进行文本搜索和分析。因此,将医疗图像中的文本提取出来并转换为可编辑和可搜索的格式对于医疗信息的管理和利用至关重要。面向医疗图像的光学字符识别方法能够自动识别和转换医疗图像中的文本,如出院小结、门诊档案、体检结论、药品信息等。这项技术的发展将极大地提高医疗数据的可访问性和可搜索性,促进医疗信息管理和决策的效率。

2、传统的光学字符识别方法通常基于规则或模板。基于规则的光学字符识别方法通过事先定义的规则和模式来识别和提取医疗图像中的文本。这些规则可以包括字母和数字的形状、尺寸、颜色等特征。基于模板的光学字符识别方法使用预先构建的模板来匹配和识别医疗图像中的文本。这些模板可以是字符、单词或特定的文本模式。通过与模板的匹配,识别和提取文本信息。此外机器学习方法在医疗图像光学字符识别方本文档来自技高网...

【技术保护点】

1.一种面向医疗图像的光学字符识别方法,其特征在于,该方法包括如下步骤:

2.根据权利要求1所述的面向医疗图像的光学字符识别方法,其特征在于,所述步骤1中,按照如下方式调整图片的方向:

3.根据权利要求1所述的面向医疗图像的光学字符识别方法,其特征在于,所述步骤1中对文档类分类任务流程如下:模型采用与调整图像朝向的卷积神经网络相同的架构,训练图像为标记为文档类医疗图像和场景类医疗图像。

4.根据权利要求3所述的面向医疗图像的光学字符识别方法,其特征在于,针对文档类医疗图像的处理流程如下:

5.根据权利要求3所述的面向医疗图像的光学字符识别方...

【技术特征摘要】

1.一种面向医疗图像的光学字符识别方法,其特征在于,该方法包括如下步骤:

2.根据权利要求1所述的面向医疗图像的光学字符识别方法,其特征在于,所述步骤1中,按照如下方式调整图片的方向:

3.根据权利要求1所述的面向医疗图像的光学字符识别方法,其特征在于,所述步骤1中对文档类分类任务流程如下:模型采用与调整图像朝向的卷积神经网络相同的架构,训练图像为标记为文档类医疗图像和场景类医疗图像。

4.根据权利要求3所述的面向医疗图像的光学字...

【专利技术属性】
技术研发人员:胡天喆吴天星朱益鹏
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1