【技术实现步骤摘要】
本专利技术属于数据识别领域,尤其是一种基于ocr和mllm的医疗表单数据识别方法及系统。
技术介绍
1、医疗表单数据的智能识别和结构化是医疗信息化建设的重要基础。大量的检验报告、处方单、病历等医疗表单包含了患者的关键健康信息,将这些非结构化的表单数据转换为标准化的电子信息,对于提升医疗效率、支持临床决策、促进医疗大数据分析具有重要意义。自动化的表单数据识别技术可以减少人工录入工作量,降低数据错误率,加速医疗数据的数字化进程,为智慧医疗的发展提供数据支撑。
2、目前,医疗表单数据识别主要采用传统ocr技术与规则模板相结合的方法。典型的处理流程包括图像预处理、文本检测、字符识别和模板匹配等步骤。部分研究通过引入深度学习技术提升了文字识别的准确率,如采用cnn进行特征提取,使用lstm进行序列建模,或利用transformer增强对长文本的处理能力。在表单结构分析方面,主要依靠预定义的版面分析规则和固定的表格解析模板,通过边缘检测、连通域分析等计算机视觉技术实现表格线条的识别和单元格的划分。
3、然而,现有技术在处理医
...【技术保护点】
1.基于OCR和MLLM的医疗表单数据识别方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于OCR和MLLM的医疗表单数据识别方法,其特征在于,步骤S1进一步为:
3.根据权利要求2所述的基于OCR和MLLM的医疗表单数据识别方法,其特征在于,步骤S2进一步为:
4.根据权利要求3所述的基于OCR和MLLM的医疗表单数据识别方法,其特征在于,步骤S3进一步为:
5.根据权利要求4所述的基于OCR和MLLM的医疗表单数据识别方法,其特征在于,步骤S4进一步为:
6.根据权利要求5所述的基于OCR和M
...【技术特征摘要】
1.基于ocr和mllm的医疗表单数据识别方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于ocr和mllm的医疗表单数据识别方法,其特征在于,步骤s1进一步为:
3.根据权利要求2所述的基于ocr和mllm的医疗表单数据识别方法,其特征在于,步骤s2进一步为:
4.根据权利要求3所述的基于ocr和mllm的医疗表单数据识别方法,其特征在于,步骤s3进一步为:
5.根据权利要求4所述的基于ocr和mllm的医疗表单数据识别方法,其特征在于,步骤s4进一步为:
...【专利技术属性】
技术研发人员:吴浩然,郑克超,徐波,
申请(专利权)人:中科南京人工智能创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。