医学影像信息的处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号:28042190 阅读:38 留言:0更新日期:2021-04-09 23:25
本公开提供了一种医学影像信息的处理方法、装置、电子设备和存储介质,涉及计算机技术领域。其中,处理方法包括:对用于进行训练的第一医学影像信息进行字段划分,按照预设的医学标签对字段进行多个粒度的标注,医学标签包括发病部位和病例类型组合构成的第一标签;对标注后的字段中的字进行遮挡处理,根据标注后的字段和衍生字段构成的训练集对识别模型进行训练;获取待识别的第二医学影像信息,并通过训练后的识别模型对第二医学影像信息中的字段进行分类识别;对所述分类识别后的属于同一关键字段的标注进行合并,并将合并后的标注对应的所述关键字段以键值形式输出。通过本公开的技术方案,提高了提取医学影像信息的关键信息的效率和可靠性。

【技术实现步骤摘要】
医学影像信息的处理方法、装置、电子设备和存储介质
本公开涉及信息处理
,尤其涉及一种医学影像信息的处理方法、装置、电子设备和存储介质。
技术介绍
随着互联网+、信息技术以及配套硬件措施的升级,医疗健康、保险领域的数据也呈井喷式、爆炸性的增长,相比于传统场景下的数据,医疗健康类型的“大数据”有着明显的特点:数据体量大、数据类型复杂、数据形态众多、数据价值密度低等。但是,医疗健康作为国家和社会发展的基础民生行业,其医疗数据中蕴含着巨大的价值,一方面,快速提取医疗健康数据的关键信息,有利于为医生或医疗机构快速确诊,另一方面,有利于对病例进行统计分析,以确定患病原因或传播路径,再一方面,对于商业保险公司,可以对核保、承保、理赔等主要流程业务提供专业、高效、实时的决策分析信息。相关技术中,肿瘤影像是X线、CT(Computedtomography,计算机断层扫描)、MRI(Magneticresonanceimaging,磁共振成像)、PET(Positronemissiontomography,正电子发射断层扫描)和PET-CT(PET与本文档来自技高网...

【技术保护点】
1.一种医学影像信息的处理方法,其特征在于,包括:/n对用于进行训练的第一医学影像信息进行字段划分,按照预设的医学标签对所述字段进行多个粒度的标注,所述医学标签包括发病部位和病例类型组合构成的第一标签;/n对标注后的所述字段中的字进行遮挡处理,以生成衍生字段,根据标注后的所述字段和所述衍生字段构成的训练集对识别模型进行训练;/n获取待识别的第二医学影像信息,并通过所述训练后的识别模型对所述第二医学影像信息中的字段进行分类识别;/n对所述分类识别后的属于同一关键字段的标注进行合并,并将合并后的标注对应的所述关键字段以键值形式输出。/n

【技术特征摘要】
1.一种医学影像信息的处理方法,其特征在于,包括:
对用于进行训练的第一医学影像信息进行字段划分,按照预设的医学标签对所述字段进行多个粒度的标注,所述医学标签包括发病部位和病例类型组合构成的第一标签;
对标注后的所述字段中的字进行遮挡处理,以生成衍生字段,根据标注后的所述字段和所述衍生字段构成的训练集对识别模型进行训练;
获取待识别的第二医学影像信息,并通过所述训练后的识别模型对所述第二医学影像信息中的字段进行分类识别;
对所述分类识别后的属于同一关键字段的标注进行合并,并将合并后的标注对应的所述关键字段以键值形式输出。


2.根据权利要求1所述的医学影像信息的处理方法,其特征在于,所述医学标签还包括所述发病部位的第二标签和所述病例类型的第三标签,对用于进行训练的第一医学影像信息进行字段划分,按照预设的医学标签对所述字段进行多个粒度的标注包括:
对所述第一医学影像信息进行字段划分,按照所述第一标签、所述第二标签和所述第三标签对所述字段进行标注,以分别生成第一粒度的第一带标注字段、第二粒度的第二带标注字段和第三粒度的第三带标注字段。


3.根据权利要求1所述的医学影像信息的处理方法,其特征在于,对用于进行训练的第一医学影像信息进行字段划分,按照预设的医学标签对所述字段进行多个粒度的标注还包括:
对用于进行训练的第一医学影像信息进行字段划分,并确定所述字段中的数值字段;
根据所述数值字段的类型,对所述数值字段进行格式标准化。


4.根据权利要求3所述的医学影像信息的处理方法,其特征在于,对用于进行训练的第一医学影像信息进行字段划分,按照预设的医学标签对所述字段进行多个粒度的标注还包括:
对所述第一医学影像信息进行字段划分,确定同一个字段的多个描述字段;
确定多个所述描述字段中的最大范围对应的字段;
按照预设的医学标签对所述最大范围对应的字段进行标注。


5.根据权利要求1-4中任一项所述的医学影像信息的处理方法,其特征在于,对标注后的所述字段中的字进行遮挡处理,以生成衍生字段,根据标注后的所述字段和所述衍生字段构成的训练集对识别模型进行训练包括:
按照预设比例将所述标注后的字段生成训练集、验证集和测试集;
通过所述训练集对BERT模型进行训练,所述BERT模型的参数架构为面向中文的12层和768隐层;
通过所述验证集生成所述训练后的BERT模型进行验证,以获得所述BERT模型的准确率和平均损失;
确定使所述训...

【专利技术属性】
技术研发人员:闫静静潘超孟文宇汤晋军白皎
申请(专利权)人:泰康保险集团股份有限公司泰康养老保险股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1