基于大语言模型的医疗专业精标语料库建设方法及系统技术方案

技术编号:41326823 阅读:15 留言:0更新日期:2024-05-13 15:04
本发明专利技术提供基于大语言模型的医疗专业精标语料库建设方法及系统,方法包括:利用大语言模型对病历文本进行初步的预标注;开发设计适应复杂JSON结构的实现查看和编辑功能的UI界面;在UI界面上对预标注的JSON结构化数据进行校对,纠正错误,补充缺失信息,删除不相关或错误数据。本发明专利技术通过创新设计大模型预标注和UI界面,使用大模型进行预标注,提高初始数据处理速度,实现JSON结构数据可视化展示以及高亮显示和方便的编辑功能,提高标注效率,能够处理高度复杂的医疗文本数据,大幅降低人工标注成本;本发明专利技术用推动了医疗数据分析领域的进步,为相关医疗项目提供高效准确的数据支持,显著提高了病历文本数据处理的效率和准确性。

【技术实现步骤摘要】

本专利技术涉及信息,特别地,涉及应用于医疗行业的精标语料生成;具体而言,涉及一种基于大语言模型的医疗专业精标语料库建设方法及系统


技术介绍

1、随着自然语言处理技术的发展,在医疗领域也已得到应用,比如,构建医学语料库、医疗专病库、临床治疗语料库等。医学语料库可帮助医生更快速、准确地了解病症和病情,提高医学专业能力;也可通过对医学语料库、医疗专病库、临床治疗语料库的挖掘和分析,发现疾病之间的关联性、病因与病症的关系等重要信息,为医学领域的科学研究和临床实践提供支持。

2、总之,语料库的构建可以提升医疗服务效率,支持医学研究和教育,推动医疗智能化发展,更好地为患者提供高质量的医疗服务。在医疗专业的语料库领域,实现自动化地从病历文本中提取特定信息并转化为结构化的json描述,是一项具有挑战性的任务。

3、目前,现有的从病历文本中提取特定信息并转化为json结构化数据描述的实现方案,主要集中在以下两个方面:

4、医学数据标注平台、临床nlp(自然语言处理)工具在医疗文本分析中的应用。

5、一、医学数据标注平台提供了本文档来自技高网...

【技术保护点】

1.基于大语言模型的医疗专业精标语料库建设方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述S2步骤的开发设计适应复杂JSON结构的实现查看和编辑功能的UI界面的方法包括以下步骤:

3.根据权利要求2所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述S23步骤的加载出的JSON数据的内容在JSON区域进行数据编辑后,编辑内容将保存以备后用;

4.根据权利要求2所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述S21的数据列表以患者ID为唯一ID,所述数据...

【技术特征摘要】

1.基于大语言模型的医疗专业精标语料库建设方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述s2步骤的开发设计适应复杂json结构的实现查看和编辑功能的ui界面的方法包括以下步骤:

3.根据权利要求2所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述s23步骤的加载出的json数据的内容在json区域进行数据编辑后,编辑内容将保存以备后用;

4.根据权利要求2所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述s21的数据列表以患者id为唯一id,所述数据列表以列表形式呈现于ui界面的左侧,下方可翻页。

5.根据权利要求2所述的基于大语言模型的医疗专业精标语料库建设方法,其特征在于,所述s22步骤的根据文书类型的不同进行两级的归类的切换方法包括:

【专利技术属性】
技术研发人员:徐辉高志崔洪男曾虎城何思雨
申请(专利权)人:元场科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1