基于大语言模型的临床数据处理方法、装置及存储介质制造方法及图纸

技术编号:46439851 阅读:5 留言:0更新日期:2025-09-19 20:42
本发明专利技术涉及一种基于大语言模型的临床数据处理,尤其在脊柱疾病临床文本数据结构化处理方法方面,属于人工智能和医学交叉领域,该方法包括:基于大语言模型对脊柱疾病临床文本数据进行预处理,特征提取,然后进行语法约束解码,再结合术语重要性权重和脊柱疾病临床相关性,计算复制概率,最后进行一致性检查,生成结构化目标数据。本发明专利技术所述的方法和装置,可以提高脊柱解剖学术语识别准确率和问诊效率。

【技术实现步骤摘要】

本专利技术属于人工智能与医学交叉领域,尤其涉及一种基于大语言模型的临床数据处理方法、装置及存储介质


技术介绍

1、当前脊柱疾病临床诊疗面临三大技术瓶颈:非结构化问诊数据难以有效利用、专业医学术语识别准确率不足和临床决策缺乏结构化数据支持。传统电子病历系统依赖人工录入,效率低下,准确率低,例如:医护人员平均需花费15分钟完成单份病历录入,其中60%时间用于处理症状描述的结构化转换,约18%的临床实体因表述差异导致录入错误,30%的治疗方案记录存在时序逻辑错误。现有自然语言处理技术在脊柱疾病领域表现欠佳,测试数据显示,通用ner模型在脊柱解剖学术语识别上的f1值仅为0.63,症状持续时间提取准确率不足55%,治疗方案与解剖位置关联错误率达22%。

2、临床实践中的特殊挑战包括:脊柱疾病症状描述具有显著的空间特性(如“l4神经根支配区放射痛”),现有模型难以准确解析解剖位置与症状的对应关系;治疗随访记录包含复杂的时间序列信息,传统方法无法有效建模症状演变过程;医学术语存在大量变体表达(如“acdf”与“前路颈椎间盘切除融合术”),导致实体归一化困难本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的临床数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述综合相似度根据以下方法确定:

3.根据权利要求1所述的方法,其特征在于,所述基于大语言模型的Transformer架构对预处理后的数据进行特征提取包括:

4.根据权利要求3所述的方法,其特征在于,根据以下公式对症状描述进行优化:

5.根据权利要求1所述的方法,其特征在于,所述根据动态词汇表生成每个解码步骤的合法令牌集包括:

6.根据权利要求1所述的方法,其特征在于,所述根据术语重要性权重和脊柱疾病临床相关性,计算复制概率包...

【技术特征摘要】

1.一种基于大语言模型的临床数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述综合相似度根据以下方法确定:

3.根据权利要求1所述的方法,其特征在于,所述基于大语言模型的transformer架构对预处理后的数据进行特征提取包括:

4.根据权利要求3所述的方法,其特征在于,根据以下公式对症状描述进行优化:

5.根据权利要求1所述的方法,其特征在于,所述根据动态词汇表生成每个解码步骤的合法令牌集包括:

6.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:蔡思逸仉建国陈亚萍闵昂刘荻刘森陈铮威孙镝涵周博文郑佳敏李云
申请(专利权)人:中国医学科学院北京协和医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1