基于临床术语的向量库构建方法及编码推荐方法技术

技术编号:42857581 阅读:33 留言:0更新日期:2024-09-27 17:23
本发明专利技术的实施例提供了基于临床术语的向量库构建方法及编码推荐方法。所述基于临床术语的向量库构建方法包括从知识库中获取词向量训练数据;构建三重态网络的SBERT模型,通过词向量训练数据对所述SBERT模型进行训练,得到词向量训练模型;通过词向量训练模型将词向量训练数据进行向量化编码,输出ICD‑10标准编码名称词向量;基于所述ICD‑10标准编码名称词向量,使用faiss向量检索工具构建向量库。以此方式,可以解决现有技术中临床术语编码方式效率低,传统编码员编码速度慢、耗时长、准确率低、不能满足医生在写病历的过程中实时进行编码的技术问题。

【技术实现步骤摘要】

本专利技术一般涉及临床术语领域及数字化编码领域,并且更具体地,涉及基于临床术语的向量库构建方法及编码推荐方法


技术介绍

1、随着医疗技术的快速发展和医疗数据的急剧增长,现代医疗信息系统中对于标准化和结构化医疗术语的需求逐渐提升,医疗数据的处理和利用变得越来越重要。在电子病历、医疗报告、医嘱等医疗文档中,临床术语(如疾病名称、药物名称、手术操作等)的准确编码是实现医疗信息标准化、结构化存储和共享的关键。

2、临床术语编码方式往往依赖于专业的医疗编码员手动进行,这种方式不仅效率低下,而且容易出错,特别是在面对海量医疗数据时更是如此。

3、现有技术中存在临床术语编码方式效率低,传统编码员编码速度慢、耗时长、准确率低、不能满足医生在写病历的过程中实时进行编码的技术问题。


技术实现思路

1、根据本专利技术的实施例,提供了一种基于临床术语的向量库构建方法及编码推荐方案。本方案解决传统编码员编码速度慢、耗时长、准确率低、难以满足医生在写病历的过程中实时进行编码的问题,提高了临床编码的效率,减少医生本文档来自技高网...

【技术保护点】

1.一种基于临床术语的向量库构建方法,其特征在于,包括:

2.根据权利要求1所述的基于临床术语的向量库构建方法,其特征在于,所述词向量训练数据包括若干条数据组合,每条数据组合为三元组形式,包括临床术语、ICD-10标准编码名称的正例数据和ICD-10标准编码名称的负例数据。

3.根据权利要求2所述的基于临床术语的向量库构建方法,其特征在于,还包括,通过随机替换的方式对所述词向量训练数据进行数据增强;

4.根据权利要求1所述的基于临床术语的向量库构建方法,其特征在于,所述通过词向量训练数据对所述SBERT模型进行训练,包括:

<p>5.根据权利要求...

【技术特征摘要】

1.一种基于临床术语的向量库构建方法,其特征在于,包括:

2.根据权利要求1所述的基于临床术语的向量库构建方法,其特征在于,所述词向量训练数据包括若干条数据组合,每条数据组合为三元组形式,包括临床术语、icd-10标准编码名称的正例数据和icd-10标准编码名称的负例数据。

3.根据权利要求2所述的基于临床术语的向量库构建方法,其特征在于,还包括,通过随机替换的方式对所述词向量训练数据进行数据增强;

4.根据权利要求1所述的基于临床术语的向量库构建方法,其特征在于,所述通过词向量训练数据对所述sbert模型进行训练,包括:

5.根据权利...

【专利技术属性】
技术研发人员:石超朱守用张乐杨东马百路
申请(专利权)人:上海今创信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1