一种基于深度学习实现疾病名称标准化分级的系统技术方案

技术编号：40319320 阅读：9 留言：0更新日期：2024-02-07 21:02

本申请公开了一种基于深度学习实现疾病名称标准化分级的系统，涉及医疗人工智能技术领域，包括：第一获取模块获取临床数据的原始疾病名称；第二获取模块获取标准分级规则的标准分级标签得到第一分级标签；第一处理模块分别以每一初始数据为中心字，根据第一预设距离和中心字对原始疾病名称进行划分得到第一数据；第一分析模块分别将每一第一数据输入第一分析模型，输出字向量；第二分析模块将所有字向量输入第二分析模型，第二分析模型对字向量进行特征提取，根据第一分级标签对原始疾病名称进行分类，输出第一分级结果，更加全面的获取原始疾病名称中单个字特征、字与字相对位置特征、字与原始疾病名称相对位置特征的提取，提高分级准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及医疗人工智能，具体涉及一种基于深度学习实现疾病名称标准化分级的系统。

技术介绍

1、随着医疗卫生机构信息化和智慧化广泛普及，医疗健康大数据空前膨胀，如何高效利用现有医疗卫生数据资源已成为真实世界研究亟待解决的问题。诊断字段是医学真实世界研究的重要变量，包含的诊断名称繁多，在开展医学真实世界研究时通常面临由于原始临床诊断名称记录不规范或记录标准不统一等原因导致的相同诊断名称记录不一致，进而导致诊断变量离散或数据损失，对诊断名称的合并费时费力，对诊断数据的统计分析容易出现难度大、出错率高等问题，同时还对除研究病种之外的合并症、继发病等研究协变量合并、后续的研究分析及结果解释等存在影响。传统方法通过人工的方式进行识别和处理，在耗费大量时间和人力成本的同时延长研究周期。

技术实现思路

1、本专利技术的目的在于解决由于原始临床诊断名称记录不规范或记录标准不统一等原因导致相同诊断名称记录不一致的技术问题，提供了一种基于深度学习实现疾病名称标准化分级的系统，第一获取模块获取诊断数据的原始疾病名称；第二获取模块获取标准分级规则的标准分级标签得到第一分级标签；第一处理模块分别以每一初始数据为中心字，根据第一预设距离和中心字对原始疾病名称进行划分得到第一数据；第一分析模块分别将每一第一数据输入第一分析模型，输出字向量；第二分析模块将所有字向量输入第二分析模型，第二分析模型对字向量进行特征提取，根据第一分级标签对原始疾病名称进行分类，输出第一分级结果，更加全面的获取原始疾病名称中单个字特征、字

2、本专利技术请求保护一种基于深度学习实现疾病名称标准化分级的系统，包括：

3、第一获取模块，用于获取诊断数据的原始疾病名称，得到初始数据；

4、第二获取模块，用于获取标准分级规则的标准分级标签，得到第一分级标签，所述第一分级标签用于区分属于不同所述标准分级标签的所述初始数据；

5、第一处理模块，用于分别以每一所述初始数据为中心字，根据第一预设距离和所述中心字对所述初始数据进行划分，得到第一数据；

6、其中，所述第一预设距离的取值为正整数；

7、第一分析模块，用于分别将每一所述第一数据输入第一分析模型，输出对应的字向量，所述字向量为将每一所述第一数据映射到向量空间得到的实数向量；

8、第二分析模块，用于将所有所述字向量输入第二分析模型，所述第二分析模型对所述字向量进行特征提取，根据所述第一分级标签对所述初始数据进行分类，输出第一分级结果。

9、在本申请一实施例中，所述第二分析模型包括：

10、第二输入层，用于加载所述初始数据的所有所述字向量；

11、第二隐藏层，用于对所有所述字向量进行特征分析和提取，得到第一信息向量和第二信息向量，根据所述第一信息向量和所述第二信息向量计算得到注意力权重，将所述注意力权重和所述第二信息向量相乘得到第三信息向量；

12、其中，所述第一信息向量为所述初始数据的特征向量，所述第二信息向量为所述初始数据每个字的特征向量；

13、第二输出层，用于根据所述第三信息向量和所述第一分级标签对所述初始数据进行分类，得到所述第一分级结果。

14、在本申请一实施例中，所述第二分析模型还包括根据长短期记忆神经网络模型构建所述第二隐藏层，所述第二分析模型根据预设顺序对每一所述字向量进行特征提取，得到对应的所述第二信息向量。

15、在本申请一实施例中，所述第二分析模型还包括根据双向长短期记忆神经网络模型构建所述第二隐藏层，所述第二分析模型根据根据所述初始数据的正向顺序对所有所述字向量进行特征提取，得到第四信息向量，根据所述初始数据的逆向顺序对所有所述字向量进行特征提取，得到第五信息向量，根据所述第四信息向量和所述第五信息向量计算得到所述第二信息向量。

16、在本申请一实施例中，所述第二分析模型还包括根据最后一个输入所述第二隐藏层的所述字向量对应的所述第二信息向量计算得到所述第一信息向量。

17、在本申请一实施例中，所述第一分析模型的训练方法包括：

18、获取历史诊断数据中的原始疾病名称，得到第一训练数据集；

19、所述第一分析模块对所述第一训练数据集中每一样本的每个字预设不同的预设向量，不同字采用不同的所述预设向量，相同字采用相同的所述预设向量；

20、将所述预设向量作为真实数据，对所述第一分析模型进行训练。

21、在本申请一实施例中，所述第二分析模型的训练方法包括：

22、获取第二训练数据集，所述第二训练数据集包括历史诊断数据的原始疾病名称和预设分级标签；

23、将所述第二训练数据集中的每一所述原始疾病名称输入所述第一处理模块，得到所述第一数据，将对应的所述第一数据输入所述第一分析模块，得到所述字向量；

24、将所述预设分级标签作为真实数据，将对应的所有所述字向量输入所述第二分析模型，对所述第二分析模型进行训练。

25、在本申请一实施例中，所述第二训练数据集的获取方法还包括根据所述标准分级规则对所述第一训练数据集的样本进行分级得到对应的所述预设分级标签，根据所述预设分级标签和所述第一训练数据集得到所述第二训练数据集。

26、在本申请一实施例中，所述标准分级规则包括icd-10，根据icd-10中记录的疾病名称建立所述第一训练数据集和所述第二训练数据集。

27、在本申请一实施例中，所述系统还包括对所述标准分级规则和/或所述标准分级标签进行修改时，采用迁移学习的方式对所述第一分析模型和所述第二信息模型进行训练。

28、本申请具有以下有益效果：

29、1、对诊断过程中记录的诊断名称中的每一个汉字、字母、数字和特殊符号等都作为分析单元进行分析，例如，原始疾病名称为“（i10.x14）高血压亚急症”，则所述初始数据为“（”、“i”、“1”、“0”、“.”、“x”、“1”、“4”、“）”、“高”、“血”、“压”、“亚”、“急”和“症”。其目的在于使分析后的分级结果能够全面、无遗漏地反应原始疾病名称中所包含的信息，避免由于输入的信息不全面导致分级的不准确。

30、2、使用icd-10中的疾病名称作为所述训练数据集得到的所述字向量能更好的表示疾病名称领域中每个字的特征和关系。使用icd-10作为所述标准分级规则覆盖的疾病类型更加全面，训练得到的所述第二分析模型的分级经验更加科学和客观。

31、3、字向量通过对第一数据中的特征进行分析，从而实现对中心字的编码，由于第一数据中既包含了中心字的特征，例如对应的每一第一数据都有对应的中心字，又包含了中心字相邻位置的字的特征，例如中心字在第一预设距离范围内的字的特征，同时还包含了中心字和相邻位置的字的距离特征和位置特征。距离特征包括中心字与相邻位置的字之间的距离不大于所述第一预设距离。本文档来自技高网...

【技术保护点】

1.一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二分析模型包括：

3.根据权利要求2所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二分析模型还包括根据长短期记忆神经网络模型构建所述第二隐藏层，所述第二分析模型根据预设顺序对每一所述字向量进行特征提取，得到对应的所述第二信息向量。

4.根据权利要求2所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二分析模型还包括根据双向长短期记忆神经网络模型构建所述第二隐藏层，所述第二分析模型根据根据所述初始数据的正向顺序对所有所述字向量进行特征提取，得到第四信息向量，根据所述初始数据的逆向顺序对所有所述字向量进行特征提取，得到第五信息向量，根据所述第四信息向量和所述第五信息向量计算得到所述第二信息向量。

5.根据权利要求3或4所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二分析模型还包括根据最后一个输入所述第二隐藏层的所述

6.根据权利要求1-4任意一项所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第一分析模型的训练方法包括：

7.根据权利要求6所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二分析模型的训练方法包括：

8.根据权利要求7所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二训练数据集的获取方法还包括：

9.根据权利要求8所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述标准分级规则包括ICD-10，根据ICD-10中记录的疾病名称建立所述第一训练数据集和所述第二训练数据集。

10.根据权利要求1所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述系统还包括对所述标准分级规则和/或所述标准分级标签进行修改时，采用迁移学习的方式对所述第一分析模型和所述第二信息模型进行训练。

...

【技术特征摘要】

1.一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，包括：

2.根据权利要求1所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第二分析模型包括：

5.根据权利要求3或4所述的一种基于深度学习实现疾病名称标准化分级的系统，其特征在于，所述第...

【专利技术属性】
技术研发人员：吴行伟，童荣生，邓博，沈浩，
申请(专利权)人：四川省医学科学院·四川省人民医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人