一种基于医技数据和知识图谱技术构建知识库的方法技术

技术编号:32279225 阅读:18 留言:0更新日期:2022-02-12 19:46
本发明专利技术公开了医疗技术领域的一种基于医技数据和知识图谱技术构建知识库的方法;包括控制系统、数据模块、知识模块和存储模块,其特征在于:控制系统可通过一个具有处理器的计算机实现,数据模块包括:数据采集和数据清洗,其中数据采集根据DICOM标准协议从数据源中实时获取医技原始数据。本发明专利技术的有益效果是:本发明专利技术建成针对医技检测的全覆盖数据来源的标准的、大规模的知识库。该数据库的数据为实时更新的,且数据标签统一,支持web端的授权访问,满足下游行业应用层的数据支撑需求;采用云存储中心系统进行数据存储,实现存储容量大、数据结构统一、数据流转动态更新;系统采用BS架构,支持基于WEB端的数据访问,可实现跨平台的数据访问方式。数据访问方式。数据访问方式。

【技术实现步骤摘要】
一种基于医技数据和知识图谱技术构建知识库的方法


[0001]本专利技术涉及医疗
,具体是一种基于医技数据和知识图谱技术构建知识库的方法。

技术介绍

[0002]目前医学影像报告中的实体没有统一的命名规则、不同医疗机构制定规则的命名和描述上有一定差异性,因此国内尚未建成针对医技检测的全覆盖数据来源的标准的、大规模的知识库。因此,本领域技术人员提供了一种基于医技数据和知识图谱技术构建知识库的方法,以解决上述
技术介绍
中提出的问题。

技术实现思路

[0003]本专利技术的目的在于提供一种基于医技数据和知识图谱技术构建知识库的方法,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种基于医技数据和知识图谱技术构建知识库的方法,包括控制系统、数据模块、知识模块和存储模块,其特征在于:所述控制系统可通过一个具有处理器的计算机实现,所述数据模块包括:数据采集和数据清洗,其中数据采集根据DICOM标准协议从数据源中实时获取医技原始数据,所述数据清洗采用Hadoop分布式系统基础架构,对采集到的数据源清洗,数据的清洗与转换采用ETL工具和OLAP分析处理技术,所述知识模块包括:知识抽取、知识融合和知识加工,使用自然语言处理技术对非结构化数据和半结构化数据进行处理,转换成结构化数据,抽取可用的知识单元,针对医技数据的知识图谱间实体质量较低可能存在的问题,包括但不限于数据格式不同,数据部分丢失等,在知识抽取后采用实体对其的方法进行知识融合,最终达到“实体”描述一致,包括本体构建、知识推理、质量评估,所述存储模块包括云存储中心,采用图形数据库存储。
[0005]作为本专利技术进一步的方案:所述数据清洗包括:数据元标准、数据集标准、数据文档共享规范和保证数据完整性,所述保证数据完整性将采集的DICOM影像数据为连续无缺失,否则提示进行人工校验,非完整数据无法上传。
[0006]作为本专利技术再进一步的方案:所述知识抽取将根据医技检查报告标签提取模型的临床诊疗规则,建立知识规则。
[0007]作为本专利技术再进一步的方案:所述知识融合采用CRF模型建立统计关系,学习进行计算与推理。
[0008]作为本专利技术再进一步的方案:所述知识加工通过本体构建通过数据驱动自动构建;知识推理采用基于产生式规则的方法构建;质量评估是将符合标准化的临床路径的数据导入知识图谱。
[0009]数据采集在基于医院端和院内各终端底层机器设备产生的客观检查结果,覆盖门诊和住院患者所有诊疗数据,包含:放射、检验、超声、内镜、病理、心电数据,数据类型包括:
结构化数据和非结构化数据。
[0010]具体的非机构化数据转化成机构化数据的方法是:数据元标准:遵循《卫生信息数据元目录》属性设置和属性描述,方法参照WS/T303

2009,根据数据元重复程度将数据元属性分为公用属性和专用属性两大类;数据元标准遵循《卫生信息数据元目录》属性设置和属性描述,方法参照WS/T303

2009,根据数据元重复程度将数据元属性分为公用属性和专用属性两大类,所述数据集标准根据《病历书写规范(2010)》、《电子病历基本规范(2010)》、《中医电子病历基本规范(2010)》、《住院病案首页(2011)》、《中医住院病案首页(2011)》等卫生行业规范;数据集标准:《病历书写规范(2010)》、《电子病历基本规范(2010)》、《中医电子病历基本规范(2010)》、《住院病案首页(2011)》、《中医住院病案首页(2011)》等卫生行业规范;数据共享文档规范在结构上遵循《卫生信息共享文档编制规范》及《WS/T

500电子病历共享文档规范》,使用可扩展标记语言(Extensible MarkupLanguage,XML),遵循HL7 RIM模型,借鉴国际上已有的成熟文档架构标准ISO/HL7、CDA、R2三层架构。
[0011]在知识抽取中,医技检查报告标签提取模型的临床诊疗规则,建立知识规则。其中“实体”分为:检查类型、检查部位、适应症、检查目的、疾病严重程度、病史、使用造影剂、伴随检查、检查间隔、单次检查数量、单位时间内检查数量、检查包含子项、性别、年龄、禁忌症、参保类型、机构等级、机构类型、机构性质、就医方式、支付价。
[0012]“属性”:临床诊疗规则中两个或多个“实体”连接的关系。
[0013]“值”:“实体”对应的结果,包括但不限于以下内容:“检查类型”:DR、CT、MR、B超等;“检查部位”:依据ICD10诊断包按照部位、器官、组织分类;“适应症”:依据ICD10诊断包建立诊断合集;“检查目的”:初筛、确诊、复查等;“疾病严重程度”:良好,轻,中,重等;“病史”:未治疗、曾有治疗,依据医保名称建立项目包;“使用造影剂”:是,否;“伴随检查”:依据医保编码项目包;“检查间隔”:日期、数字;“单次检查数量”:数字;“单位时间内检查数量”:数字;“检查包含子项”:依据医保编码项目包;性别:男、女;年龄:数字;“禁忌症”:依据ICD10诊断包建立诊断合集;“参保类型”:城镇职工基本医疗保险、城镇居民基本医疗保险、新农合医疗保险、离休干部医疗保险;“机构等级”:按照医院管理分为一级、二级,分别分为甲等、乙等、丙等,三级,分为特等、甲等、乙等、丙等;“机构类型”:医院、药店等;“机构性质”:公立、非公立;“就医方式”:门诊、住院、日间手术等;“支付价”:数字。
[0014]知识融合中,采用CRF模型建立统计关系,学习进行计算与推理;根据建立的临床诊疗规则中文本内容,基于CRF模型输出特征数据标签,根据标准化的临床路径计算状态转移矩阵,输出最佳标签序列。
[0015]知识加工本体构建通过数据驱动自动构建;知识推理采用基于产生式规则的方法构建;质量评估是将符合标准化的临床路径的数据导入知识图谱。
[0016]与现有技术相比,本专利技术的有益效果是:本专利技术建成针对医技检测的全覆盖数据来源的标准的、大规模的知识库。该数据库的数据为实时更新的,且数据标签统一,支持web端的授权访问,满足下游行业应用层的数据支撑需求;采用云存储中心系统进行数据存储,实现存储容量大、数据结构统一、数据流转动态更新;系统采用BS架构,支持基于WEB端的数据访问,可实现跨平台的数据访问方式。
附图说明
[0017]图1为本专利技术的系统结构示意图;
[0018]图2为本专利技术中数据清洗的模块结构示意图;
[0019]图3为本专利技术中知识加工的模块结构示意图。
具体实施方式
[0020]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]请参阅图1~3,本专利技术实施例中,一种基于医技数据和知识图谱技术构建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于医技数据和知识图谱技术构建知识库的方法,包括控制系统、数据模块、知识模块和存储模块,其特征在于:所述控制系统可通过一个具有处理器的计算机实现,所述数据模块包括:数据采集和数据清洗,其中数据采集根据DICOM标准协议从数据源中实时获取医技原始数据,所述数据清洗采用Hadoop分布式系统基础架构,对采集到的数据源清洗,数据的清洗与转换采用ETL工具和OLAP分析处理技术,所述知识模块包括:知识抽取、知识融合和知识加工,使用自然语言处理技术对非结构化数据和半结构化数据进行处理,转换成结构化数据,抽取可用的知识单元,针对医技数据的知识图谱间实体质量较低可能存在的问题,包括但不限于数据格式不同,数据部分丢失等,在知识抽取后采用实体对其的方法进行知识融合,最终达到“实体”描述一致,包括本体构建、知识推理、质量评估,所述存储模块包括云存储中心,采用图形数据库存储。2.根据权...

【专利技术属性】
技术研发人员:柴雪挺汪凌
申请(专利权)人:杭州联众医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1