数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:33788121 阅读:12 留言:0更新日期:2022-06-12 14:43
本发明专利技术涉及数字医疗技术领域,公开了一种数据处理方法、装置、设备及存储介质,用于提高模型训练中医疗数据训练样本的质量,提高AI识别疾病的效果和准确性。包括:通过互联网医疗平台存储包括线上和线下产生的病种全面且样本量充足的高质量历史医疗数据,同时对存储的历史医疗数据进行标签处理和分类处理得到数量多、基础数据完善、且标注全面的样本数据,提高了模型训练样本的质量,有利于模型的训练,提高了AI识别疾病的效果和准确性,进而可以推进医疗在人工智能领域的研究和应用。此外,本发明专利技术还涉及云计算技术,医疗平台和医疗数据通过云计算创建和处理。过云计算创建和处理。过云计算创建和处理。

【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质


[0001]本专利技术涉及数字医疗
,尤其涉及一种数据处理方法、装置、设备及存储介质。

技术介绍

[0002]人工智能(Artificial Intelligence,AI)在医学方面主要用于AI导诊、AI阅片、AI问诊、AI面诊、以及AI健康管理等疾病诊断和营养健康各个方面。但是,将人工智能应用到医学的疾病诊断和健康管理,需要获取大量的训练数据,训练具有不同功能的模型,以通过模型进行疾病诊断和健康管理。相关技术中,针对医学方面的数据集,通常是通过传统医院中医生与患者之间交流的问诊方式,医生手动输入患者信息、治疗过程、以及诊断结果等数据,获取数据集,并通过人工的方式对数数据集进行标注得到训练集。但是这种方式不方便形成问诊数据集,且数据集的数量较少,缺乏基础数据,导致数据集的标注不全面,不利于模型的训练,导致AI对某种疾病无法识别,进而会影响AI识别疾病的准确性。

技术实现思路

[0003]本专利技术提供了一种数据处理方法、装置、设备及存储介质,用于通过互联网医疗平台获取病种全面且样本量充足的高质量医疗数据,同时对获取的医疗数据进行标签和分类处理得到数量多、基础数据完善、且标注全面的样本数据,有利于模型的训练,提高AI的识别疾病效果和准确性,进而可以推进医疗在人工智能领域的研究和应用。
[0004]为实现上述目的,本专利技术第一方面提供了一种数据处理方法,包括:获取医疗平台存储的历史医疗数据;其中,历史医疗数据包括:线上医疗数据和线下医疗数据;线上医疗数据通过线上的方式获取并存储于医疗平台的业务系统;线下医疗数据通过线下的方式获取并上传至医疗平台的业务系统;根据历史医疗数据和预先设置的标签库,为历史医疗数据设置标签,得到历史医疗数据的初始样本数据;其中,标签库至少包括影像标签库、问诊标签库、以及病程标签库;根据预设的分类维度,对初始样本数据进行分类处理,得到不同维度的样本数据。
[0005]可选的,在本专利技术第一方面的第一种实现方式中,历史医疗数据携带有业务标识;根据历史医疗数据和预先设置的标签库,为历史医疗数据设置标签,得到历史医疗数据的初始样本数据的步骤,包括:根据业务标识,对历史医疗数据进行业务分类,将属于相同业务类型的历史医疗数保存至对应的数据存储空间;其中,业务类型至少包括:影像业务,问诊业务,以及病程业务;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据。
[0006]可选的,本专利技术第一方面的第二种实现方式中,数据存储空间包括影像数据存储空间;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据的步骤,包括:针对影像数据存储空间,解析影像数据存储空间中的影像医疗数据的第一医疗信息;根据第一医疗信息和影
像医疗数据对应的影像标签库,对影像医疗数据设置第一标签,得到影像医疗数据对应的初始样本数据。
[0007]可选的,在本专利技术第一方面的第三种实现方式中,数据存储空间包括问诊数据存储空间;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据的步骤,包括:针对问诊数据存储空间,解析问诊数据存储空间中的问诊医疗数据的第二医疗信息;根据第二医疗信息和问诊医疗数据对应的问诊标签库,对问诊医疗数据设置第二标签,得到问诊医疗数据对应的初始样本数据。
[0008]可选的,在本专利技术第一方面的第四种实现方式中,数据存储空间包括病程数据存储空间;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据的步骤,包括:针对病程数据存储空间,解析病程数据存储空间中的病程医疗数据的第三医疗信息;根据第三医疗信息和病程医疗数据对应的病程标签库,对病程医疗数据设置第三标签,得到病程医疗数据对应的初始样本数据。
[0009]可选的,在本专利技术第一方面的第五种实现方式中,根据历史医疗数据和预先设置的标签库,为历史医疗数据设置标签,得到历史医疗数据的初始样本数据的步骤,还包括:获取历史医疗数据中文本数据;对文本数据进行解析处理,得到文本数据中的高频文本;将高频文本进行标签化处理,并为文本数据设置第四标签,得到文本数据对应的初始样本数据。
[0010]可选的,在本专利技术第一方面的第六种实现方式中,分类维度至少包括:业务维度和疾病维度;根据预设的分类维度,对初始样本数据进行分类处理,得到不同维度的样本数据的步骤,包括:根据初始样本数据中业务标识的标识标签,确定初始样本数据中业务维度的样本数据;其中,业务维度的样本数据至少包括:影像样本数据、问诊样本数据、以及病程样本数据;根据初始样本数据中与疾病相关的疾病标签和与器官相关的器官标签,确定初始样本数据中疾病维度的样本数据;其中,疾病维度的样本数据至少包括:与器官相关的样本数据以及与疾病相关的样本数据。
[0011]本专利技术第二方面提供了一种数据处理装置,包括:数据获取模块,用于获取医疗平台存储的历史医疗数据;其中,历史医疗数据包括:线上医疗数据和线下医疗数据;线上医疗数据通过线上的方式获取并存储于医疗平台的业务系统;线下医疗数据通过线下的方式获取并上传至医疗平台的业务系统;标签设置模块,用于根据历史医疗数据和预先设置的标签库,为历史医疗数据设置标签,得到历史医疗数据的初始样本数据;其中,标签库至少包括影像标签库、问诊标签库、以及病程标签库;样本分类模块,用于根据预设的分类维度,对初始样本数据进行分类处理,得到不同维度的样本数据。
[0012]可选的,在本专利技术第二方面的第一种实现方式中,上述历史医疗数据携带有业务标识;标签设置模块还包括:数据分类单元,用于根据业务标识,对历史医疗数据进行业务分类,将属于相同业务类型的历史医疗数保存至对应的数据存储空间;其中,业务类型至少包括:影像业务,问诊业务,以及病程业务;标签设置单元,用于针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据。
[0013]可选的,本专利技术第一方面的第二种实现方式中,数据存储空间包括影像数据存储空间;标签设置单元还用于:针对影像数据存储空间,解析影像数据存储空间中的影像医疗数据的第一医疗信息;根据第一医疗信息和影像医疗数据对应的影像标签库,对影像医疗数据设置第一标签,得到影像医疗数据对应的初始样本数据。
[0014]可选的,在本专利技术第一方面的第三种实现方式中,数据存储空间包括问诊数据存储空间;标签设置单元还用于:针对问诊数据存储空间,解析问诊数据存储空间中的问诊医疗数据的第二医疗信息;根据第二医疗信息和问诊医疗数据对应的问诊标签库,对问诊医疗数据设置第二标签,得到问诊医疗数据对应的初始样本数据。
[0015]可选的,在本专利技术第一方面的第四种实现方式中,数据存储空间包括病程数据存储空本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取医疗平台存储的历史医疗数据;其中,所述历史医疗数据包括:线上医疗数据和线下医疗数据;所述线上医疗数据通过线上的方式获取并存储于所述医疗平台的业务系统;所述线下医疗数据通过线下的方式获取并上传至所述医疗平台的业务系统;根据所述历史医疗数据和预先设置的标签库,为所述历史医疗数据设置标签,得到所述历史医疗数据的初始样本数据;其中,所述标签库至少包括影像标签库、问诊标签库、以及病程标签库;根据预设的分类维度,对所述初始样本数据进行分类处理,得到不同维度的样本数据。2.根据权利要求1所述的方法,其特征在于,所述历史医疗数据携带有业务标识;所述根据所述历史医疗数据和预先设置的标签库,为所述历史医疗数据设置标签,得到所述历史医疗数据的初始样本数据的步骤,包括:根据所述业务标识,对所述历史医疗数据进行业务分类,将属于相同业务类型的历史医疗数保存至对应的数据存储空间;其中,所述业务类型至少包括:影像业务,问诊业务,以及病程业务;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历史医疗数据的初始样本数据。3.根据权利要求2所述的数据处理方法,其特征在于,所述数据存储空间包括影像数据存储空间;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历史医疗数据的初始样本数据的步骤,包括:针对所述影像数据存储空间,解析所述影像数据存储空间中的影像医疗数据的第一医疗信息;根据所述第一医疗信息和所述影像医疗数据对应的影像标签库,对所述影像医疗数据设置第一标签,得到所述影像医疗数据对应的初始样本数据。4.根据权利要求2所述的数据处理方法,其特征在于,所述数据存储空间包括问诊数据存储空间;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历史医疗数据的初始样本数据的步骤,包括:针对所述问诊数据存储空间,解析所述问诊数据存储空间中的问诊医疗数据的第二医疗信息;根据所述第二医疗信息和所述问诊医疗数据对应的问诊标签库,对所述问诊医疗数据设置第二标签,得到所述问诊医疗数据对应的初始样本数据。5.根据权利要求2所述的数据处理方法,其特征在于,所述数据存储空间包括病程数据存储空间;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历...

【专利技术属性】
技术研发人员:叶结保
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1