【技术实现步骤摘要】
数据处理方法、装置、设备及存储介质
[0001]本专利技术涉及数字医疗
,尤其涉及一种数据处理方法、装置、设备及存储介质。
技术介绍
[0002]人工智能(Artificial Intelligence,AI)在医学方面主要用于AI导诊、AI阅片、AI问诊、AI面诊、以及AI健康管理等疾病诊断和营养健康各个方面。但是,将人工智能应用到医学的疾病诊断和健康管理,需要获取大量的训练数据,训练具有不同功能的模型,以通过模型进行疾病诊断和健康管理。相关技术中,针对医学方面的数据集,通常是通过传统医院中医生与患者之间交流的问诊方式,医生手动输入患者信息、治疗过程、以及诊断结果等数据,获取数据集,并通过人工的方式对数数据集进行标注得到训练集。但是这种方式不方便形成问诊数据集,且数据集的数量较少,缺乏基础数据,导致数据集的标注不全面,不利于模型的训练,导致AI对某种疾病无法识别,进而会影响AI识别疾病的准确性。
技术实现思路
[0003]本专利技术提供了一种数据处理方法、装置、设备及存储介质,用于通过互联网医疗平台获 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取医疗平台存储的历史医疗数据;其中,所述历史医疗数据包括:线上医疗数据和线下医疗数据;所述线上医疗数据通过线上的方式获取并存储于所述医疗平台的业务系统;所述线下医疗数据通过线下的方式获取并上传至所述医疗平台的业务系统;根据所述历史医疗数据和预先设置的标签库,为所述历史医疗数据设置标签,得到所述历史医疗数据的初始样本数据;其中,所述标签库至少包括影像标签库、问诊标签库、以及病程标签库;根据预设的分类维度,对所述初始样本数据进行分类处理,得到不同维度的样本数据。2.根据权利要求1所述的方法,其特征在于,所述历史医疗数据携带有业务标识;所述根据所述历史医疗数据和预先设置的标签库,为所述历史医疗数据设置标签,得到所述历史医疗数据的初始样本数据的步骤,包括:根据所述业务标识,对所述历史医疗数据进行业务分类,将属于相同业务类型的历史医疗数保存至对应的数据存储空间;其中,所述业务类型至少包括:影像业务,问诊业务,以及病程业务;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历史医疗数据的初始样本数据。3.根据权利要求2所述的数据处理方法,其特征在于,所述数据存储空间包括影像数据存储空间;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历史医疗数据的初始样本数据的步骤,包括:针对所述影像数据存储空间,解析所述影像数据存储空间中的影像医疗数据的第一医疗信息;根据所述第一医疗信息和所述影像医疗数据对应的影像标签库,对所述影像医疗数据设置第一标签,得到所述影像医疗数据对应的初始样本数据。4.根据权利要求2所述的数据处理方法,其特征在于,所述数据存储空间包括问诊数据存储空间;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历史医疗数据的初始样本数据的步骤,包括:针对所述问诊数据存储空间,解析所述问诊数据存储空间中的问诊医疗数据的第二医疗信息;根据所述第二医疗信息和所述问诊医疗数据对应的问诊标签库,对所述问诊医疗数据设置第二标签,得到所述问诊医疗数据对应的初始样本数据。5.根据权利要求2所述的数据处理方法,其特征在于,所述数据存储空间包括病程数据存储空间;针对每个所述数据存储空间,根据所述数据存储空间中的历史医疗数据和所述标签库,对所述历史医疗数据设置对应的标签,得到所述历...
【专利技术属性】
技术研发人员:叶结保,
申请(专利权)人:康键信息技术深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。