一种机器学习数据存储系统技术方案

技术编号:28712192 阅读:27 留言:0更新日期:2021-06-06 00:34
本发明专利技术提供一种机器学习数据存储系统,包括数据采集模块、数据清洗模块、数据分类模块、机器学习接口模块、机器学习模块、数据存储模块、数据监管模块、警报模块,数据采集模块与数据清洗模块相连接,数据清洗模块与数据分类模块相连接,数据分类模块与机器学习接口模块相连接,机器学习接口模块与机器学习模块相连接,机器学习模块与数据存储模块相连接;本发明专利技术本发明专利技术能够给AI产品提供更精准、有效的训练数据本发明专利技术通过数据清洗模块、数据分类模块、机器学习接口模块能够使机器学习变更的容易更高效。更高效。

【技术实现步骤摘要】
一种机器学习数据存储系统


[0001]本专利技术涉及数据处理领域,具体涉及一种机器学习数据存储系统。

技术介绍

[0002]随着国家医疗制度改革的不断深入,随着人工智能算法的飞速发展,AI赋能医疗,将人工智能技术及大数据服务应用于医疗行业中,提升医疗行业的诊断效率及服务质量。AI产品的成熟度和可靠性是基于大量的数据进行训练和深度学习的,现在很多AI产品算法是有了,但是缺少可用的训练数据,或者有数据但是数据杂乱未进行格式化不能支持AI的训练,最终导致AI产品在实际使用中和真实结果差距太大,甚至基本不能使用。
[0003]现有技术存在如下问题:
[0004]1.国内各种医疗数据存储没有一定的标准格式。
[0005]2.由于各医院各医疗系统厂商产生的医疗数据无标准格式,且数据存储方式都是为了支撑各系统中业务应用,而没有专门对于人工智能应用的数据存储格式。
[0006]3.目前各医疗机构存储的数据主要为了支持各系统的业务应用,导致数据的内容不完整或者数据维度单一,提供给人工智能训练学习时,不够全面,会导致算法调教失偏。
[0007]4.目前大部分的AI产品都是根据医院业务系统提供的数据直接进行训练,未对数据进行清洗格式化以及多维度的补充,导致训练出的AI产品不能在实际的场景中应用。
[0008]因此,本专利技术提供了一种基于机器学习的数据存储系统就是为了能调教出一个高效实用的AI产品。

技术实现思路

[0009]为了解决上述技术问题,本专利技术提供一种机器学习数据存储系统,使AI产品提供更精准、有效的训练数据,使机器学习变更的容易更高效。
[0010]为了实现上述技术目的,本专利技术的技术方案如下:
[0011]一种机器学习数据存储系统,包括:数据采集模块、数据清洗模块、数据分类模块、机器学习接口模块、机器学习模块、数据存储模块、数据监管模块、警报模块;所述数据采集模块采集原始医疗数据并传输至所述数据清洗模块,经所述数据清洗模块对所述原始医疗数据进行清洗得到清洗数据后传输至所述数据分类模块,经所述数据分类模块将清洗过的所述原始医疗数据进行分类得到医疗分类数据并通过机器学习接口模块传输至所述机器学习模块,所述机器学习模块对所述医疗分类数据进行学习并传输至所述数据存储模块;所述数据监管模块分别与所述数据采集模块、所述数据清洗模块、所述数据分类模块、所述机器学习接口模块、所述机器学习模块、所述数据存储模块相连接,所述警报模块与所述数据监管模块相连接。
[0012]优选地,所述原始医疗数据包括:临床诊断数据、检验检查数据、影像数据。
[0013]优选地,所述数据清洗模块对所述原始医疗数据进行多维度清洗,所述多维度清洗包括:以疾病类型进行清洗、以治疗方式进行清洗、以年龄进行清洗、以职业进行清洗、以
地域进行清洗。
[0014]优选地,所述数据分类模块将所述清洗数据进行格式化分类;所述格式化分类包括:以疾病类型进行分类、以治疗方式进行分类、以年龄进行分类、以职业进行分类、以地域进行分类。
[0015]优选地,所述机器学习接口模块采用贝叶斯算法、决策树检索分类,聚类算法,应马尔科夫,CNN算法。
[0016]优选地,所述数据存储模块采用区块链分布式方式进行数据存储。
[0017]优选地,所述数据监管模块对所述机器学习数据存储系统进行监管,并提供数据的备份、迁移、监控,数据的访问、权限控制。
[0018]进一步说明,所述数据监管模块还用于实时监管所述机器学习数据存储系统的运行情况,并记录运行日志。
[0019]优选地,当出现异常情况,所述警报模块将暂停数据的流通,当解除警报时,恢复数据的流通。
[0020]与现有技术相比较,本专利技术的有益效果如下:
[0021]1.本专利技术能够给AI产品提供更精准、有效的训练数据。
[0022]2.本专利技术通过数据清洗模块、数据分类模块、机器学习接口模块能够使机器学习变更的容易更高效。
[0023]3.本专利技术经过清洗的格式化的DICOM影像数据,能为影像AI诊断提供更有效的基础数据。
具体实施方式
[0024]为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特征细节仅仅是为了帮助全面理解本专利技术的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本专利技术的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。
[0025]应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本专利技术的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
[0026]在本专利技术的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本专利技术实施例的实施过程构成任何限定。
[0027]应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0028]在本申请所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
[0029]本专利技术提供一种机器学习数据存储系统,包括数据采集模块、数据清洗模块、数据分类模块、机器学习接口模块、机器学习模块、数据存储模块、数据监管模块、警报模块,数据采集模块与数据清洗模块相连接,数据清洗模块与数据分类模块相连接,数据分类模块与机器学习接口模块相连接,机器学习接口模块与机器学习模块相连接,机器学习模块与数据存储模块相连接;数据监管模块分别与数据清洗模块、数据分类模块、机器学习接口模块、机器学习模块、数据存储模块、警报模块相连接。
[0030]进一步说明,数据采集模块采集原始医疗数据并传输至数据清洗模块,其中,原始医疗数据包括:临床诊断数据、检验检查数据、影像数据;经数据清洗模块对临床诊断数据、检验检查数据、影像数据进行清洗得到清洗数据后传输至数据分类模块,根据数据分类模块将清洗过临床诊断数据、检验检查数据、影像数据进行分类得到医疗分类数据并通过机器学习接口模块传输至机器学习模块,机器学习模块对医疗分类数据进行学习并传输至数据存储模块。
[0031]进一步说明,数据采集模块主要功能是从医院各业务应用系统中采集原始医疗数据,其中包括临床诊疗、检验检查的文字数据,和影像文件的图像数据,其中DICOM影像数据占比较大。能适配医院内系统的各种接口模式,将数据采集后缓存在数据中心。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器学习数据存储系统,其特征在于,包括:数据采集模块、数据清洗模块、数据分类模块、机器学习接口模块、机器学习模块、数据存储模块、数据监管模块、警报模块;所述数据采集模块采集原始医疗数据并传输至所述数据清洗模块,经所述数据清洗模块对所述原始医疗数据进行清洗得到清洗数据后传输至所述数据分类模块,经所述数据分类模块将清洗过的所述原始医疗数据进行分类得到医疗分类数据并通过机器学习接口模块传输至所述机器学习模块,所述机器学习模块对所述医疗分类数据进行学习并传输至所述数据存储模块;所述数据监管模块分别与所述数据采集模块、所述数据清洗模块、所述数据分类模块、所述机器学习接口模块、所述机器学习模块、所述数据存储模块相连接,所述警报模块与所述数据监管模块相连接。2.根据权利要求1所述的一种机器学习数据存储系统,其特征在于,所述原始医疗数据包括:临床诊断数据、检验检查数据、影像数据。3.根据权利要求1所述的一种机器学习数据存储系统,其特征在于,所述数据清洗模块对所述原始医疗数据进行多维度清洗,所述多维度清洗包括:以疾病类型进行清洗、以治疗方式进行清洗、以年龄进行清洗、...

【专利技术属性】
技术研发人员:蓝晓洪王健
申请(专利权)人:杭州联众医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1