当前位置: 首页 > 专利查询>山东大学专利>正文

一种疾病数据调度管理方法和骨癌风险预测系统技术方案

技术编号:26037065 阅读:42 留言:0更新日期:2020-10-23 21:15
本发明专利技术公开了一种疾病数据调度管理方法和骨癌风险预测系统,应用于云平台,包括以下步骤:从分布式医疗信息数据库获取疾病大数据队列,其中,所述疾病大数据队列包括身份信息、疾病信息和数据来源;根据疾病编码标准,对疾病大数据队列进行数据标准化;接收工作终端发送的骨癌疾病队列构建请求,基于标准化后的疾病大数据队列,建立骨癌疾病队列,并为其分配存储空间,同时,向所述工作终端发送隐私设置提醒。还基于骨癌疾病队列建立了骨癌风险预测模型。本发明专利技术基于大数据进行疾病队列的提取和危险因素的挖掘,通过存储空间的调度保证了原始数据不被污染以及专项研究的保密性。

【技术实现步骤摘要】
一种疾病数据调度管理方法和骨癌风险预测系统
本专利技术属于医疗大数据处理
,尤其涉及一种疾病数据调度管理方法和骨癌风险预测系统。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。骨癌(bonecancer)即恶性骨肿瘤,是发生于骨骼或其附属组织,为四肢骨和关节软骨(不包括骨髓及耳、眼睑、喉、鼻软骨)的恶性肿瘤。恶性骨肿瘤发展迅速,预后不佳,死亡率高。骨恶性肿瘤较为罕见,据WHO统计,骨恶性肿瘤只占人类全部肿瘤的0.2%。骨癌的治疗手段仍然是以手术为主,而手术联合放化疗并不能改善患者远期生存。目前,国内外对骨癌的研究主要集中于临床治疗、骨癌痛的发生机制等方面,尚缺乏基于健康管理队列人群构建的骨癌风险预测模型。目前对骨癌的危险因素的研究与认识还很匮乏,有报道指出,与骨癌可能有关的病因有感染、慢性炎症、内分泌失调、遗传、辐射等化学污染等因素有关。但没有一个明确的标准来认定可以将哪些指标认定为骨癌的影响因素。并且,这些变量是人为定义的,没有证据证明这些变量与骨癌的密切关联性,这些变量还可能与其他很多疾病相关。再者,针对人群遗传、辐射、化学药物的接触等资料难以获得,增加了构建模型的难度。目前大多数研究仍是针对自己的研究对象进行数据的采集,医疗大数据来源复杂,且形式多样,理顺多源头、多格式、多类型的医疗大数据,对呈爆炸式增长的医疗大数据进行整合和分析工作量巨大;并且,由于医疗大数据中包含各类疾病的相关数据,各类疾病的专项研究都需要基于这些医疗大数据进行数据提取,而目前医疗大数据通常没有管理措施,容易导致原始数据被污染,或者用户身份等隐私信息被泄露。
技术实现思路
为克服上述现有技术的不足,本专利技术提供了一种疾病数据调度管理方法和骨癌风险预测系统,基于大数据进行疾病队列的提取和疾病危险因素的挖掘,通过存储空间的调度保证了原始数据不被污染以及专项研究的保密性。为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:一种疾病数据调度管理方法,应用于云平台,包括以下步骤:从分布式医疗信息数据库获取疾病大数据队列,其中,所述疾病大数据队列包括身份信息、疾病信息和数据来源;根据疾病编码标准,对疾病大数据队列进行数据标准化;接收工作终端发送的骨癌疾病队列构建请求,基于标准化后的疾病大数据队列,建立骨癌疾病队列,并为其分配存储空间,同时,向所述工作终端发送隐私设置提醒。一个或多个实施例提供了一种骨癌风险预测系统,包括云平台,所述云平台包括:骨癌疾病队列获取模块,基于所述方法获取骨癌疾病队列;危险因素筛选模块,根据骨癌结局事件统计相关危险因素并进行筛选;骨癌风险预测模型构建模块,基于筛选的危险因素构建骨癌风险预测模型,并进行模型参数优化和危险因素的再筛选;最终纳入模型的危险因素包括骨囊肿、骨折、骨髓炎、关节炎、静脉炎、肩周炎、椎间盘疾病;骨癌发病概率预测模块,接收用户终端发送的预测请求,调取所述用户的历史疾病数据队列,基于骨癌预测模型获取骨癌发病概率预测结果。以上一个或多个技术方案存在以下有益效果:本专利技术基于云平台实现了医疗大数据的集中管理,并且通过标准化等预处理方法实现了医疗大数据的结构化,便于后续数据的使用;云平台能够响应于用户的骨癌疾病队列创建请求,创建骨癌疾病队列并为其分配新的存储空间,一方面保证了原始数据的完整性,避免科研工作中造成的数据污染,另一方面保证专项的独立性,针对不同疾病的研究互不干扰,同时,还可对项目数据进行隐私设置,使得不同专项研究的数据之间能够按需交流;云平台还基于创建的骨癌疾病队列,建立了疾病风险预测模型,能够基于用户的历史健康数据进行风险预测,并且,模型的建立和分析全部在云平台实现,保证了安全和可靠性。在保险领域,本专利技术可在客户选择保险产品和对产品定价等方面进行支持,让保险公司能够准确定位适合被保险人的保险产品,同时也能为保险公司未来设计保险产品提供合适的依据,提高保险产品推广的精准度以及合适度。解决目前无法根据被保险人个体健康数据为其规划具有针对性的投保方案,以及根据疾病发生率进行保费定价时无法精准量化客户个人健康水平,为客户提供的保险产品费率单一、针对性差等问题。附图说明构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。图1为本专利技术实施例中疾病数据调度管理方法流程图;图2为本专利技术实施例中骨癌风险预测系统中工作终端功能架构图。具体实施方式应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。实施例一本实施例公开了一种疾病数据调度管理方法,应用于云平台,包括以下步骤:步骤1:从分布式医疗信息数据库获取疾病大数据队列,其中,所述疾病大数据队列包括身份信息、疾病信息和数据来源;所述分布式数据库系统包括布设在各地市的医疗信息数据库。本实施例中,医疗信息数据库包括分布于山东省各地市的全员人口信息数据库、公共卫生数据库、电子病历数据库、医保数据库、健康体检数据库、死因数据库等。具体包括以下步骤:步骤1.1:根据预设的与疾病有关的字段,查找数据库系统中包含这些字段的数据表;步骤1.2:基于查找到的数据表,抽取身份证号、疾病、疾病编码、发病时间等字段,并记录该疾病的数据来源,例如源地市、源数据表,在数据表中的ID等,生成疾病大数据队列。步骤2:根据疾病编码标准,对疾病大数据队列进行数据标准化;步骤2.1:从疾病大数据队列中筛选样本数据集,将样本数据中的疾病名称与疾病分类标准中的疾病名称进行对照,将样本数据中的疾病名称进行标准化;其中,所述将样本数据中的疾病名称进行标准化包括:创建标准化名称字段,依次按照以下步骤执行标准化:(1)名称相同对照:获取疾病名称与疾病分类标准中的疾病名称完全一致的样本数据,将原疾病名称写入标准化名称字段。(2)名称相似对照:获取疾病名称与疾病分类标准中的疾病名称相似度超过设定阈值的样本数据,将原疾病名称写入标准化名称字段;所述相似性度量可采用余弦相似度、欧氏距离等现有文本相似度方法,在此不做限定。(3)包含对照:获取疾病名称与疾病分类标准中的疾病名称存在包含关系的样本数据,例如“前列腺炎(非手术治疗)”和“前列腺炎”,将原本文档来自技高网
...

【技术保护点】
1.一种疾病数据调度管理方法,应用于云平台,其特征在于,包括以下步骤:/n从分布式医疗信息数据库获取疾病大数据队列,其中,所述疾病大数据队列包括身份信息、疾病信息和数据来源;/n根据疾病编码标准,对疾病大数据队列进行数据标准化;/n接收工作终端发送的骨癌疾病队列构建请求,基于标准化后的疾病大数据队列,建立骨癌疾病队列,并为其分配存储空间,同时,向所述工作终端发送隐私设置提醒。/n

【技术特征摘要】
1.一种疾病数据调度管理方法,应用于云平台,其特征在于,包括以下步骤:
从分布式医疗信息数据库获取疾病大数据队列,其中,所述疾病大数据队列包括身份信息、疾病信息和数据来源;
根据疾病编码标准,对疾病大数据队列进行数据标准化;
接收工作终端发送的骨癌疾病队列构建请求,基于标准化后的疾病大数据队列,建立骨癌疾病队列,并为其分配存储空间,同时,向所述工作终端发送隐私设置提醒。


2.如权利要求1所述的一种疾病数据调度管理方法,其特征在于,接收工作终端发送的骨癌疾病队列构建请求,建立所述疾病队列包括:基于骨癌的各类表达形式,从疾病大数据队列中匹配包含这些表达形式的用户医疗数据记录,得到所述骨癌疾病队列。


3.如权利要求1所述的一种疾病数据调度管理方法,其特征在于,所述对疾病大数据队列进行数据标准化包括:
基于疾病大数据队列抽取样本数据集,根据疾病分类标准对样本数据集进行结构化;
基于结构化后的样本数据集,对疾病大数据队列中的剩余数据进行结构化。


4.如权利要求3所述的一种疾病数据调度管理方法,其特征在于,所述根据疾病分类标准对样本数据集进行结构化包括:
将样本数据中的疾病名称与疾病分类标准中的疾病名称进行对照,将样本数据中的疾病名称进行标准化。


5.如权利要求4所述的一种疾病数据调度管理方法,其特征在于,对疾病大数据队列中的剩余数据进行结构化包括:
将疾病名称与样本数据中的原疾病名称进行对照,对于对照成功的数据,将样本数据中相应的标准化疾病名称完成部分写入标准化字段;
对于疾病大数据队列中剩余未标准化的数据,将疾病编码与疾病分类标准中的编码进行对照,对于编码对照成功的数据,将疾病分类标准中的编码相应的疾...

【专利技术属性】
技术研发人员:薛付忠季晓康丁荔洁王永超杨帆于文浩郭萍王睿王京彦朱俊奉肖鹏杨伟浩马官慧
申请(专利权)人:山东大学阳光保险集团股份有限公司康评医疗健康有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1