当前位置: 首页 > 专利查询>金力专利>正文

一种基于大数据的糖尿病文献信息标准数据库集分析方法技术

技术编号:21345878 阅读:51 留言:0更新日期:2019-06-13 23:21
本发明专利技术公开了一种基于大数据的糖尿病文献信息标准数据库集分析方法,包括用于存储糖尿病文献信息标准数据库集和其他数据的存储模块、与存储模块通信连接且用于进行数据分析的分析模块和与分析模块通信连接且用于输出处理结果的显示模块,用于输入参数的输入模块,对糖尿病文献信息标准数据库集的数据进行进一步整理,得到数量函数G(γn,t,m),排除干扰数据,方便以后使用数据。通过数量函数G(γn,t,m),只需输入参数即可方便的对数据进行搜索。设置有多个功能单元,可方便的对数量函数G(γn,t,m)的数据进一步挖掘。

【技术实现步骤摘要】
一种基于大数据的糖尿病文献信息标准数据库集分析方法
本专利技术涉及文献数据分析
,具体涉及一种基于大数据的糖尿病文献信息标准数据库集分析方法。
技术介绍
糖尿病是一组以高血糖为特征的代谢性疾病。高血糖则是由于胰岛素分泌缺陷或其生物作用受损,或两者兼有引起。中医文献是数千年来无数医家代代相传累积起来的医学理论与医疗经验的结晶,记录了数千年来防病治病的丰富经验,对现今的医疗实践和医疗科研仍有重要的指导作用和应用价值,因此中医文献的数字化具有重要意义。在《时珍国医国药》,2015年06期中发表的名为《糖尿(消渴)病文献数字化方法的研究》的论文中,公开了一种糖尿病文献数字化方法,对古今文献进行了整理,对症状命名,症状量化进行规范化,同时还对辩证名称、方剂、药名进行规范化,并根据此方法建立了糖尿病文献信息标准数据库集,包含了医案数据和方剂数据。在《时珍国医国药》2016年02期中发表的名为《一种基于演化的糖尿病疗效自适应动态评价模型》的论文中,公开了一种自适应动态评价模型,可根据病人病情的发展动态的调节参数,对治疗效果的好坏进行评价。现有技术下,对于糖尿病中医文献信息的利用还属于空白阶段,无法让中医文献贡献出更大的价值。
技术实现思路
为了解决上述的技术问题,本专利技术的目的在于提供一种基于大数据的糖尿病文献信息标准数据库集分析方法。本专利技术所要解决的技术问题为:(1)如何对糖尿病文献信息标准数据库集中的数据进行进一步筛选;(2)如何将筛选过的数据进行整理;(3)如何利用整理过的数据。本专利技术的目的可以通过以下技术方案实现:一种基于大数据的糖尿病文献信息标准数据库集分析方法,包括用于存储糖尿病文献信息标准数据库集和其他数据的存储模块、与存储模块通信连接且用于进行数据分析的分析模块和与分析模块通信连接且用于输出处理结果的显示模块,用于输入参数的输入模块,所述分析模块的处理步骤如下:步骤一:分析模块对糖尿病文献信息标准数据库集中的所有案例数据进行整理,使每个患者对应有个人属性集Q={a,b,c,……},同时使每个患者对应有个人诊断集D={S1,S2,S3,……,Sx},其中x为正整数,S1中记录有第一次就医时的症状指标和第一次诊断证型,S2中记录有第二次就医时的症状指标和第二次诊断证型,S3中记录有第三次就医时的症状指标和第三次诊断证型,以此类推;步骤二:分析模块根据患者的个人诊断集D中每次就医时的症状指标和自适应动态评价模型,计算患者每次诊断后的治疗效果P,进而得到患者的治疗评价集Z={P1,P2,P3,……,Px},其中x为正整数,则P1对应第一次就医时的症状指标,P2对应第二次就医时的症状指标,以此类推,以诊断次数为x,治疗效果为y,建立方程组:得到斜率k1,k2,k3,……,ki-1,其中i为病人的总就医次数,k1与第一次诊断证型相对应,k2与第二次诊断证型相对应,以此类推;步骤三:筛选出k值大于零的项,并计算数量,若没有k值大于零的项,则将该患者的个人属性集Q和对应的诊断证型标记为干扰例;若k值大于零的项的数量为1,则将k值大于零的项对应的该患者的个人属性集Q和对应的诊断证型标记为确定例并存储至存储模块;若k值大于零的项的数量大于1,则根据各项对应的诊断证型进行分组,同证型的分为一组,对同一组的项根据k值的大小进行排序,并筛选出各组k值最大的项,并将该k值对应的个人属性集Q和对应的诊断证型标记为确定例并存储至存储模块;步骤四:分析模块对所有患者的个人属性集i进行并运算,得到属性总集h,并计算属性总集h内各个元素的在所有案例中出现的频率f,并选取f>80%的元素作为相关度因素γ,并进行编号为γ1、γ2、γ3、……、γn,再根据实际需要对相关度因素γ进行手动设置分组,并将各分组编号为1、2、3、……、t,将糖尿病证型进行编号为1、2、3、……、m,其中t、n和m均为正整数;步骤五:分析模块统计所有确定例的数量,建立确定例的数量函数G(γn,t,m),分别统计同一相关度因素γ下,各分组对应的各证型的确定例数量,并存储至存储模块。所述分析模块中还设有相关度因素比较单元,所述相关度因素比较单元将同一相关度因素γn下的各分组的所有证型的确定例数量相加,得到各分组糖尿病的确定例数量集V={V1,V2,……,Vt},根据总体标准偏差公式,计算V的总体标准偏差,同时计算该相关度因素下确定例的总数,进而得到各个相关度因素γ的总体标准偏差,根据各个相关度因素γ的确定例总数,计算出公倍数,并根据相关度公式相关度=总体标准偏差*公倍数/确定例总数,计算出各个相关度因素的相关度,根据相关度大小对相关度因素进行排序,将排名结果传输至显示模块。所述分析模块中还设有糖尿病证型比较单元,所述糖尿病证型比较单元获取相关度因素γn下同一分组t下的各个证型的确定例数量,并计算各个证型的总和,进而计算各个证型与总和的比值,并将各证型的比值和分组t的信息传输至显示模块。所述分析模块中还设有证型转化趋势单元,所述证型转化趋势单元筛选出k值既有大于零也有小于零的个人诊断集D,再从k值大于零的项中选出i值最小的k值,并获取该k值对应的诊断证型,作为初始证型,并筛选出初始证型对应的ki之后的第一个小于零且k值对应的诊断证型与初始证型不相同的k值,并获取该k值对应的诊断证型,作为转化证型,计算同一初始证型的确定例的数量,筛选同一初始证型下,具有相同转化证型的确定例的数量Z,计算同一初始证型的确定例的数量与Z的比值,得到各种证型转化的可能性。本专利技术的有益效果:(1)对糖尿病文献信息标准数据库集的数据进行进一步整理,得到数量函数G(γn,t,m),排除干扰数据,方便以后使用数据。(2)通过数量函数G(γn,t,m),只需输入参数即可方便的对数据进行搜索。(3)设置有多个功能单元,可方便的对数量函数G(γn,t,m)的数据进一步挖掘。具体实施方式下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。本实施例提供了一种基于大数据的糖尿病文献信息标准数据库集分析方法,包括用于存储糖尿病文献信息标准数据库集和其他数据的存储模块、与存储模块通信连接且用于进行数据分析的分析模块和与分析模块通信连接且用于输出处理结果的显示模块,用于输入参数的输入模块,分析模块的处理步骤如下:步骤一:分析模块对糖尿病文献信息标准数据库集中的所有案例数据进行整理,使每个患者对应有个人属性集Q={a,b,c,……},每个案例中记录的个人属性的数量和种类均不同,如一个案例中,记载了一个患者的年龄、性别、体重,而另一个案例中记载了另一个患者的身高,居住地点,年龄,其中年龄、性别、体重、身高、居住地等都可以描述个人的属性,因此属于个人属性集Q中的元素,同时使每个患者对应有个人诊断集D={S1,S2,S3,……,Sx},其中x为正整数,S1中记录有第一次就医时的症状指标和第一次诊断证型,S2中记录有第二次就医时的症状指标和第二次诊断证型,S3中记录有第三次就医时的症状指标和第三次诊断证型,以此类推;每个患者在治疗的过程中本文档来自技高网...

【技术保护点】
1.一种基于大数据的糖尿病文献信息标准数据库集分析方法,包括用于存储糖尿病文献信息标准数据库集和其他数据的存储模块、与存储模块通信连接且用于进行数据分析的分析模块和与分析模块通信连接且用于输出处理结果的显示模块,用于输入参数的输入模块,其特征在于,所述分析模块的处理步骤如下:步骤一:分析模块对糖尿病文献信息标准数据库集中的所有案例数据进行整理,使每个患者对应有个人属性集Q={a,b,c,……},同时使每个患者对应有个人诊断集D={S1,S2,S3,……,Sx},其中x为正整数,S1中记录有第一次就医时的症状指标和第一次诊断证型,S2中记录有第二次就医时的症状指标和第二次诊断证型,S3中记录有第三次就医时的症状指标和第三次诊断证型,以此类推;步骤二:分析模块根据患者的个人诊断集D中每次就医时的症状指标和自适应动态评价模型,计算患者每次诊断后的治疗效果P,进而得到患者的治疗评价集Z={P1,P2,P3,……,Px},其中x为正整数,则P1对应第一次就医时的症状指标,P2对应第二次就医时的症状指标,以此类推,以诊断次数为x,治疗效果为y,建立方程组:

【技术特征摘要】
1.一种基于大数据的糖尿病文献信息标准数据库集分析方法,包括用于存储糖尿病文献信息标准数据库集和其他数据的存储模块、与存储模块通信连接且用于进行数据分析的分析模块和与分析模块通信连接且用于输出处理结果的显示模块,用于输入参数的输入模块,其特征在于,所述分析模块的处理步骤如下:步骤一:分析模块对糖尿病文献信息标准数据库集中的所有案例数据进行整理,使每个患者对应有个人属性集Q={a,b,c,……},同时使每个患者对应有个人诊断集D={S1,S2,S3,……,Sx},其中x为正整数,S1中记录有第一次就医时的症状指标和第一次诊断证型,S2中记录有第二次就医时的症状指标和第二次诊断证型,S3中记录有第三次就医时的症状指标和第三次诊断证型,以此类推;步骤二:分析模块根据患者的个人诊断集D中每次就医时的症状指标和自适应动态评价模型,计算患者每次诊断后的治疗效果P,进而得到患者的治疗评价集Z={P1,P2,P3,……,Px},其中x为正整数,则P1对应第一次就医时的症状指标,P2对应第二次就医时的症状指标,以此类推,以诊断次数为x,治疗效果为y,建立方程组:得到斜率k1,k2,k3,……,ki-1,其中i为病人的总就医次数,k1与第一次诊断证型相对应,k2与第二次诊断证型相对应,以此类推;步骤三:筛选出k值大于零的项,并计算数量,若没有k值大于零的项,则将该患者的个人属性集Q和对应的诊断证型标记为干扰例;若k值大于零的项的数量为1,则将k值大于零的项对应的该患者的个人属性集Q和对应的诊断证型标记为确定例并存储至存储模块;若k值大于零的项的数量大于1,则根据各项对应的诊断证型进行分组,同证型的分为一组,对同一组的项根据k值的大小进行排序,并筛选出各组k值最大的项,并将该k值对应的个人属性集Q和对应的诊断证型标记为确定例并存储至存储模块;步骤四:分析模块对所有患者的个人属性集i进行并运算,得到属性总集h,并计算属性总集h内各个元素的在所有案例中出现的频率f,并选取f>80%的元素作为相关度因素γ,并进行编号为γ1、γ2、γ3、……、γn,再...

【专利技术属性】
技术研发人员:金力彭代银沈同平储全根许钒王鹏蔡标阚红星周晴卢海妹
申请(专利权)人:金力
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1