【技术实现步骤摘要】
一种中医内科患者数据信息处理方法、系统、装置
本专利技术属于中医内科信息处理
,尤其涉及一种中医内科患者数据信息处理方法、系统、装置。
技术介绍
现在对中医的认可度越来越高,人们也普遍认为中医也能够很好的治疗疾病,甚至一些西医难以治疗或难以找到病因的疾病,通过中医的诊治、治疗能够起到很好的治疗效果。随着中医就诊、入住院人数的增加,患者数据的量级成几何倍数的提升,对患者信息的存储、分类及处理就带来了严峻的考验:首先是中医患者数据的统一管理问题。目前的现状是就诊和入住院的系统是分开的,问诊的医生看不到患者的入住院信息,入住院的医生看不到就诊患者的信息,而且门诊和病房的信息不能互通,这给医生的诊断带来的一定的繁琐,造成患者的信息、数据不能及时获取,增加了问诊时间。其次是中医患者数据的模糊匹配问题。在分散于多处的患者数据库中,精准的得到某一特定患者的所有数据往往是一个挑战。一个比较简单的逻辑是通过身份证号,手机号等ID来唯一的确定某段数据归属何人。然而,并非所有数据集都录有患者的ID信息,更多被记录的只是患者的姓名、年龄、性别等高重复性的数据。采用手机号来作为ID也是不合理的,很多手机号没有经过实名认证,往往只是作为临时使用,而且不同人可以重复使用同一个手机号。所以,当进行患者数据的归属匹配时,往往要进行模糊匹配。这就需要设计一套可靠的模糊匹配算法,运用大数据的处理方法,尽可能的提高匹配的成功率。最后是如何优化海量中医患者数据的查询速度和存储成本的问题。一个中医患者的数据往往会包括轻量级的元数据 ...
【技术保护点】
1.一种中医内科患者数据信息处理方法,其特征在于,应用于客户端,所述中医内科患者数据信息处理方法包括:/n第一步,将数据采集器采集的患者信息及数据存储进基于分布式文件系统的数据库中,按照采集对象和数据相对应的原则,将所述采集对象和数据表示为对象标识ID与对应的操作ID及对应的结果数据之间的匹配关系,并对在存入所述基于分布式文件系统的数据库前的满足所述匹配关系的数据进行格式检查;/n第二步,对所述格式检查后的所述数据库中的数据进行密钥加密;/n第三步,对加密后数据运用统计分析、机器学习的方法,找出数据中的规律,按照患者数据Name属性与预处理的患者信息及数据进行语义匹配,实现解密存储在所述数据库中的患者信息,并调取存储在所述数据库中的患者历次就诊信息、入住院信息;/n在数据量较小,单台计算机读取患者的就诊卡信息与数据库存储的患者信息及数据,定义语义相似阈值r
【技术特征摘要】
1.一种中医内科患者数据信息处理方法,其特征在于,应用于客户端,所述中医内科患者数据信息处理方法包括:
第一步,将数据采集器采集的患者信息及数据存储进基于分布式文件系统的数据库中,按照采集对象和数据相对应的原则,将所述采集对象和数据表示为对象标识ID与对应的操作ID及对应的结果数据之间的匹配关系,并对在存入所述基于分布式文件系统的数据库前的满足所述匹配关系的数据进行格式检查;
第二步,对所述格式检查后的所述数据库中的数据进行密钥加密;
第三步,对加密后数据运用统计分析、机器学习的方法,找出数据中的规律,按照患者数据Name属性与预处理的患者信息及数据进行语义匹配,实现解密存储在所述数据库中的患者信息,并调取存储在所述数据库中的患者历次就诊信息、入住院信息;
在数据量较小,单台计算机读取患者的就诊卡信息与数据库存储的患者信息及数据,定义语义相似阈值rm;
所述患者数据Name属性与预处理的患者信息及数据分为字符串序列N1=n11,n12,…,n1m及N2=n21,n22,…,n2n;
判别n1i是否包含N2中的字符串,i=1,2,…,m,若包含,则count1++;同理判断n2j是否包含N1中的字符串,j=1,2,…,n,若包含,则count2++;
计算匹配分数
若score≥rm,则匹配超过阈值rm,匹配成功;否则匹配未达到阈值rm,匹配失败,继续读取数据库中的下一组存储的患者信息及数据;
将所有匹配成功的患者信息进行合并和去重,并分配对象标识ID为该系统中用以识别对象的唯一标识;将各操作对应的结果数据分配操作ID为该系统中各所述对象所执行的操作的统一标识;
将模糊匹配后的对象标识ID及对应的患者信息,操作ID及对应的结果数据存入数据库;
在数据量超过单台计算机处理能力,采用海量数据下的集合模糊匹配关联算法,FMLASH算法进行解密;
第四步,基于解密后的所述患者信息,匹配到的患者数据反馈到智能终端。
2.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,按照采集对象和数据相对应的原则包括:若干患者信息及数据对象,均用以执行操作,并产生与所述操作对应的结果数据;
所述的对象标识ID为用以识别对象的唯一标识;
所述的操作ID为各所述对象所执行的操作的统一标识。
3.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,所述密钥加密处理包括:数据库根据安全参数λ,选取阶均为大素数p的椭圆曲线群G与乘法群GT、模p剩余类的一个域Zp、一个对称双线性配对映射e:G×G→GT,同时从G中选择两个生成元g1,g2;此外,数据库选择一个单向哈希函数H:{0,1}*→G、一个伪随机函数f、一个伪随机置换函数π;最后,数据库公开系统参数
智能终端或移动终端随机选取私钥计算公钥同理数据库随机选取私钥计算公钥pk=gpkβ,同时计算一个验证参数γ=gpkinv,其中inv·β≡1(modp);智能终端或移动终端各自选取签名密钥对;
加密密钥对k组原始数据进行随机循环移位和迭代异或运算,即加密密钥对k组原始数据进行喷泉码随机化运算,其结果再进行密钥加扰运算,获得k组密文数据;k组密文数据进行逆向密钥解扰运算,其结果再与解密密钥进行逆向随机循环移位和迭代异或运算,即其结果再与解密密钥进行逆向喷泉码随机化运算,恢复k组原始数据。
4.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,所述数据采集器识别就诊卡的条形码信息,通过USB数据线将信息传输到智能终端上,智能终端根据患者的信息,解密存储在数据库中的患者信息;
所述FMLASH算法基于关键字对数据进行哈希分区,拥有相同关键字的数据被分到同一个分组,但对于需要进行关联的属性值不能直接用作关键字来进行分区操作,相反,使用从其他属性值中产生的签名作为分区关键字,只有当关联的属性值具有至少一个公共签名时才有可能匹配,签名可以是一个字符串中各个单词的列表,也可以是匹配字符串长度的变化区间;
数据增加时关联操作在Hadoop固有的分块策略基础之上对其分块策略再进一步优化,即在分块后再分阶段处理;针对数据处理过程中失真,同一人名或者地址在不同的集合中会出现一定的差异,即使匹配了也不可能总是做到精确的匹配,实际上是满足某个匹配阈值的;即给定两个记录文件R和S、度量函数sim和一个模糊匹配度阈值,该值随着情况改变而动态改变,找出两个集合中的所有记录对S.a和R.a,且满足sim(S.a,R.a)≥k(模糊值);FMLASH算法提出了适用度模糊匹配计算方法,使用一定的标准函数度量集合之间的模糊匹配度,对于满足度量标准的数据再进行关联操作。
5.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,所述中医内科患者数据信息处理方法还包括数据库内患者数据的大数据优化;
(1)对患者数据信息设置存储阈值rs;如患者数据库及索引数据库小于阈值rs的大小,则不设存储期限;否则患者数据信息将于存储时限过后自动清空;小的存储阈值rs保存元数据,大的存储阈值rs则保存更多的流水数据及多媒体数据;
(2)设立索引数据库:对数据库生成并存储对象索引数据库,该对象索引数据为对象标识ID和操作ID的集合;该对象索引数...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。