当前位置: 首页 > 专利查询>毛真真专利>正文

一种中医内科患者数据信息处理方法、系统、装置制造方法及图纸

技术编号:26973742 阅读:15 留言:0更新日期:2021-01-06 00:07
本发明专利技术属于中医内科信息处理技术领域,公开了一种中医内科患者数据信息处理方法、系统、装置,数据采集器采集就诊卡的患者信息及数据,存储进基于分布式文件系统的数据库中,按照采集对象和数据相对应的原则,对在存入数据库前进行格式检查,防止坏数据的存入;对患者信息及数据对象表示为对象标识ID与对应的操作ID及对应的结果数据的之间的匹配关系,提高患者信息及数据存储的效率,扩展性好,能够快速响应用户需求的变化。将预处理的患者信息及数据运用统计分析、机器学习方法,找出数据中的规律,输入密钥,按照患者数据Name属性与预处理的患者信息及数据进行语义匹配提高了数据的匹配成功率,对于提高医生的工作效率有很大帮助。

【技术实现步骤摘要】
一种中医内科患者数据信息处理方法、系统、装置
本专利技术属于中医内科信息处理
,尤其涉及一种中医内科患者数据信息处理方法、系统、装置。
技术介绍
现在对中医的认可度越来越高,人们也普遍认为中医也能够很好的治疗疾病,甚至一些西医难以治疗或难以找到病因的疾病,通过中医的诊治、治疗能够起到很好的治疗效果。随着中医就诊、入住院人数的增加,患者数据的量级成几何倍数的提升,对患者信息的存储、分类及处理就带来了严峻的考验:首先是中医患者数据的统一管理问题。目前的现状是就诊和入住院的系统是分开的,问诊的医生看不到患者的入住院信息,入住院的医生看不到就诊患者的信息,而且门诊和病房的信息不能互通,这给医生的诊断带来的一定的繁琐,造成患者的信息、数据不能及时获取,增加了问诊时间。其次是中医患者数据的模糊匹配问题。在分散于多处的患者数据库中,精准的得到某一特定患者的所有数据往往是一个挑战。一个比较简单的逻辑是通过身份证号,手机号等ID来唯一的确定某段数据归属何人。然而,并非所有数据集都录有患者的ID信息,更多被记录的只是患者的姓名、年龄、性别等高重复性的数据。采用手机号来作为ID也是不合理的,很多手机号没有经过实名认证,往往只是作为临时使用,而且不同人可以重复使用同一个手机号。所以,当进行患者数据的归属匹配时,往往要进行模糊匹配。这就需要设计一套可靠的模糊匹配算法,运用大数据的处理方法,尽可能的提高匹配的成功率。最后是如何优化海量中医患者数据的查询速度和存储成本的问题。一个中医患者的数据往往会包括轻量级的元数据:姓名、联系方式、年龄、性别等;中量级的流水数据:就诊历史、药方、账单等;也会包括重量级的多媒体数据:X光高清照片,核磁共振成像等。一个患者的数据,小的只有几KB,大的会有几GB甚至几十GB。考虑到一个医院往往要服务于几十万居民,它的患者信息系统必须得能够在TB级数据量下还能满足快速查询和低成本存储的要求。这就要求必须对患者信息系统作出相应的优化。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种中医内科患者数据信息处理方法、系统、装置。本专利技术的附加特征和优点将在随后的描述中阐述,其中一部分将从描述中变得明显,或者可以通过实践在此公开的原理而学习到这些特征与优点。本专利技术的附加特征和优点可以借助在权利要求中具体指出的仪器和组合来实现和获得。这些和其他的本专利技术特征将从随后的描述和权利要求中变得更为完全地明显,或者可以通过实践在此阐述的原理来获得。本专利技术是这样实现的,一种中医内科患者数据信息处理方法包括以下步骤:第一步,统一患者信息数据格式。数据采集器采集就诊卡的患者信息及数据,存储进基于分布式文件系统的数据库中,按照采集对象和数据相对应的原则,并对在存入数据库前进行格式检查,防止坏数据的存入;对患者信息及数据对象表示为对象标识ID与对应的操作ID及对应的结果数据的之间的匹配关系,提高了患者信息及数据存储的效率,同时扩展性更好,能够快速响应用户需求的变化。第二步,患者数据的加密存储。将第一步所述数据库进行密钥加密处理;提高了数据的可靠性、安全性,便于保护患者的隐私。第三步,患者就诊时,数据采集器识别就诊卡的条形码等信息,通过USB数据线将信息传输到智能终端上,智能终端根据患者的信息,解密存储在数据库中的患者信息,采用模糊匹配的方法,调取存储在数据库中的患者历次就诊信息、入住院信息等。所述模糊匹配方法将预处理的患者信息及数据运用统计分析、机器学习的方法,找出数据中的规律,按照患者数据Name属性与预处理的患者信息及数据进行语义匹配。在数据量较小,单台计算机可以处理时,所述模糊匹配方法采用单机处理算法:在数据量超过了单台计算机处理能力(超过存储介质容量上限)时,所述模糊匹配方法采用海量数据下的一种集合模糊匹配关联算法,如FMLASH算法(AFuzzyMatchingLinkingAlgorithmaboutSetunderHadoop)。该方法的关键为基于关键字对数据进行哈希分区,拥有相同关键字的数据被分到同一个分组,但对于需要进行关联的属性值不能直接用作关键字来进行分区操作,相反,使用从其他属性值中产生的签名作为分区关键字,只有当关联的属性值具有至少一个公共签名时才有可能匹配,签名可以是一个字符串中各个单词的列表,也可以是匹配字符串长度的变化区间。针对数据增加时关联操作效率变低的问题,该算法在Hadoop固有的分块策略基础之上对其分块策略再进一步优化,即在分块后再分阶段处理。针对数据处理过程中失真问题,如同一人名或者地址在不同的集合中会出现一定的差异,即使匹配了也不可能总是做到精确的匹配,实际上是满足某个匹配阈值的。即给定两个记录文件R和S、度量函数sim和一个模糊匹配度阈值,该值随着情况改变而动态改变,找出两个集合中的所有记录对S.a和R.a,且满足sim(S.a,R.a)≥k(模糊值)。针对该问题,FMLASH算法提出了更广泛的适用度模糊匹配计算方法,即使用一定的标准函数度量集合之间的模糊匹配度,对于满足度量标准的数据再进行关联操作。通过与当前存在的较好处理集合数据的匹配关联算法对比,在集合数据的匹配关联领域表现出了更广阔的应用前景。第四步,匹配到的患者数据反馈到智能终端中,问诊医生获取这些信息,然后结合患者的当场描述进行问诊;病房的医生也可以通过智能终端、移动终端由数据库调取患者的历次就诊信息、入住院信息等,及时的了解患者的信息,便于制定适合的治疗方案。本专利技术提供的中医内科患者数据信息处理方法,还包括数据库内患者数据的大数据优化。设立备份数据库:本专利技术为了解决数据的存储安全,设立了Oracle数据库备份系统;同时为了解决备份数据库中存在大量重复数据的问题,设计了数据块指纹去重机制。具体操作如下:在备份数据库中,首先生成临时备份患者信息及数据文件,然后把临时患者信息及数据文件划分成不重叠的块,通过哈希算法计算每个块的指纹值。然后在备份数据库建立hash表记录已存储患者信息及数据的指纹值;通过对比指纹值,检测重复数据。为了提高数据安全性,采用了一定的安全机制来防止信息泄露以及数据丢失。实验证明,该系统在实现远程备份的同时,有效地减少了备份的数据。将数据块的指纹值与备份系统索引表中存储的指纹值比较,判断传过来的数据块是否已经存在于备份数据库中。如果不是重复的数据块,就将数据块和数据块的指纹值写入备份数据库的存储服务器中。随着备份数据库中数据块的增多,索引表也越来越大,搜索索引表中的指纹值会变得很低效,为了解决这个问题,对索引表引入二级索引缓存,内存中存放第一级缓存,里面的指纹值是最近发送过来的数据块的指纹值。磁盘中存放第二级缓存,内存中换出的指纹值放在第二级缓存中。本专利技术实施例提供的中医内科患者数据信息处理装置的智能终端还包括:数据处理模块:用于读取存储于本地或服务器的数据,验证登录信息、初始化客户端,并上传数据至数据库,分别标记已上传数据和未上传数据,使得智能终端能通过多种方式,获取到正确的数据,以维持本文档来自技高网
...

【技术保护点】
1.一种中医内科患者数据信息处理方法,其特征在于,应用于客户端,所述中医内科患者数据信息处理方法包括:/n第一步,将数据采集器采集的患者信息及数据存储进基于分布式文件系统的数据库中,按照采集对象和数据相对应的原则,将所述采集对象和数据表示为对象标识ID与对应的操作ID及对应的结果数据之间的匹配关系,并对在存入所述基于分布式文件系统的数据库前的满足所述匹配关系的数据进行格式检查;/n第二步,对所述格式检查后的所述数据库中的数据进行密钥加密;/n第三步,对加密后数据运用统计分析、机器学习的方法,找出数据中的规律,按照患者数据Name属性与预处理的患者信息及数据进行语义匹配,实现解密存储在所述数据库中的患者信息,并调取存储在所述数据库中的患者历次就诊信息、入住院信息;/n在数据量较小,单台计算机读取患者的就诊卡信息与数据库存储的患者信息及数据,定义语义相似阈值r

【技术特征摘要】
1.一种中医内科患者数据信息处理方法,其特征在于,应用于客户端,所述中医内科患者数据信息处理方法包括:
第一步,将数据采集器采集的患者信息及数据存储进基于分布式文件系统的数据库中,按照采集对象和数据相对应的原则,将所述采集对象和数据表示为对象标识ID与对应的操作ID及对应的结果数据之间的匹配关系,并对在存入所述基于分布式文件系统的数据库前的满足所述匹配关系的数据进行格式检查;
第二步,对所述格式检查后的所述数据库中的数据进行密钥加密;
第三步,对加密后数据运用统计分析、机器学习的方法,找出数据中的规律,按照患者数据Name属性与预处理的患者信息及数据进行语义匹配,实现解密存储在所述数据库中的患者信息,并调取存储在所述数据库中的患者历次就诊信息、入住院信息;
在数据量较小,单台计算机读取患者的就诊卡信息与数据库存储的患者信息及数据,定义语义相似阈值rm;
所述患者数据Name属性与预处理的患者信息及数据分为字符串序列N1=n11,n12,…,n1m及N2=n21,n22,…,n2n;
判别n1i是否包含N2中的字符串,i=1,2,…,m,若包含,则count1++;同理判断n2j是否包含N1中的字符串,j=1,2,…,n,若包含,则count2++;
计算匹配分数
若score≥rm,则匹配超过阈值rm,匹配成功;否则匹配未达到阈值rm,匹配失败,继续读取数据库中的下一组存储的患者信息及数据;
将所有匹配成功的患者信息进行合并和去重,并分配对象标识ID为该系统中用以识别对象的唯一标识;将各操作对应的结果数据分配操作ID为该系统中各所述对象所执行的操作的统一标识;
将模糊匹配后的对象标识ID及对应的患者信息,操作ID及对应的结果数据存入数据库;
在数据量超过单台计算机处理能力,采用海量数据下的集合模糊匹配关联算法,FMLASH算法进行解密;
第四步,基于解密后的所述患者信息,匹配到的患者数据反馈到智能终端。


2.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,按照采集对象和数据相对应的原则包括:若干患者信息及数据对象,均用以执行操作,并产生与所述操作对应的结果数据;
所述的对象标识ID为用以识别对象的唯一标识;
所述的操作ID为各所述对象所执行的操作的统一标识。


3.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,所述密钥加密处理包括:数据库根据安全参数λ,选取阶均为大素数p的椭圆曲线群G与乘法群GT、模p剩余类的一个域Zp、一个对称双线性配对映射e:G×G→GT,同时从G中选择两个生成元g1,g2;此外,数据库选择一个单向哈希函数H:{0,1}*→G、一个伪随机函数f、一个伪随机置换函数π;最后,数据库公开系统参数
智能终端或移动终端随机选取私钥计算公钥同理数据库随机选取私钥计算公钥pk=gpkβ,同时计算一个验证参数γ=gpkinv,其中inv·β≡1(modp);智能终端或移动终端各自选取签名密钥对;
加密密钥对k组原始数据进行随机循环移位和迭代异或运算,即加密密钥对k组原始数据进行喷泉码随机化运算,其结果再进行密钥加扰运算,获得k组密文数据;k组密文数据进行逆向密钥解扰运算,其结果再与解密密钥进行逆向随机循环移位和迭代异或运算,即其结果再与解密密钥进行逆向喷泉码随机化运算,恢复k组原始数据。


4.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,所述数据采集器识别就诊卡的条形码信息,通过USB数据线将信息传输到智能终端上,智能终端根据患者的信息,解密存储在数据库中的患者信息;
所述FMLASH算法基于关键字对数据进行哈希分区,拥有相同关键字的数据被分到同一个分组,但对于需要进行关联的属性值不能直接用作关键字来进行分区操作,相反,使用从其他属性值中产生的签名作为分区关键字,只有当关联的属性值具有至少一个公共签名时才有可能匹配,签名可以是一个字符串中各个单词的列表,也可以是匹配字符串长度的变化区间;
数据增加时关联操作在Hadoop固有的分块策略基础之上对其分块策略再进一步优化,即在分块后再分阶段处理;针对数据处理过程中失真,同一人名或者地址在不同的集合中会出现一定的差异,即使匹配了也不可能总是做到精确的匹配,实际上是满足某个匹配阈值的;即给定两个记录文件R和S、度量函数sim和一个模糊匹配度阈值,该值随着情况改变而动态改变,找出两个集合中的所有记录对S.a和R.a,且满足sim(S.a,R.a)≥k(模糊值);FMLASH算法提出了适用度模糊匹配计算方法,使用一定的标准函数度量集合之间的模糊匹配度,对于满足度量标准的数据再进行关联操作。


5.如权利要求1所述的中医内科患者数据信息处理方法,其特征在于,所述中医内科患者数据信息处理方法还包括数据库内患者数据的大数据优化;
(1)对患者数据信息设置存储阈值rs;如患者数据库及索引数据库小于阈值rs的大小,则不设存储期限;否则患者数据信息将于存储时限过后自动清空;小的存储阈值rs保存元数据,大的存储阈值rs则保存更多的流水数据及多媒体数据;
(2)设立索引数据库:对数据库生成并存储对象索引数据库,该对象索引数据为对象标识ID和操作ID的集合;该对象索引数...

【专利技术属性】
技术研发人员:毛真真
申请(专利权)人:毛真真
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1