一种中医内科患者数据信息处理方法、系统、装置制造方法及图纸

技术编号：26973742 阅读：29 留言：0更新日期：2021-01-06 00:07

本发明专利技术属于中医内科信息处理技术领域，公开了一种中医内科患者数据信息处理方法、系统、装置，数据采集器采集就诊卡的患者信息及数据，存储进基于分布式文件系统的数据库中，按照采集对象和数据相对应的原则，对在存入数据库前进行格式检查，防止坏数据的存入；对患者信息及数据对象表示为对象标识ID与对应的操作ID及对应的结果数据的之间的匹配关系，提高患者信息及数据存储的效率，扩展性好，能够快速响应用户需求的变化。将预处理的患者信息及数据运用统计分析、机器学习方法，找出数据中的规律，输入密钥，按照患者数据Name属性与预处理的患者信息及数据进行语义匹配提高了数据的匹配成功率，对于提高医生的工作效率有很大帮助。

全部详细技术资料下载

【技术实现步骤摘要】
一种中医内科患者数据信息处理方法、系统、装置
本专利技术属于中医内科信息处理
，尤其涉及一种中医内科患者数据信息处理方法、系统、装置。
技术介绍
现在对中医的认可度越来越高，人们也普遍认为中医也能够很好的治疗疾病，甚至一些西医难以治疗或难以找到病因的疾病，通过中医的诊治、治疗能够起到很好的治疗效果。随着中医就诊、入住院人数的增加，患者数据的量级成几何倍数的提升，对患者信息的存储、分类及处理就带来了严峻的考验：首先是中医患者数据的统一管理问题。目前的现状是就诊和入住院的系统是分开的，问诊的医生看不到患者的入住院信息，入住院的医生看不到就诊患者的信息，而且门诊和病房的信息不能互通，这给医生的诊断带来的一定的繁琐，造成患者的信息、数据不能及时获取，增加了问诊时间。其次是中医患者数据的模糊匹配问题。在分散于多处的患者数据库中，精准的得到某一特定患者的所有数据往往是一个挑战。一个比较简单的逻辑是通过身份证号，手机号等ID来唯一的确定某段数据归属何人。然而，并非所有数据集都录有患者的ID信息，更多被记录的只是患者的...

【技术保护点】
1.一种中医内科患者数据信息处理方法，其特征在于，应用于客户端，所述中医内科患者数据信息处理方法包括：/n第一步，将数据采集器采集的患者信息及数据存储进基于分布式文件系统的数据库中，按照采集对象和数据相对应的原则，将所述采集对象和数据表示为对象标识ID与对应的操作ID及对应的结果数据之间的匹配关系，并对在存入所述基于分布式文件系统的数据库前的满足所述匹配关系的数据进行格式检查；/n第二步，对所述格式检查后的所述数据库中的数据进行密钥加密；/n第三步，对加密后数据运用统计分析、机器学习的方法，找出数据中的规律，按照患者数据Name属性与预处理的患者信息及数据进行语义匹配，实现解密存储在所述数据库...

【技术特征摘要】
1.一种中医内科患者数据信息处理方法，其特征在于，应用于客户端，所述中医内科患者数据信息处理方法包括：
第一步，将数据采集器采集的患者信息及数据存储进基于分布式文件系统的数据库中，按照采集对象和数据相对应的原则，将所述采集对象和数据表示为对象标识ID与对应的操作ID及对应的结果数据之间的匹配关系，并对在存入所述基于分布式文件系统的数据库前的满足所述匹配关系的数据进行格式检查；
第二步，对所述格式检查后的所述数据库中的数据进行密钥加密；
第三步，对加密后数据运用统计分析、机器学习的方法，找出数据中的规律，按照患者数据Name属性与预处理的患者信息及数据进行语义匹配，实现解密存储在所述数据库中的患者信息，并调取存储在所述数据库中的患者历次就诊信息、入住院信息；
在数据量较小，单台计算机读取患者的就诊卡信息与数据库存储的患者信息及数据，定义语义相似阈值rm；
所述患者数据Name属性与预处理的患者信息及数据分为字符串序列N1＝n11，n12，…，n1m及N2＝n21，n22，…，n2n；
判别n1i是否包含N2中的字符串，i＝1，2，…，m，若包含，则count1++；同理判断n2j是否包含N1中的字符串，j＝1，2，…，n，若包含，则count2++；
计算匹配分数
若score≥rm，则匹配超过阈值rm，匹配成功；否则匹配未达到阈值rm，匹配失败，继续读取数据库中的下一组存储的患者信息及数据；
将所有匹配成功的患者信息进行合并和去重，并分配对象标识ID为该系统中用以识别对象的唯一标识；将各操作对应的结果数据分配操作ID为该系统中各所述对象所执行的操作的统一标识；
将模糊匹配后的对象标识ID及对应的患者信息，操作ID及对应的结果数据存入数据库；
在数据量超过单台计算机处理能力，采用海量数据下的集合模糊匹配关联算法，FMLASH算法进行解密；
第四步，基于解密后的所述患者信息，匹配到的患者数据反馈到智能终端。

2.如权利要求1所述的中医内科患者数据信息处理方法，其特征在于，按照采集对象和数据相对应的原则包括：若干患者信息及数据对象，均用以执行操作，并产生与所述操作对应的结果数据；
所述的对象标识ID为用以识别对象的唯一标识；
所述的操作ID为各所述对象所执行的操作的统一标识。

3.如权利要求1所述的中医内科患者数据信息处理方法，其特征在于，所述密钥加密处理包括：数据库根据安全参数λ，选取阶均为大素数p的椭圆曲线群G与乘法群GT、模p剩余类的一个域Zp、一个对称双线性配对映射e：G×G→GT，同时从G中选择两个生成元g1，g2；此外，数据库选择一个单向哈希函数H：{0，1}*→G、一个伪随机函数f、一个伪随机置换函数π；最后，数据库公开系统参数
智能终端或移动终端随机选取私钥计算公钥同理数据库随机选取私钥计算公钥pk＝gpkβ，同时计算一个验证参数γ＝gpkinv，其中inv·β≡1(modp)；智能终端或移动终端各自选取签名密钥对；
加密密钥对k组原始数据进行随机循环移位和迭代异或运算，即加密密钥对k组原始数据进行喷泉码随机化运算，其结果再进行密钥加扰运算，获得k组密文数据；k组密文数据进行逆向密钥解扰运算，其结果再与解密密钥进行逆向随机循环移位和迭代异或运算，即其结果再与解密密钥进行逆向喷泉码随机化运算，恢复k组原始数据。

4.如权利要求1所述的中医内科患者数据信息处理方法，其特征在于，所述数据采集器识别就诊卡的条形码信息，通过USB数据线将信息传输到智能终端上，智能终端根据患者的信息，解密存储在数据库中的患者信息；
所述FMLASH算法基于关键字对数据进行哈希分区，拥有相同关键字的数据被分到同一个分组，但对于需要进行关联的属性值不能直接用作关键字来进行分区操作，相反，使用从其他属性值中产生的签名作为分区关键字，只有当关联的属性值具有至少一个公共签名时才有可能匹配，签名可以是一个字符串中各个单词的列表，也可以是匹配字符串长度的变化区间；
数据增加时关联操作在Hadoop固有的分块策略基础之上对其分块策略再进一步优化，即在分块后再分阶段处理；针对数据处理过程中失真，同一人名或者地址在不同的集合中会出现一定的差异，即使匹配了也不可能总是做到精确的匹配，实际上是满足某个匹配阈值的；即给定两个记录文件R和S、度量函数sim和一个模糊匹配度阈值，该值随着情况改变而动态改变，找出两个集合中的所有记录对S.a和R.a，且满足sim(S.a，R.a)≥k(模糊值)；FMLASH算法提出了适用度模糊匹配计算方法，使用一定的标准函数度量集合之间的模糊匹配度，对于满足度量标准的数据再进行关联操作。

5.如权利要求1所述的中医内科患者数据信息处理方法，其特征在于，所述中医内科患者数据信息处理方法还包括数据库内患者数据的大数据优化；
(1)对患者数据信息设置存储阈值rs；如患者数据库及索引数据库小于阈值rs的大小，则不设存储期限；否则患者数据信息将于存储时限过后自动清空；小的存储阈值rs保存元数据，大的存储阈值rs则保存更多的流水数据及多媒体数据；
(2)设立索引数据库：对数据库生成并存储对象索引数据库，该对象索引数据为对象标识ID和操作ID的集合；该对象索引数...

【专利技术属性】
技术研发人员：毛真真，
申请(专利权)人：毛真真，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人