一种基于Elasticsearch数据库的医疗数据同步一致性校验方法和系统技术方案

技术编号:43676887 阅读:31 留言:0更新日期:2024-12-18 21:00
本发明专利技术涉及一种基于Elasticsearch数据库的医疗数据同步一致性校验方法和系统,属于医疗数据处理技术领域,解决了现有技术中一致性校验存储资源和耗时高的问题。方法包括以下步骤:将分布式文件数据库中的医疗数据按诊次聚合同步到Elasticsearch数据库中;识别聚合同步过程中的异常数据形成异常数据信息表;基于就诊次数计算切片时间大小得到每个切片的时间范围,按照每个切片的时间范围在Elasticsearch数据库和分布式文件数据库提取每个切片对应的医疗数据进行比对,查找不一致的数据;将异常数据信息表和不一致的数据进行比对得到一致性校验结果。实现了快速的一致性校验和溯源。

【技术实现步骤摘要】

本专利技术涉及医疗数据,尤其涉及一种elasticsearch数据库的医疗数据同步一致性校验方法和系统。


技术介绍

1、随着医院信息化的快速发展,各医疗机构积累了海量医疗数据,陆续建立了面向临床科研应用的资源数据中心(research data repository,rdr)。针对临床科研需求,资源数据中心对医疗数据进行后结构、加工清洗等数据治理过程,将数据存储于分布式文件存储数据库mongodb中,同时为了能够实现灵活、高效的数据检索功能(包括全文检索、级联检索等),进而实现自然语言查询、知识图谱、机器问答、大数据分析、大数据挖掘等功能,在mongodb基础上同步将数据存储在搜索引擎数据库elasticsearch中,通过对患者整个诊次数据的嵌套存储以实现复杂检索。

2、mongodb中的数据同步到elasticsearch过程中,经常会出现数据不一致的情况。数据一致性的程度是评价数据质量的重要指标,决定了后续统计分析结果的可靠性。因此,如何高效的将elasticsearch中的嵌套数据与上游mongodb中的数据进行一致性检测,是建设高质量本文档来自技高网...

【技术保护点】

1.一种基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下公式计算切片时间大小:

3.根据权利要求1所述的基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,识别聚合同步过程中的异常数据形成异常数据信息表,包括:

4.根据权利要求3所述的基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下方式判断是否存在格式异常:

5.根据权利要...

【技术特征摘要】

1.一种基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下公式计算切片时间大小:

3.根据权利要求1所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,识别聚合同步过程中的异常数据形成异常数据信息表,包括:

4.根据权利要求3所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下方式判断是否存在格式异常:

5.根据权利要求3所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下方式判断是否存在加密异常:

6.根据权利要求1所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于...

【专利技术属性】
技术研发人员:席韩旭王飞李文桓计虹李维张晨陈联忠胡可云
申请(专利权)人:北京大学第三医院北京大学第三临床医学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1