【技术实现步骤摘要】
本专利技术涉及医疗数据,尤其涉及一种elasticsearch数据库的医疗数据同步一致性校验方法和系统。
技术介绍
1、随着医院信息化的快速发展,各医疗机构积累了海量医疗数据,陆续建立了面向临床科研应用的资源数据中心(research data repository,rdr)。针对临床科研需求,资源数据中心对医疗数据进行后结构、加工清洗等数据治理过程,将数据存储于分布式文件存储数据库mongodb中,同时为了能够实现灵活、高效的数据检索功能(包括全文检索、级联检索等),进而实现自然语言查询、知识图谱、机器问答、大数据分析、大数据挖掘等功能,在mongodb基础上同步将数据存储在搜索引擎数据库elasticsearch中,通过对患者整个诊次数据的嵌套存储以实现复杂检索。
2、mongodb中的数据同步到elasticsearch过程中,经常会出现数据不一致的情况。数据一致性的程度是评价数据质量的重要指标,决定了后续统计分析结果的可靠性。因此,如何高效的将elasticsearch中的嵌套数据与上游mongodb中的数据进行一致
...【技术保护点】
1.一种基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下公式计算切片时间大小:
3.根据权利要求1所述的基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,识别聚合同步过程中的异常数据形成异常数据信息表,包括:
4.根据权利要求3所述的基于Elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下方式判断是否存在格式异常:
...【技术特征摘要】
1.一种基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下公式计算切片时间大小:
3.根据权利要求1所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,识别聚合同步过程中的异常数据形成异常数据信息表,包括:
4.根据权利要求3所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下方式判断是否存在格式异常:
5.根据权利要求3所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于,采用以下方式判断是否存在加密异常:
6.根据权利要求1所述的基于elasticsearch数据库的医疗数据同步一致性校验方法,其特征在于...
【专利技术属性】
技术研发人员:席韩旭,王飞,李文桓,计虹,李维,张晨,陈联忠,胡可云,
申请(专利权)人:北京大学第三医院北京大学第三临床医学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。