【技术实现步骤摘要】
数据归一方法及装置、计算机可读存储介质、电子设备
本公开涉及计算机
,尤其涉及一种数据归一方法与数据归一装置、计算机可读存储介质及电子设备。
技术介绍
在医院的医嘱药品数据中往往包含药品名称、剂型、规格以及生产厂商等多种混合数据,但多种混合数据没有明确的文本模板。在药品用药统计、分析、展示和挖掘等诸多应用场景中,杂乱无章的数据给各种应用造成极大不便,因此,各业务场景对医嘱药品数据提出了包括清洗、标准化和填充等技术需求。在对医嘱药品数据的标准化处理过程中,主要采用人工标注词典匹配的方式,实现数据的清洗和标准化处理。但是这种方式依赖人工标注,速度慢且成本高,准确率也无法得到有效保证。除此之外,还可以对数据字典和正则表达式进行清洗,剔除医嘱药品数据中的无用信息,并对正则表达式的多个关键词进行匹配映射处理,实现医嘱药品数据的标准化。但是正则表达式的规则设计十分复杂,相互之间容易出现冲突,维护成本较高。鉴于此,本领域亟需开发一种新的数据归一方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对 ...
【技术保护点】
1.一种数据归一方法,其特征在于,所述方法包括:/n获取标准数据,并根据所述标准数据的分类标签建立结构化数据实体;/n根据所述分类标签对所述结构化数据实体进行划分,并根据划分结果确定粗粒度规则和细粒度规则;/n获取所述待处理数据,并根据所述待处理数据确定满足所述粗粒度规则和所述细粒度规则的所述标准数据为归一数据。/n
【技术特征摘要】
1.一种数据归一方法,其特征在于,所述方法包括:
获取标准数据,并根据所述标准数据的分类标签建立结构化数据实体;
根据所述分类标签对所述结构化数据实体进行划分,并根据划分结果确定粗粒度规则和细粒度规则;
获取所述待处理数据,并根据所述待处理数据确定满足所述粗粒度规则和所述细粒度规则的所述标准数据为归一数据。
2.根据权利要求1所述的数据归一方法,其特征在于,所述根据所述标准数据的分类标签建立结构化数据实体,包括:
获取与所述标准数据对应的分类标签,并确定所述标准数据的数据标识;
对所述分类标签与所述数据标识建立映射关系,并根据所述映射关系建立结构化数据实体。
3.根据权利要求1所述的数据归一方法,其特征在于,所述根据划分结果确定粗粒度规则和细粒度规则,包括:
对所述分类标签进行划分,以在所述分类标签中确定粗粒度标签和细粒度标签;
将所述粗粒度标签下的所述标准数据进行划分,并将与划分后的所述标准数据对应的规则确定为粗粒度规则;
将所述细粒度标签下的所述标准数据进行划分,并将与划分后的所述标准数据对应的规则确定为细粒度规则。
4.根据权利要求3所述的数据归一方法,其特征在于,所述根据所述待处理数据确定满足所述粗粒度规则和所述细粒度规则的所述标准数据为归一数据,包括:
基于所述粗粒度规则,若在所述结构化数据实体中查询到与所述待处理数据对应的所述标准数据,确定所述待处理数据为目标待处理数据;
基于所述细粒度规则,若在所述结构化数据实体中查询到与所述待处理数据对应的所述标准数据,确定所述目标待处理数据为待归一数据;
将所述待归一数据对应的所述标准数据确定为归一数据。
5.根据权利要求4所述的数据归一方法,其特征在于,所述基于所述粗粒度规则,若在所述结构化数据实体中查询到与所述待处理数据对应的所述标准数据,确定所述待处理数据为目标待处理数据,包括:...
【专利技术属性】
技术研发人员:张黎,
申请(专利权)人:北京懿医云科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。