一种记录对决策方法和装置制造方法及图纸

技术编号:10867086 阅读:66 留言:1更新日期:2015-01-07 08:12
本申请提供了一种记录对决策方法,包括:获取记录对;获取用户通过脚本编译输入的用户决策条件;根据所述用户决策条件对所述记录对进行决策。本发明专利技术实施例还提供了对应的装置。本发明专利技术实施例通过MRL语言引入用户输入的决策条件,方便用户优化决策条件,提高了决策效率。

【技术实现步骤摘要】
一种记录对决策方法和装置
本申请涉及数据匹配
,特别是涉及一种记录对决策方法和装置。
技术介绍
在企业的生产活动中,会产生大量的业务数据,事实上企业很难确保其所积累数 据的质量,其原因是多种多样的,如:录入错误、完整性约束缺失、信息的多种描述方式等, 更复杂的是,相互独立的数据源不仅表述相同实体时使用的值不相同,甚至存储结构、关于 数据的基本假设也不相同。企业的生产活动又是以其数据为基础,大到市场分析、决策,小 到业务查询,都是在业务数据之上的操作。显然企业所累积数据的质量没有保障,其所做操 作也将无法保障。为了达到企业对业务数据去重的目的,需要专利技术一种高效、准确、自动的 匹配方法,快速准确地发现描述同一实体的不同记录。 了解决上述应用中的问题,现有技术提出一种记录匹配方法,主要包括:首先对标 准化记录集合进行分块获得中间记录集合;然后将中间记录集合经过此较和决策算法获得 匹配记录对。 在这种记录匹配方法中,最终的决策过程中,是需要通过预置的条件进行决策匹 配。也既是决策依赖的条件是预先设置在底层的,无法更改,对用户来说无法针对不同行业 的记录集合进行优化的条件设置,使用不便,也可能降低匹配效率。
技术实现思路
本申请所要解决的技术问题是提供一种记录对决策方法可以方便用户优化决策 条件,更快的完成匹配。相应的,本申请还提供了对应的装置。 为了解决上述问题,本申请公开了一种记录对决策方法,包括: 获取记录对; 获取用户通过脚本编译输入的用户决策条件; 根据所述用户决策条件对所述记录对进行决策。 进一步,所述根据用户决策条件对所述记录对进行决策包括: 当所述记录对满足所述用户决策条件时,输出所述记录对决策结果为匹配。 进一步,所述根据用户决策条件对所述记录对进行决策包括: 当所述记录对不满足所述用户决策条件时,则根据预置决策条件对所述记录对进 行决策。 进一步,所述获取用户通过脚本编译输入的用户决策条件包括: 获取用户通过条件表达式的形式表述的用户决策条件。 进一步,所述获取用户通过脚本编译输入的用户决策条件包括: 获取用户通过预置MRL语言输入的用户决策条件。 本申请还提供了 一种记录对决策装置,包括 记录对获取模块,用于获取记录对; 用户输入模块,用于获取用户通过脚本编译输入的用户决策条件; 决策模块,用于根据所述用户决策条件对所述记录对进行决策。 进一步,所述决策模块还用于: 当所述记录对满足所述用户决策条件时,输出所述记录对决策结果为匹配。 进一步,所述决策模块还用于: 当所述记录对不满足所述用户决策条件时,则根据预置决策条件对所述记录对进 行决策。 进一步,所述用户输入模块还用于: 获取用户通过条件表达式的形式表述的用户决策条件。 进一步,所述用户输入模块还用于: 获取用户通过预置MRL语言输入的用户决策条件。 与现有技术相比,本申请包括以下优点:通过MRL语言引入用户输入的决策条件, 方便用户优化决策条件,提高了决策效率。 【附图说明】 图1是本专利技术一种记录对决策方法一实施例的流程图; 图2是本专利技术一种记录对决策方法一实施例中决策过程示意图; 图3是本专利技术一种记录对决策方法一实施例中决策逻辑图; 图4是本专利技术一种记录对决策装置一实施例的结构示意图。 【具体实施方式】 为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本申请作进一步详细的说明。 参照图1,示出了本申请一种记录对决策方法,包括: 步骤S101、获取记录对; 在整个匹配过程中,在决策过程之前可以存在一个分块过程,通过分块将原始的 记录集合按照固定算法形成记录对集合,决策过程就在该记录对集合中获取记录对。 步骤S102、获取用户通过脚本编译输入的用户决策条件; 进一步,所述获取用户通过脚本编译输入的用户决策条件包括: 获取用户通过条件表达式的形式表述的用户决策条件。 进一步,所述获取用户通过脚本编译输入的用户决策条件包括: 获取用户通过预置MRL语言输入的用户决策条件。 在通用的记录匹配流程中,决策过程作用的对象是记录对<rl,r2>,使用的方法是 对选定的比较属性上利用不同的相似度度量算法计算其值的相似度,通过组合各此较属性 上的相似度值得到该记录对的相似度向量。相似度度量算法实际是针对两个值进行计算得 到一个数值来衡量这两个值的相似度(距离),比较成熟的算法包括:Jaro、Soundex等。决 策部分则是利用比较得到的记录对的相似度向量通过决策模型得到该记录对匹配还是不 匹配的结果,已有的算法包括:Fellegi-Sunter、KMeans等。 这两部分结合到一起产生的效果就是在选定的比较属性上,计算记录对的此较向 量,然后将该向量传给决策模型由决策模型给出决策结果(匹配/不匹配),这样并没有充 分利用业务知识来辅助其决策,也没有充分利用业务知识来降低记录对的比较复杂度。仍 以药品名称识别为例,其业务逻辑如图3所示。 其中A判断逻辑表达的意思是批准文号不空且相同的直接决策为匹配,否则进入 B判断逻辑;B判断逻辑表达的意思是公司ID不空且不相同的直接决策为不匹配,否则进入 C判断逻辑;C判断逻辑表达的意思是规格、剂型都相同且药品名称相似的决策为匹配,否 则决策为不匹配。 在本专利技术实施例中,采用MRL语言允许用户输入决策条件以供决策过程使用。使 用MRL来实现上述业务逻辑其表达方式如下: if(ID.isNotNull()andID.isEqual()){ return true; }else { if(DCID.isNotNull()andDCID.isNotEqual()){ return false; }else{ if(DForm.isEqual()andDSize.isEqual〇andDName.isSim()){ return true; }else{ returnfalse; } } } 其中返回true则表明决策结果为匹配,返回false则决策结果为不匹配 决策过程输入是记录对(上阶段的产出),其输出是对该记录对的决策结果。业 务逻辑主要表现在:记录对是否满足特定的条件来决定该记录对的决策结果。此时用户可 以输入特定条件如:ID. isNotNullOandID. isEqualO ;其表达的就是记录对在批准文号 属性上值不为空且记录对在批准文号属性上值相同,如果满足这个条件那么决策结果为匹 配,如果不满足这个条件则进入后续判断。 步骤S103、根据所述用户决策条件对所述记录对进行决策。 进一步,所述根据用户决策条件对所述记录对进行决策包括: 当所述记录对满足所述用户决策条件时,输出所述记录对决策结果为匹配。 进一步,所述根据用户决策条件对所述记录对进行决策包括: 当所述记录对不满足所述用户决策条件时,则根据预置决策条件对所述记录对进 行决策。 本专利技术实施例中首先根据用户输入的决策条件,对记录对进行决策本文档来自技高网...
一种记录对决策方法和装置

【技术保护点】
一种记录对决策方法,其特征在于,包括:获取记录对;获取用户通过脚本编译输入的用户决策条件;根据所述用户决策条件对所述记录对进行决策。

【技术特征摘要】
1. 一种记录对决策方法,其特征在于,包括: 获取记录对; 获取用户通过脚本编译输入的用户决策条件; 根据所述用户决策条件对所述记录对进行决策。2. 根据权利要求1所述的方法,其特征在于,所述根据用户决策条件对所述记录对进 行决策包括: 当所述记录对满足所述用户决策条件时,输出所述记录对决策结果为匹配。3. 根据权利要求2所述的方法,其特征在于,所述根据用户决策条件对所述记录对进 行决策包括: 当所述记录对不满足所述用户决策条件时,则根据预置决策条件对所述记录对进行决 策。4. 根据权利要求2或3所述的方法,其特征在于,所述获取用户通过脚本编译输入的用 户决策条件包括: 获取用户通过条件表达式的形式表述的用户决策条件。5. 根据权利要求1所述的方法,其特征在于,所述获取用户通过脚本编译输入的用户 决策条件包括: 获取用户通过预...

【专利技术属性】
技术研发人员:边旭贾西贝
申请(专利权)人:深圳市华傲数据技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有1条评论
  • 来自[美国加利福尼亚州圣克拉拉县山景市谷歌公司] 2015年01月14日 09:38
    对决(duìjué)
    0
1