决策模型构建方法、决策方法与决策模型技术

技术编号:22261829 阅读:26 留言:0更新日期:2019-10-10 14:37
本公开提供一种决策模型构建方法、决策方法与决策模型。方法包括:对N个数据平台发送待构建节点本次迭代使用的属性编号及待分批数据编号;根据N个数据平台发送的N个基于分批属性编号的最大信息增益率确定待构建节点对应的任务数据平台;向任务数据平台发送节点构建通知,获取任务数据平台根据分批属性编号和待分批数据编号确定的分批数据编号;将分批数据编号同步给其余N‑1个数据平台,以形成待构建节点的子节点以及各子节点对应的待分批数据编号;在存在下一个待构建节点时,确定待构建节点的分批属性编号并重复以上步骤。本公开提供的决策模型构建方法可以降低多平台联合建模过程中的数据交互,提高数据保密性。

【技术实现步骤摘要】
决策模型构建方法、决策方法与决策模型
本公开涉及计算机
,具体而言,涉及一种决策模型构建方法、使用该决策树构建方法形成的决策模型以及应用该决策模型进行决策的决策方法。
技术介绍
提高人工智能模型的决策准确度需要大量的训练数据,单个数据提供方由于数据来源渠道、成本的原因,很难满足需求,由此相关模型建立往往使用多个数据平台提供的数据。为避免多个平台大量数据汇聚带来的用户隐私泄露的风险、企业与政府数据泄露的安全隐患,相关技术提出了多数据平台联合建模树模型的技术方案。虽然联合建模树模型可以在保护用户隐私的前提下进行联合建模,但是在决策树的每个中间节点,中立服务器都需要和当前节点信息所在的客户端进行交互,以得到决策样本的当前路径。由于数据分布在不同平台、不同网域,随着样本数量的增加以及更多数据提供方的加入,现有决策模型的通信量成指数级上升,在实际应用中对网络通信的压力极大,因此运行时间和网络通信要求都得不到满足。在多平台、海量数据的场景下,无法大规模使用。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种决策模型构建方法与决策模型构建装置,用于至少在一定程度上克服由于相关技术的限制和缺陷而导致的联合建模树模型决策阶段信息交互量多、网络通信压力大、数据安全性不高等问题。根据本公开实施例的第一方面,提供一种决策模型构建方法,包括:对N个数据平台发送待构建节点的分批属性编号及待分批数据编号;根据所述N个数据平台发送的N个基于所述分批属性编号的最大信息增益率确定所述待构建节点对应的任务数据平台;向所述任务数据平台发送节点构建通知,获取所述任务数据平台根据所述分批属性编号和所述待分批数据编号确定的;将所述分批数据编号同步给其余N-1个数据平台,以形成所述待构建节点的子节点以及各子节点对应的待分批数据编号;在存在下一个待构建节点时,确定所述待构建节点的分批属性编号并重复以上步骤。在本公开的一种示例性实施例中,所述根据所述N个数据平台发送的N个基于所述属性的最大信息增益率确定所述待构建节点对应的任务数据平台包括:将N个所述最大信息增益率中的最大值对应的数据平台确定为所述任务数据平台。在本公开的一种示例性实施例中,所述数据分批阈值由所述任务数据平台根据多个分批方案中信息增益率最大的分批方案确定。在本公开的一种示例性实施例中,所述分批数据编号包括对应于多个数据区间的数据编号,所述多个数据区间根据所述数据分批阈值形成,每个所述数据区间对应一个子节点或叶子节点。在本公开的一种示例性实施例中,在所述对N个数据平台发送待构建节点的分批属性编号及待分批数据编号之前,还包括:判断待构建节点在当前决策树的节点深度是否大于第一预设值;如果是,将所述待构建节点设置为叶子节点,确定下一个待构建节点;如果否,确定所述待构建节点的分批属性编号。在本公开的一种示例性实施例中,所述根据所述N个数据平台发送的N个基于所述分批属性编号的最大信息增益率确定所述待构建节点对应的任务数据平台还包括:在所述最大信息增益率均小于第二预设值时,将所述待构建节点设置为叶子节点,确定下一个待构建节点。在本公开的一种示例性实施例中,在所述向所述任务数据平台发送节点构建通知之后,还包括:响应所述任务平台发送的叶子节点通知,将所述待构建节点设置为叶子节点,确定下一个待构建节点,其中,所述叶子节点通知是所述任务平台在判断任一数据区间的分批数据编号的数量小于第三预设值时产生的。根据本公开的一个方面,提供一种基于多数据平台的决策方法,包括:将待分批数据编号编号分配给结构相同的N个不完全决策树,所述N个不完全决策树分别位于N个不同的数据平台上,每个所述不完全决策树仅在部分子节点上存储有与本数据平台相关的分批属性编号的数据分批阈值;确定各所述不完全决策树之间相同叶子节点的交集数据;根据所述不完全决策树中所有叶子节点的交集数据确定决策结果。在本公开的一种示例性实施例中,在每个所述不完全决策树中,在未存储数据分批阈值的节点处将待分批数据编号复制到所有下一级节点,在存储有数据分批阈值的节点处将待分批数据编号按照所述数据分批阈值分批到下一级子节点。根据本公开的一个方面,提供一种基于多数据平台建立的决策模型,由结构相同的N个不完全决策树组成,所述N个不完全决策树分别位于N个不同的数据平台上,每个所述不完全决策树仅在部分节点上存储有与本数据平台相关的分批属性编号的数据分批阈值。在本公开的一种示例性实施例中,包括:构建启动模块,设置为对N个数据平台发送待构建节点的分批属性编号及待分批数据编号;任务分配模块,设置为根据所述N个数据平台发送的N个基于所述分批属性编号的最大信息增益率确定所述待构建节点对应的任务数据平台;属性获取模块,设置为向所述任务数据平台发送节点构建通知,获取所述任务数据平台根据所述分批属性编号和所述待分批数据编号确定的;结构同步模块,设置为将所述分批数据编号同步给其余N-1个数据平台,以形成所述待构建节点的子节点以及各子节点对应的待分批数据编号;迭代构建模块,设置为在存在下一个待构建节点时,确定所述待构建节点的分批属性编号并重复以上步骤。根据本公开的一个方面,提供一种电子设备,包括:存储器;以及耦合到所属存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上述任意一项所述的决策模型构建方法。本公开实施例通过在多个数据平台上构建不完全决策树,使每个不完全决策树仅保留本平台存储数据属性的数据分批阈值,利用联合建模模型存储方式的特点,可以将决策阶段的信息交互降为常量级,极大地减少了决策过程中的信息交互,降低通讯压力、提高决策效率的同时能够有效维护各数据平台的数据保密性、降低泄密风险,可以应用在多数据平台、海量数据的场景中。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本公开示例性实施例中决策模型构建方法的流程图。图2是本公开示例性实施例中决策模型构建方法的示意图。图3是本公开示例性实施例中决策模型构建方法中的完全决策树。图4A和图4B是本公开示例性实施例中决策模型构建方法中的不完全决策树。图5是本公开实施例建立的决策模型的示意图。图6是本公开实施例中提供的决策方法的流程图。图7是图6所示决策方法的示意图。图8A和图8B是本公开实施例中各不完全决策树进行决策的示意图。图9是本公开一个示例性实施例中一种决策模型构建装置的方框图。图10是本公开一个示例性实施例中一种电子设备的方框图。图11是本公开一个示例性实施例中一种计算机可读存储介质的示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传本文档来自技高网...

【技术保护点】
1.一种基于多平台联合建模的决策模型构建方法,其特征在于,包括:对N个数据平台发送待构建节点的分批属性编号及待分批数据编号;根据所述N个数据平台发送的N个基于所述分批属性编号的最大信息增益率确定所述待构建节点对应的任务数据平台;向所述任务数据平台发送节点构建通知,获取所述任务数据平台根据所述分批属性编号和所述待分批数据编号确定的分批数据编号;将所述分批数据编号同步给其余N‑1个数据平台,以形成所述待构建节点的子节点以及各子节点对应的待分批数据编号;在存在下一个待构建节点时,确定所述待构建节点的分批属性编号并重复以上步骤。

【技术特征摘要】
1.一种基于多平台联合建模的决策模型构建方法,其特征在于,包括:对N个数据平台发送待构建节点的分批属性编号及待分批数据编号;根据所述N个数据平台发送的N个基于所述分批属性编号的最大信息增益率确定所述待构建节点对应的任务数据平台;向所述任务数据平台发送节点构建通知,获取所述任务数据平台根据所述分批属性编号和所述待分批数据编号确定的分批数据编号;将所述分批数据编号同步给其余N-1个数据平台,以形成所述待构建节点的子节点以及各子节点对应的待分批数据编号;在存在下一个待构建节点时,确定所述待构建节点的分批属性编号并重复以上步骤。2.如权利要求1所述的决策模型构建方法,其特征在于,所述根据所述N个数据平台发送的N个基于所述属性的最大信息增益率确定所述待构建节点对应的任务数据平台包括:将N个所述最大信息增益率中的最大值对应的数据平台确定为所述任务数据平台。3.如权利要求1所述的决策模型构建方法,其特征在于,所述分批数据编号包括对应于多个数据区间的数据编号,所述多个数据区间根据数据分批阈值形成,每个所述数据区间对应一个子节点或叶子节点。4.如权利要求3所述的决策模型构建方法,其特征在于,所述数据分批阈值由所述任务数据平台根据多个分批方案中信息增益率最大的分批方案确定。5.如权利要求1所述的决策树构建方法,其特征在于,在所述对N个数据平台发送待构建节点的分批属性编号及待分批数据编号之前,还包括:判断待构建节点在当前决策树的节点深度是否大于第一预设值;如果是,将所述待构建节点设置为叶子节点,确定下一个待构建节点;如果否,确定所述待构建节点的分批属性编号。6.如权利要求1所述的决策树构建方法,其特征在于,所述根据所述N个数据平台发送的N个基于所述分批属性编号的最大信息增益率确定所述待构建节点对应的任务数据平台还包括:在所述最大信息增益率均小于第二预设值时,将所述待构建节点设置为叶子节点,确定下一个待构建节点。7.如权利要求1所述的决策树构建方法,其特征在于,在所述向所述任务数据平台发送节点构建通知之后,还包括:响应所述任务平台发送的叶子节点通知,将所述待构建节点设置为叶子节点,确定下一...

【专利技术属性】
技术研发人员:刘洋郑宇刘颖婷张钧波
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1