【技术实现步骤摘要】
本申请涉及数据处理
,尤其涉及一种实体对象的确定方法、条件节点树的建立方法及装置。
技术介绍
现有技术中基于模型的数据分析方法主要是针对一个问题场景,开发一个专用的实体判别模型,并依靠运行在分布式计算框架之上的Hive或MapReduce程序,将实体判别模型转化成实际的软件实体,在需要数据产出时,每个实体判别模型都需要单独运行。如图1所示,当需要对η个实体判别模型进行处理时,需要分别单独进行软件实现和软件运行,以得到与η个实体判别模型分别对应的η个结果。由于η个实体判别模型中的每个实体判别模型在各自进行软件实现时,相互之间完全独立,后续的软件运行过程即需要对实体判别模型涉及到的数据源进行完整处理。例如,当需要从一个实体对象全集中确定出满足一些条件的实体对象时,可以建立包括这多个条件的实体判别模型,并从该实体对象全集中依次判断每个实体对象是否满足该实体判别模型包括的这多个条件,从而确定出与该实体判别模型对应的实体集合。其中,实体对象可以是任一可以被描述的个体,如一个人,一条街道,一辆车,又如各种产品等;每个实体对象具体可以通过各种指标对其进行描述,如实体对象为人时,用于描述人的指标可以包括年龄、身高、体重等;条件则为对实体对象的某一指标的限定,如年龄大于30,身高小于170cm等;实体判别模型包括若干个条件,通过对实体判别模型的计算可以从一个实体对象全集中确定出满足该实体判别模型包括的条件的实体对象,并将满足条件的实体对象放入该实体判别模型对应的实体对象集合中。然而,当基于该实体对象全集有多个这样的实体判别模型需要计算时,采用现有技术需要针对每个实体 ...
【技术保护点】
一种实体对象的确定方法,其特征在于,包括:获取当前待确定的实体对象;从条件节点树的根节点开始按照指定顺序,依次判断所述实体对象是否满足所述条件节点树中的节点表征的条件,其中,在判断所述实体对象满足所述条件节点树中的当前待判断节点表征的条件后,进行所述当前待判断节点的子节点的判断;在判断所述实体对象满足所述条件节点树中的指定节点后,确定所述实体对象属于所述指定节点表征的实体判别模型对应的实体对象集合,其中,所述实体判别模型包括从所述指定节点到所述条件节点树的根节点的节点链上的每个节点各自表征的条件。
【技术特征摘要】
1.一种实体对象的确定方法,其特征在于,包括: 获取当前待确定的实体对象; 从条件节点树的根节点开始按照指定顺序,依次判断所述实体对象是否满足所述条件节点树中的节点表征的条件,其中,在判断所述实体对象满足所述条件节点树中的当前待判断节点表征的条件后,进行所述当前待判断节点的子节点的判断; 在判断所述实体对象满足所述条件节点树中的指定节点后,确定所述实体对象属于所述指定节点表征的实体判别模型对应的实体对象集合,其中,所述实体判别模型包括从所述指定节点到所述条件节点树的根节点的节点链上的每个节点各自表征的条件。2.按权利要求1所述的方法,其特征在于,判断所述实体对象是否满足条件节点树中的节点表征的条件,具体包括: 当条件节点树中的当前待判断节点表征的条件,与所述条件节点树中的已判断节点表征的条件不同时,基于所述实体对象的指标值,判断所述实体对象是否满足所述当前待判断节点表征的条件,得到判断结果; 当条件节点树中的当前待判断节点表征的条件,与所述条件节点树中的已判断节点表征的条件相同时,确定所述实体对象是否满足所述当前待判断节点表征的条件的判断结果,与所述实体对象是否满足所述已判断节点表征的条件的判断结果相同。3.按权利要求2所述的方法,其特征在于,当所述条件节点树中包括所表征的条件相同的两个节点时,所述两个节点中按照所述指定顺序的在前节点指向在后节点; 确定条件节点树中的当前待判断节点表征的条件,是否与所述条件节点树中的已判断节点表征的条件相同,具体包括: 当条件节点树中存在指向所述当前待判断节点的节点时,确定所述当前待判断节点表征的条件,与所述条件节点树中指向所述当前待判断节点的已判断节点表征的条件相同; 否则,确定所述当前待判断节点表征的条件,与所述条件节点树中指向所述当前待判断节点的已判断节点表征的条件不同。4.一种如权利要求1-3任一所述的方法中的所述条件节点树的建立方法,其特征在于,包括: 确定均包含有指定条件的多个实体判别模型包括的各条件,以及所述多个实体判别模型中每个实体判别模型包括的所有条件组成的条件组合; 建立以表征所述指定条件的节点为根节点,以分别表征所述多个实体判别模型包括的每个条件的节点为叶子节点的条件节点树,其中,从所述条件节点树中每个节点到所述根节点的节点链上的每个节点各自表征条件的组合各不相同,且包括所述多个实体判别模型中每个实体判别模型包括的所有条件组成的条件组合。5.按权利要求4所述的方法,其特征在于,对于所述条件节点树中每个节点的子节点,具体采用如下方式建立: 步骤A、确定所述多个实体判别模型中继承当前节点的实体判别模型,其中,所述条件节点树中从表征实体判别模型的指定节点到根节点的节点链上的每个节点均为该实体判别模型继承的节点; 步骤B、在继承所述当前节点的实体判别模型中,确定除继承已建立的该当前节点的子节点的实体判别模型外,剩余的实体判别模型;步骤C、在所述剩余的实体判别模型包括的条件中,确定除所述当前节点到根节点的节点链上的每个节点各自表征的条件外,剩余的条件; 步骤D、基于条件的计算复杂度、条件区分度和在该剩余的实体判别模型中的共享程度中至少之一,分别确定所述剩余的条件中的每个条件的重要程度;其中,重要程度分别随着条件的条件区分度和共享程度的增大而增大,随着条件的计算复杂度的增大而减小;并将重要程度最大的条件,作为所述当前节点的一个子节点表征的条件;以及建立所述当前节点的表征该重要程度最大的条件的子节点; 步骤E、从所述剩余的实体判别模型中选择包括该重要程度最大的条件的实体判别模型,作为继承表征该重要程度最大的条件的该子节点的实体判别模型; 步骤F、当继承已建立的所述当前节点的子节点的实体判别模型,包括继承所述当前节点的全部实体判别模型时,完成所述 当前节点的子节点的建立,否则,进入上述步骤B。6.按权利要求4所述的方法,其特征在于,采用如下步骤从若干个实体判别模型中选择均包括所述指定条件的所述多个实体判别模型: 基于条件的计算复杂度、条件区分度和在这若干个实体判别模型中的共享程度中至少之一,分别确定所述若干个实体判别模型包括的每个条件的重要程度;其中,重要程度分别随着条件的条件区分度和共享程度的增大而增大,随着条件的计算复杂度的增大而减小;其中,在一个实体对象集合中满足一个条件的实体对象的数量越少,表示该条件的条件区分度越高; 将重要程度最大的条件作为所述指定条件,以及从所述若干个实体判别模型中选择包括所述指定条件的实体判别模型。7.一种实体...
【专利技术属性】
技术研发人员:刘抚狄,徐万里,陈国成,蒋萌,康瑜,李宗伟,赵雪波,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。