一种预测行为的方法和装置制造方法及图纸

技术编号:20746246 阅读:32 留言:0更新日期:2019-04-03 10:34
本发明专利技术公开了一种预测行为的方法和装置,涉及通信技术领域。该方法的一具体实施方式包括:获取样本信息;其中,样本信息包括行为类别和属性类别;计算每个属性类别在行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则;根据决策规则,对待预测信息进行行为预测,以获取与待预测信息相应的行为类别。该实施方式降低了人为等因素对行为预测的干扰,提高了行为预测的准确性,同时可以在决策规则中查看行为原因。

【技术实现步骤摘要】
一种预测行为的方法和装置
本专利技术涉及通讯
,尤其涉及一种预测行为的方法和装置。
技术介绍
尽管员工离职现象司空见惯,但是往往无法预测,员工的突然离职往往会给企业工作进展带来一定的影响。很多企业人力资源部门也为如何在员工离职之前就能得知员工是否有离职倾向而绞尽脑汁。现有技术预测员工是否有离职倾向,主要通过问卷调查方式,调查社会、企业内部和个人等因素对员工影响的综合稳定值。综合稳定值越大,表示员工离职的可能性的越小。作为一种可替代实施方式,可以依据员工的历史通讯记录、员工上班时间的行为数据(例如所浏览的网站、所使用的软件),判断员工是否有离职倾向。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:(1)通过问卷调查员工是否离职的方式,不确定因素较多,例如员工故意夸大一些因素,导致预测结果准确度低。(2)通过捕获人员行为(例如历史通讯记录、上班时间的行为数据)来预测员工是否离职的方式,可以获取准确度较高的预测结果,但是HR无法通过这种方式得知员工离职原因,导致无法为企业稳定员工而采用相应策略提供参考。
技术实现思路
有鉴于此,本专利技术实施例提供一种预测行为的方法和装置,至少能够解决现有技术预测行为准确度低、无法查看行为原因的问题。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种预测行为的方法,包括:获取样本信息;其中,样本信息包括行为类别和属性类别;计算每个属性类别在行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则;根据决策规则,对待预测信息进行行为预测,以获取与待预测信息相应的行为类别。可选地,在获取样本信息之后,还包括:根据预设的属性值范围阈值与属性值标识的对应关系,确定每个属性类别中各属性值对应的属性值标识。可选地,本专利技术实施例方法还包括:根据公式确定属性值范围阈值与属性值标识的对应关系;其中,F(·)表示向上取整操作,V表示属性值,MinV和MaxV表示一个属性类别下的最小属性值和最大属性值,G表示属性值标识。可选地,在根据预设的属性值范围阈值与属性值标识的对应关系,确定每个属性类别中各属性值对应的属性值标识之后,还包括:根据卡方检验,计算每个属性类别与行为类别之间的差异值,去除差异值小于预定差异阈值的属性类别。可选地,计算每个属性类别在行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则包括:将样本信息分为第一样本信息以及第二样本信息;根据第一样本信息,计算每个属性类别在行为类别下的信息增益,按照信息增益从大到小的顺序,提取预定数目的属性类别,对决策树进行训练,以生成第一决策规则;根据第一决策规则,对第二样本信息进行行为类别预测,提取预测的行为类别与第二样本信息的行为类别一致的第一决策规则,以生成第二决策规则;根据第二决策规则,对待预测信息进行行为预测,以获取与待预测信息相应的行为类别。为实现上述目的,根据本专利技术实施例的另一方面,提供了一种预测行为的装置,包括:获取模块,用于获取样本信息;其中,样本信息包括行为类别和属性类别;训练模块,用于计算每个属性类别在行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则;预测模块,用于根据决策规则,对待预测信息进行行为预测,以获取与待预测信息相应的行为类别。可选地,本专利技术实施例装置还包括:确定模块,用于根据预设的属性值范围阈值与属性值标识的对应关系,确定每个属性类别中各属性值对应的属性值标识。可选地,确定模块还用于,根据公式确定属性值范围阈值与属性值标识的对应关系;其中,F(·)表示向上取整操作,V表示属性值,MinV和MaxV表示一个属性类别下的最小属性值和最大属性值,G表示属性值标识。可选地,本专利技术实施例装置还包括检验模块,用于根据卡方检验,计算每个属性类别与行为类别之间的差异值,去除差异值小于预定差异阈值的属性类别。可选地,训练模块还用于:将样本信息分为第一样本信息以及第二样本信息;根据第一样本信息,计算每个属性类别在行为类别下的信息增益,按照信息增益从大到小的顺序,提取预定数目的属性类别,对决策树进行训练,以生成第一决策规则;根据第一决策规则,对第二样本信息进行行为类别预测,提取预测的行为类别与第二样本信息的行为类别一致的第一决策规则,以生成第二决策规则;根据第二决策规则,对待预测信息进行行为预测,以获取与待预测信息相应的行为类别。为实现上述目的,根据本专利技术实施例的再一方面,提供了一种预测行为的电子设备。本专利技术实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一所述的预测行为的方法。为实现上述目的,根据本专利技术实施例的再一方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述任一所述的预测行为的方法。根据本专利技术所述提供的方案,上述专利技术中的一个实施例具有如下优点或有益效果:可以有效发现样本信息所存在的行为规则,降低人为原因等因素对行为预测的干扰,提高行为预测的准确性,同时企业根据预测输出结果,可以得知行为原因,为企业采用相应策略提供参考。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的一种预测行为的方法的主要流程示意图;图2是根据本专利技术实施例的一种可选的预测行为的方法的流程示意图;图3是根据本专利技术实施例的另一种可选的预测行为的方法的流程示意图;图4是根据本专利技术实施例的又一种可选的预测行为的方法的流程示意图;图5是根据本专利技术实施例的一种预测行为的装置的主要模块示意图;图6是本专利技术实施例可以应用于其中的示例性系统架构图;图7是适于用来实现本专利技术实施例的移动设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。参见图1,示出的是本专利技术实施例提供的一种行为预测的方法的主要流程图,包括如下步骤:S101:获取样本信息;其中,样本信息包括行为类别和属性类别。S102:计算每个属性类别在行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则。S103:根据决策规则,对待预测信息进行行为预测,以获取与待预测信息相应的行为类别。需要说明的是,本专利技术实施例所提供的行为类别可以是多种,例如故障诊断、离职诊断等,以员工离职和在职为例进行说明。上述实施例方式中,对于步骤S101,可以从数据管理系统(例如人力资源管理系统)中获取样本信息,该数据管理系统库可以是使用X86构架Linux操作系统服务器,以Hadoop构建的。例如,从数据管理系统中,抽取隶属同一公司的与员工有关的多个信息表,以代表员工的唯一信息(例如身份证号码、员工号)为关联进行合并,以生成员工样本信息表,即将同一员工信息显示于同一行中。具体本文档来自技高网...

【技术保护点】
1.一种预测行为的方法,其特征在于,包括:获取样本信息;其中,所述样本信息包括行为类别和属性类别;计算每个属性类别在所述行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则;根据所述决策规则,对待预测信息进行行为预测,以获取与所述待预测信息相应的行为类别。

【技术特征摘要】
1.一种预测行为的方法,其特征在于,包括:获取样本信息;其中,所述样本信息包括行为类别和属性类别;计算每个属性类别在所述行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则;根据所述决策规则,对待预测信息进行行为预测,以获取与所述待预测信息相应的行为类别。2.根据权利要求1所述的方法,其特征在于,在所述获取样本信息之后,还包括:根据预设的属性值范围阈值与属性值标识的对应关系,确定每个属性类别中各属性值对应的属性值标识。3.根据权利要求2所述的方法,其特征在在于,还包括:根据公式确定所述属性值范围阈值与属性值标识的对应关系;其中,F(·)表示向上取整操作,V表示属性值,MinV和MaxV表示一个属性类别下的最小属性值和最大属性值,G表示属性值标识。4.根据权利要求2或3所述的方法,其特征在于,在所述根据预设的属性值范围阈值与属性值标识的对应关系,确定每个属性类别中各属性值对应的属性值标识之后,还包括:根据卡方检验,计算每个属性类别与所述行为类别之间的差异值,去除差异值小于预定差异阈值的属性类别。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述计算每个属性类别在所述行为类别下的信息增益,以提取预设数目的属性类别,对决策树进行训练,以生成决策规则包括:将样本信息分为第一样本信息以及第二样本信息;根据所述第一样本信息,计算每个属性类别在所述行为类别下的信息增益,按照所述信息增益从大到小的顺序,提取预定数目的属性类别,对决策树进行训练,以生成第一决策规则;根据所述第一决策规则,对所述第二样本信息进行行为类别预测,提取预测的行为类别与所述第二样本信息的行为类别一致的第一决策规则,以生成第二决策规则;根据所述第二决策规则,对待预测信息进行行为预测,以获取与所述待预测信息相应的行为类别。6.一种预测行为的装置,其特征在于,包括:获取模块,用于获取样本信息;其中,所述样本信息包括...

【专利技术属性】
技术研发人员:刘国亮
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1