对象识别方法及其系统技术方案

技术编号:20869004 阅读:30 留言:0更新日期:2019-04-17 09:50
本公开提供了一种对象识别方法,该方法包括:获取对象的特征数据,其中,特征数据用于反映对象对其关联对象的偏好程度;将获取的特征数据输入预设分类器中,得到第一分类结果,其中,预设分类器用于依据输入的特征数据对对象进行分类;以及根据第一分类结果识别对象对关联对象的偏好程度。本公开还提供了一种对象识别系统以及一种非易失性存储介质。

【技术实现步骤摘要】
对象识别方法及其系统
本公开涉及数据处理领域,更具体地,涉及一种对象识别方法及其系统。
技术介绍
随着网络技术的飞速发展,各行各业积累了海量的数据,如何对海量数据进行准确有效地分析显得非常重要。例如,用户对购物应用上展示的商品进行操作会产生大量的操作数据,这些数据往往会反映用户的个性化偏好,而能够根据用户对商品类型的偏好对用户进行准确识别,对个性化推荐有着非常重大的意义。目前,相关技术中提供了多种用户识别方案。然而,在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:相关技术中识别用户的准确度不高。针对相关技术中的上述问题,目前还未提出有效的解决方案。
技术实现思路
有鉴于此,本公开提供了一种能够提高对象识别准确度的对象识别方法及其系统和系统、以及计算机可读存储介质。本公开的一个方面提供了一种对象识别方法,包括:获取对象的特征数据,其中,上述特征数据用于反映上述对象对其关联对象的偏好程度;将获取的特征数据输入预设分类器中,得到第一分类结果,其中,上述预设分类器用于依据输入的特征数据对上述对象进行分类;以及根据上述第一分类结果识别上述对象对上述关联对象的偏好程度。根据本公开的实施例,在将获取的特征数据输入预设分类器中,得到第一分类结果之前,上述方法还包括:获取训练数据集,其中,上述训练数据集中至少包含一类特征数据;以及对上述训练数据集中的特征数据进行训练,得到上述预设分类器。根据本公开的实施例,获取训练数据集包括:获取样本数据集;计算包含在上述样本数据集中的各特征数据相对于上述样本数据集的所有特征数据的条件信息熵;计算上述样本数据集中所有特征数据的信息熵;计算上述信息熵和条件信息熵的差值,得到上述各特征数据的信息增益;根据得到的信息增益的大小关系,从上述样本数据集中选出信息增益满足预设条件的特征数据作为目标特征数据;以及将上述目标特征数据对应的数据集合作为上述训练数据集。根据本公开的实施例,对上述训练数据集中的特征数据进行训练,得到上述预设分类器包括:根据上述目标特征数据的信息增益的大小关系,确定第一决策树的根节点和叶子节点以生成上述第一决策树;以及根据上述第一决策树构建上述预设分类器。根据本公开的实施例,在根据上述第一决策树构建上述预设分类器之后,上述方法还包括:获取包含有校验对象的特征数据的校验数据集;将上述校验对象的特征数据输入上述决策树,得到第二分类结果;判断是否能够根据上述第二分类结果识别上述校验对象对其关联对象的偏好程度;若否,则基于上述校验对象的特征数据确定第二决策树的根节点和叶子节点以生成上述第二决策树;根据上述第二决策树构建上述预设分类器;或者根据上述第一决策树和上述第二决策树构建上述预设分类器。本公开的另一个方面提供了一种对象识别系统,包括:第一获取模块,用于获取对象的特征数据,其中,上述特征数据用于反映上述对象对其关联对象的偏好程度;第一处理模块,用于将获取的特征数据输入预设分类器中,得到第一分类结果,其中,上述预设分类器用于依据输入的特征数据对上述对象进行分类;以及识别模块,用于根据上述第一分类结果识别上述对象对上述关联对象的偏好程度。根据本公开的实施例,上述系统还包括:第二获取模块,用于获取训练数据集,其中,上述训练数据集中至少包含一类特征数据;以及训练模块,用于对上述训练数据集中的特征数据进行训练,得到上述预设分类器。根据本公开的实施例,上述第二获取模块包括:第一获取单元,用于获取样本数据集;第一计算单元,用于计算包含在上述样本数据集中的各特征数据相对于上述样本数据集的所有特征数据的条件信息熵;第二计算单元,用于计算上述样本数据集中所有特征数据的信息熵;第三计算单元,用于计算上述信息熵和条件信息熵的差值,得到上述各特征数据的信息增益;选择单元,用于根据得到的信息增益的大小关系,从上述样本数据集中选出信息增益满足预设条件的特征数据作为目标特征数据;以及第一确定单元,用于将上述目标特征数据对应的数据集合作为上述训练数据集。根据本公开的实施例,上述训练模块包括:第二确定单元,用于根据上述目标特征数据的信息增益的大小关系,确定第一决策树的根节点和叶子节点以生成上述第一决策树;以及构建单元,用于根据上述第一决策树构建上述预设分类器。根据本公开的实施例,上述系统还包括:第三获取模块,用于获取包含有校验对象的特征数据的校验数据集;第二处理模块,用于将上述校验对象的特征数据输入上述决策树,得到第二分类结果;判断模块,用于判断是否能够根据上述第二分类结果识别上述校验对象对其关联对象的偏好程度;确定模块,用于若根据上述第二分类结果不能识别上述校验对象对其关联对象的偏好程度时,基于上述校验对象的特征数据确定第二决策树的根节点和叶子节点以生成上述第二决策树;第一构建模块,用于根据上述第二决策树构建上述预设分类器;或者第二构建模块,用于根据上述第一决策树和上述第二决策树构建上述预设分类器。本公开的另一个方面提供了一种计算机可读存储介质,其上存储有可执行指令,上述指令被处理器执行时用于实现上述的对象识别方法。本公开的另一个方面提供了一种对象识别系统,包括:上述计算机可读存储介质;以及上述处理器。附图说明为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:图1示意性示出了根据本公开的对象识别方法及其系统的示例性系统架构;图2示意性示出了根据本公开实施例的对象识别方法及其系统的应用场景图;图3示意性示出了根据本公开实施例的对象识别方法的流程图;图4A示意性示出了根据本公开另一实施例的对象识别方法的流程图;图4B示意性示出了根据本公开另一实施例的对象识别方法的流程图;图4C示意性示出了根据本公开另一实施例的对象识别方法的流程图;图4D示意性示出了根据本公开另一实施例的对象识别方法的流程图;图5示意性示出了根据本公开实施例的对象识别方法的识别结果图;图6示意性示出了根据本公开实施例的对象识别系统的框图;以及图7示意性示出了应用本公开实施例的对象识别方法的计算机系统的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理系统的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的系统。因此,本公开的技术可以硬件和/或软件(本文档来自技高网...

【技术保护点】
1.一种对象识别方法,包括:获取对象的特征数据,其中,所述特征数据用于反映所述对象对其关联对象的偏好程度;将获取的特征数据输入预设分类器中,得到第一分类结果,其中,所述预设分类器用于依据输入的特征数据对所述对象进行分类;以及根据所述第一分类结果识别所述对象对所述关联对象的偏好程度。

【技术特征摘要】
1.一种对象识别方法,包括:获取对象的特征数据,其中,所述特征数据用于反映所述对象对其关联对象的偏好程度;将获取的特征数据输入预设分类器中,得到第一分类结果,其中,所述预设分类器用于依据输入的特征数据对所述对象进行分类;以及根据所述第一分类结果识别所述对象对所述关联对象的偏好程度。2.根据权利要求1所述的方法,其中,在将获取的特征数据输入预设分类器中,得到第一分类结果之前,所述方法还包括:获取训练数据集,其中,所述训练数据集中至少包含一类特征数据;以及对所述训练数据集中的特征数据进行训练,得到所述预设分类器。3.根据权利要求2所述的方法,其中,获取训练数据集包括:获取样本数据集;计算包含在所述样本数据集中的各特征数据相对于所述样本数据集的所有特征数据的条件信息熵;计算所述样本数据集中所有特征数据的信息熵;计算所述信息熵和条件信息熵的差值,得到所述各特征数据的信息增益;根据得到的信息增益的大小关系,从所述样本数据集中选出信息增益满足预设条件的特征数据作为目标特征数据;以及将所述目标特征数据对应的数据集合作为所述训练数据集。4.根据权利要求3所述的方法,其中,对所述训练数据集中的特征数据进行训练,得到所述预设分类器包括:根据所述目标特征数据的信息增益的大小关系,确定第一决策树的根节点和叶子节点以生成所述第一决策树;以及根据所述第一决策树构建所述预设分类器。5.根据权利要求4所述的方法,其中,在根据所述第一决策树构建所述预设分类器之后,所述方法还包括:获取包含有校验对象的特征数据的校验数据集;将所述校验对象的特征数据输入所述决策树,得到第二分类结果;判断是否能够根据所述第二分类结果识别所述校验对象对其关联对象的偏好程度;若否,则基于所述校验对象的特征数据确定第二决策树的根节点和叶子节点以生成所述第二决策树;根据所述第二决策树构建所述预设分类器;或者根据所述第一决策树和所述第二决策树构建所述预设分类器。6.一种对象识别系统,包括:第一获取模块,用于获取对象的特征数据,其中,所述特征数据用于反映所述对象对其关联对象的偏好程度;第一处理模块,用于将获取的特征数据输入预设分类器中,得到第一分类结果,其中,所述预设分类器用于依...

【专利技术属性】
技术研发人员:王颖帅李晓霞苗诗雨
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1