【技术实现步骤摘要】
用户性别识别方法和装置
本公开涉及机器学习领域,特别涉及一种用户性别识别方法和装置。
技术介绍
随着电子商务的发展,为用户提供精准化推荐与个性化搜索成为了电商增强用户粘性的重要手段,用户性别识别是进行精准化推荐与个性化搜索中最基础、也最重要的环节之一。在一些相关技术中,构建N-Gram模型和决策树模型,利用这两个模型分别对用户进行性别识别得到两个识别结果,然后采用投票机制选取其中的一个识别结果作为最终识别的用户性别。
技术实现思路
专利技术人发现,在相关技术中,采用投票机制选取其中一个模型的识别结果作为用户最终的性别,没有充分利用两个模型,其识别结果的准确性仍然受限于单个模型识别结果的准确性。在本公开中,多个分类器基于堆叠模型被关联性地设置,使得多个分类器的分类结果被有机融合,多个分类器均可以得到充分利用,识别结果的准确性取决于多个分类器融合后的综合识别准确性,不再受限于单个分类器识别结果的准确性,有利于提高最终识别结果的准确性。本公开的一些实施例提出一种用户性别识别方法,包括:< ...
【技术保护点】
1.一种用户性别识别方法,其特征在于,包括:/n获取待识别的用户的特征;/n将所述待识别的用户的特征,输入到用户性别识别模型,得到待识别用户的性别;/n其中,所述用户性别识别模型是利用训练集对堆叠模型进行训练并利用测试集验证通过得到的,所述堆叠模型包括多个层,最后一层包括一个元分类器,除了最后一层之外的其他各层中至少有一层包括有多个基分类器,下一层的输入信息包括上一层的输出信息,所述训练集和所述测试集均包括多个用户样本的特征和性别标签。/n
【技术特征摘要】
1.一种用户性别识别方法,其特征在于,包括:
获取待识别的用户的特征;
将所述待识别的用户的特征,输入到用户性别识别模型,得到待识别用户的性别;
其中,所述用户性别识别模型是利用训练集对堆叠模型进行训练并利用测试集验证通过得到的,所述堆叠模型包括多个层,最后一层包括一个元分类器,除了最后一层之外的其他各层中至少有一层包括有多个基分类器,下一层的输入信息包括上一层的输出信息,所述训练集和所述测试集均包括多个用户样本的特征和性别标签。
2.根据权利要求1所述的用户性别识别方法,其特征在于,
所述堆叠模型包括两层,第一层包括多个基分类器,第二层包括一个元分类器,对于每个用户样本,将第一层的每个基分类器输出的分类结果作为第二层的输入。
3.根据权利要求1所述的用户性别识别方法,其特征在于,
所述堆叠模型包括至少三层,最后一层包括一个元分类器,其他层中的每一层包括至少两个基分类器,将用户样本的不同类别的特征分别输入所述堆叠模型中不同的所述其他层,中间层中的每一层的输入信息包括上一层基分类器输出的多个分类结果以及用户样本的相应类别的特征。
4.根据权利要求1-3任意一项所述的用户性别识别方法,其特征在于,所述利用训练集对堆叠模型进行训练包括:
将所述训练集等分划分为多个子集,轮流选取其中的一个子集作为验证子集同时其他子集作为训练子集;
对于堆叠模型中除了最后一层的其他层中的每一个基分类器,用所述训练子集对所述基分类器进行训练,将所述验证子集输入所述基分类器,并将输出的分类结果作为下一层的输入;
利用倒数第二层...
【专利技术属性】
技术研发人员:黄运杜,陈海勇,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。