性别识别方法、装置、设备及存储介质制造方法及图纸

技术编号:21142114 阅读:43 留言:0更新日期:2019-05-18 05:27
本发明专利技术实施例公开了一种性别识别方法、装置、设备及存储介质。所述方法包括:获取用户样本集合中性别确定的至少一个目标用户样本;从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本,并确定所述至少一个目标商品样本对应的性别统计人数信息;将在所述商品样本集合中包括的至少一个商品样本输入到商品性别模型中,得到所述至少一个商品样本对应的性别信息;获取除所述至少一个目标用户样本之外的每个待检测用户样本,并根据所述待检测用户样本关联的至少一个商品样本对应的性别信息,确定所述待检测用户样本的性别信息。本发明专利技术实施例可以准确识别用户的性别以及商品的性别适用性,同时提高性别信息识别的效率。

【技术实现步骤摘要】
性别识别方法、装置、设备及存储介质
本专利技术实施例涉及数据处理技术,尤其涉及一种性别识别方法、装置、设备及存储介质。
技术介绍
电商平台是个性化推荐系统的一大应用领域。一般的推荐场景都会依据用户的性别为其推荐性别匹配的商品,以提高最终的点击通过率。基于此,在搭建推荐系统的过程中,对用户和商品性别的识别至关重要。目前,在电商平台的推荐系统中,往往面临两个问题:1、用户性别未知;2、部分商品的性别未知(即商品男女适用性不能通过商品类目和名称获得)。对于第一个问题,电商平台往往需要借助外部数据确定用户的性别;对于第二个问题,电商平台通过人工标注方式识别商品的性别适用性。然而,借助外部数据来确定用户性别的方法中,用户性别的真实性和高效性无法保证;人工标注商品的性别适用性的方法效率低下且不具备迭代性。
技术实现思路
本专利技术实施例提供了一种性别识别方法、装置、设备及存储介质,可以准确识别用户的性别以及商品的性别适用性,同时提高性别信息识别的效率。第一方面,本专利技术实施例提供了一种性别识别方法,包括:获取用户样本集合中性别确定的至少一个目标用户样本;从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本,并根据所述至少一个目标用户样本的性别信息确定所述至少一个目标商品样本对应的性别统计人数信息;根据附加性别统计人数信息的各所述目标商品样本对机器学习模型进行训练,得到商品性别识别模型;将在所述商品样本集合中包括的至少一个商品样本输入到商品性别模型中,得到所述至少一个商品样本对应的性别信息;获取所述用户样本集合中除所述至少一个目标用户样本之外的每个待检测用户样本,并根据所述待检测用户样本关联的至少一个商品样本对应的性别信息,确定所述待检测用户样本的性别信息。第二方面,本专利技术实施例还提供了一种性别识别装置,包括:目标用户样本获取模块,用于获取用户样本集合中性别确定的至少一个目标用户样本;目标商品样本获取模块,用于从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本,并根据所述至少一个目标用户样本的性别信息确定所述至少一个目标商品样本对应的性别统计人数信息;商品性别识别模型训练模块,用于根据附加性别统计人数信息的各所述目标商品样本对机器学习模型进行训练,得到商品性别识别模型;商品样本性别识别模块,用于将在所述商品样本集合中包括的至少一个商品样本输入到商品性别模型中,得到所述至少一个商品样本对应的性别信息;待检测用户样本性别识别模块,用于获取所述用户样本集合中除所述至少一个目标用户样本之外的每个待检测用户样本,并根据所述待检测用户样本关联的至少一个商品样本对应的性别信息,确定所述待检测用户样本的性别信息。第三方面,本专利技术实施例还提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本专利技术实施例中任一所述的性别识别方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的性别识别方法。本专利技术实施例通过确定性别的目标用户样本的性别信息统计性别确定的目标商品样本对应的性别统计人数信息,将性别统计人数信息作为目标商品样本的特征信息,并将附加性别统计人数信息的目标商品样本作为训练样本训练商品性别识别模型,实现建立用户样本的性别信息与商品样本的性别信息的对应关系,并基于训练样本训练商品性别识别模型识别性别不确定的商品样本的性别信息,由此补全商品样本集合中所有商品集合对应的性别信息,最后基于用户样本集合中性别不确定的用户样本的历史行为关联的商品样本的性别信息,确定性别不确定的用户样本的性别信息,由此补全用户样本集合中所有用户样本对应的性别信息,从而实现用户样本和商品样本的交叉识别,由性别确定的样本进而逐步补全其他样本的性别信息,可以极大提高用户样本和商品样本的性别识别的准确度。附图说明图1是本专利技术实施例一提供的一种性别识别方法的流程图;图2是本专利技术实施例所适用的一种具体应用实例的流程图;图3是本专利技术实施例三提供的一种性别识别装置的结构示意图;图4是本专利技术实施例四提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种性别识别方法的流程图,本实施例可适用于识别用户的性别以及商品的性别适用性的情况,该方法可以由本专利技术实施例提供的性别识别装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成提供商品交易功能的电子设备中,例如,客户端或服务器等。如图1所示,本实施例的方法具体包括:S110,获取用户样本集合中性别确定的至少一个目标用户样本。具体的,用户样本可以是指在电商平台中注册的账户,账户可以在电商平台中进行商品消费。性别确定可以是指账户信息中包含用户的性别信息是真实可靠的。通常来说,现有的获取电商平台中各账户的性别信息的方式往往是需要借助外部数据(如用户自主输入的信息)来确定用户性别,但用户由于各种原因,例如用户认为性别信息是隐私,往往会输入错误的性别,从而,借助外部数据确定用户的性别信息无法保证该用户的性别信息的真实性。从而,需要对用户样本进行筛选,找到性别信息可靠的用户样本作为分析样本,以保证后续的分析结果可靠准确。此外,从用户角度来看,若采用依赖于性别特征、或者是对于授信用户拟合效果较好的推荐算法,无法高效地泛化到注册未授信的用户;从商品角度来看,如果通过性别未知用户对商品的点击行为来估计其性别的话,因为一部分性别未知商品的存在,会对最终的性别估计产生不利的影响,从而导致商品的性别识别的准确率低。可选的,所述获取用户样本集合中性别确定的至少一个目标用户样本,可以包括:获取所述用户样本集合中各用户样本的信用信息,筛选信用信息为授信的用户样本作为目标用户样本;其中,所述用户样本集合中各用户样本为在设置信用额度的电商平台中采集的用户样本。其中,授信的用户样本是指用户信用经过电商平台的授权验证的用户,其中,授权验证可以是指该用户已经过身份认证以及信用额度超过设定信用阈值,验证该用户是否为合法公民,以及验证该用户是否达到在电商平台上进行经济活动的条件等。可以理解的是,与用户自行填写的性别信息不同,授信的用户的身份已经过核实,从而,该用户的身份实际是已经确定,具体包括身份证信息、性别信息或居住地信息等。设置信用额度的电商平台具体可以是指提供贷款功能的电商平台,如分期购物的电子商务平台,一般分期购物的电子商务平台具备金融属性,用户只有进行了授信并获得了高于设定信用阈值的信用额度才能在平台进行分期消费,也即授信用户具有分期付款资格,从而,可以将授信的用户样本,确定为性别确定的目标用户样本。通过获取设置信用额度的电商平台中授信的用户样本,来获取性别确定的目标用户样本,可以准确获取性别确定的用户样本,同时,用户样本的性别信息是正确的,从而提高用户样本的性别信息的可靠性。S120,从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本本文档来自技高网...

【技术保护点】
1.一种性别识别方法,其特征在于,包括:获取用户样本集合中性别确定的至少一个目标用户样本;从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本,并根据所述至少一个目标用户样本的性别信息确定所述至少一个目标商品样本对应的性别统计人数信息;根据附加性别统计人数信息的各所述目标商品样本对机器学习模型进行训练,得到商品性别识别模型;将在所述商品样本集合中包括的至少一个商品样本输入到商品性别模型中,得到所述至少一个商品样本对应的性别信息;获取所述用户样本集合中除所述至少一个目标用户样本之外的每个待检测用户样本,并根据所述待检测用户样本关联的至少一个商品样本对应的性别信息,确定所述待检测用户样本的性别信息。

【技术特征摘要】
1.一种性别识别方法,其特征在于,包括:获取用户样本集合中性别确定的至少一个目标用户样本;从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本,并根据所述至少一个目标用户样本的性别信息确定所述至少一个目标商品样本对应的性别统计人数信息;根据附加性别统计人数信息的各所述目标商品样本对机器学习模型进行训练,得到商品性别识别模型;将在所述商品样本集合中包括的至少一个商品样本输入到商品性别模型中,得到所述至少一个商品样本对应的性别信息;获取所述用户样本集合中除所述至少一个目标用户样本之外的每个待检测用户样本,并根据所述待检测用户样本关联的至少一个商品样本对应的性别信息,确定所述待检测用户样本的性别信息。2.根据权利要求1所述的方法,其特征在于,所述获取用户样本集合中性别确定的至少一个目标用户样本,包括:获取所述用户样本集合中各用户样本的信用信息,筛选信用信息为授信的用户样本作为目标用户样本;其中,所述用户样本集合中各用户样本为在设置信用额度的电商平台中采集的用户样本。3.根据权利要求1所述的方法,其特征在于,所述从与所述用户样本集合关联的商品样本集合中筛选性别确定的至少一个目标商品样本,包括:获取所述商品样本集合中各所述商品样本的属性信息;其中,所述属性信息包括下述至少一项:特征信息名称、性别关键词和类目;根据每个所述商品样本的属性信息对所述商品样本集合中包括的商品样本进行性别标记;将性别标记为目标性别类型的商品样本作为目标商品样本;其中,所述目标性别类型包括:男、女或男女通用。4.根据权利要求1所述的方法,其特征在于,所述性别统计人数信息包括下述至少一项:各目标性别类型分别对应的商品购买人数信息、各目标性别类型分别对应的商品点击人数信息和各目标性别类型分别对应的商品曝光人数信息。5.根据权利要求1所述的方法,其特征在于,所述根据所述至少一个目标用户样本的性别信息确定所述至少一个目标商品样本对应的性别统计人数信息,包括:获取各所述目标商品样本的特征信息;其中,所述特征信息包括下述至少一项:名称信息、类目信息和品牌信...

【专利技术属性】
技术研发人员:程佳宇吴佳东
申请(专利权)人:深圳乐信软件技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1