【技术实现步骤摘要】
性别预测方法、装置和计算机可读存储介质
本专利技术涉及数据处理领域,特别涉及一种性别预测方法、装置和计算机可读存储介质。
技术介绍
在用户性别预测的相关研究中,基于规则的判断方法简单快捷,但准确率有限。用户在注册账号时通常不会填写完整的个人信息,直接使用注册性别作为用户真实性别往往覆盖率较低,真实程度也有较大的不确定性。通过身份证号解析得到性别数据,可靠性较高,但身份证号作为敏感数据,覆盖率通常会更低。目前用户性别预测研究多集中在社交媒体领域,根据用户的发言和互动内容对性别进行预测。而电商领域中,只有少量用户会对商品留言评价。因此,社交平台中的用户性别预测方法无法直接推广至电商应用中。
技术实现思路
专利技术人经过分析后发现,在电商平台中,大部分用户性别画像是指某一个注册账号的性别。但是在实际应用场景中,会存在一个注册账号同时登录多个不同设备的情况,即多人共同使用一个注册账号。例如,某家庭中,夫妻双方在各自的手机设备上都登录了同一个账号进行商品浏览和购买等行为。数据调研发现,有超过1/3的注册账号 ...
【技术保护点】
1.一种性别预测方法,包括:/n根据待测设备对应的历史数据生成待测数据;/n将所述待测数据输入预先训练的性别预测模型,获得对待测设备对应的用户的性别预测结果,其中,所述性别预测模型是根据设备级别用户的历史数据训练的,所述设备级别用户对应的用户账号在同一设备使用。/n
【技术特征摘要】
1.一种性别预测方法,包括:
根据待测设备对应的历史数据生成待测数据;
将所述待测数据输入预先训练的性别预测模型,获得对待测设备对应的用户的性别预测结果,其中,所述性别预测模型是根据设备级别用户的历史数据训练的,所述设备级别用户对应的用户账号在同一设备使用。
2.根据权利要求1所述的性别预测方法,其中,
在登录所述待测设备的用户账号为同一个用户账号的情况下,根据待测设备上未登录用户产生的历史数据以及所述待测设备对应的用户账号产生的历史数据,生成待测数据。
3.根据权利要求1所述的性别预测方法,其中,
在登录所述待测设备的用户账号包括多个用户账号的情况下,根据待测设备对应的同一用户账号产生的历史数据,获取所述同一用户账号对应的待测数据;
将所述同一用户账号对应的待测数据输入预先训练的性别预测模型,生成对所述待测设备对应的同一用户账号的性别预测结果。
4.根据权利要求1所述的性别预测方法,其中,
根据待测设备对应的历史数据中的预设操作次数与预设阈值的比较结果生成不同类型的待测数据;
将所述待测数据输入预先训练的、所述比较结果对应的性别预测模型,获得对待测设备对应的用户的性别预测结果。
5.根据权利要求4所述的性别预测方法,其中,在待测设备对应的历史数据中的预设操作次数大于预设值的情况下,所述待测数据包括第一商品内容特征和用户行为特征;
所述用户行为特征包括以下至少一种:被操作的每个类别中的商品的信息、操作每个品牌下的商品的信息、操作每种性别属性商品的信息;
所述第一商...
【专利技术属性】
技术研发人员:王帅强,成艺,胡恒魁,赵佳枢,丁卓冶,殷大伟,赵一鸿,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。