一种用户性别识别方法及装置制造方法及图纸

技术编号:15725178 阅读:91 留言:0更新日期:2017-06-29 12:57
本发明专利技术公开了一种用户性别识别方法和装置,其中,该方法包括:获取未知性别用户的应用程序使用数据,从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据,根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。采用该方法,可以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的技术问题。

【技术实现步骤摘要】
一种用户性别识别方法及装置
本专利技术涉及数据处理
,尤其涉及一种用户性别识别方法及装置。
技术介绍
随着移动设备的普及和移动宽带网络的建设,当前我们已进入移动互联网的新时代。移动应用分发作为移动互联网的入口之一,也决定了各个厂商在移动互联网上掌控能力的强弱。因此,越来越多的厂商向诸如手机、平板电脑、笔记本、台式机之类的终端设备提供了各种应用程序。为了个性化地给用户推荐应用程序,我们往往需要知道用户性别。现有技术中用户性别识别主要基于以下几种方法:一种是根据用户注册时填写的资料直接识别;另一种是依据人脸识别技术,通过扫描用户面部特征,识别用户性别。但是,通过用户填写注册信息或者人脸识别技术,可能涉及用户隐私;而面部识别技术,成本过高。
技术实现思路
有鉴于此,本专利技术实施例提供一种用户性别识别方法及装置,以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的技术问题。第一方面,本专利技术实施例提供了一种用户性别识别方法,所述方法包括:获取未知性别用户的应用程序使用数据;从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。第二方面,本专利技术实施例还提供了一种用户性别识别装置,所述装置包括:第一使用数据获取模块,用于获取未知性别用户的应用程序使用数据;第一特征数据提取模块,用于从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;性别识别模块,用于根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。本专利技术实施例提供的用户性别识别方法和装置,通过获取未知性别用户的应用程序使用数据,从中提取具有性别识别性的特征数据,并应用性别分类模型学习所述特征数据,进而判断用户性别,实现了仅通过用户应用程序使用数据识别用户性别的目的。由于用户应用程序使用数据比较丰富,因此性别识别过程中准确率较高,并且可以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的技术问题。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术实施例一提供的一种用户性别识别方法的流程示意图;图2为本专利技术实施例二提供的一种用户性别识别方法的流程示意图;图3为本专利技术实施例三提供的一种用户性别识别装置的结构框图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。实施例一图1为本专利技术实施例一提供的一种用户性别识别方法的流程示意图。本实施例可适用于识别未知性别用户的性别的情况。该方法可以由用户性别识别装置来执行,其中该装置可以由软件和/或硬件来实现。如图1所示,本实施例提供的用户性别识别方法具体可以包括如下:S110、获取未知性别用户的应用程序使用数据。示例性的,获取未知性别用户的应用程序使用数据,该应用程序使用数据可以包括应用程序安装列表和应用程序使用行为中的至少一个。应用程序安装列表即用户的移动终端中安装的各种应用程序的一个集合,应用程序使用行为即用户对应用程序具体的操作行为,例如对应用程序的使用次数,或者使用频率,或者使用时间等。S120、从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据。示例性的,具有性别识别性的特征数据,即帮助识别未知性别用户的性别的特征数据,或者具有性别属性的特征数据。从未知性别用户的应用程序安装列表和/或应用程序使用行为中提取具有性别识别性的特征数据。S130、根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。示例性的,基于性别分类模型,通过未知性别用户的特征数据,对未知性别用户进行性别识别,识别所述未知性别用于性别为男或者为女,以及对应的概率,其中,性别分类模型可以为根据已知性别用户的应用程序使用数据进行训练而确定的。具体的,根据未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,例如:具体识别结果可以是未知性别用户为男性的概率为80%,为女性的概率为20%。进一步的,当未知性别用户的特征数据发生改变时,更新所述概率。具体可以是未知性别用户的应用程序安装列表发生改变,例如用户新增或者删除某些应用程序时,更新所述概率,还可以是未知性别用户的应用程序使用行为发生改变时,更新所述概率。本专利技术实施例一提供的用户性别识别方法,通过获取未知性别用户的应用程序使用数据,从中提取具有性别识别性的特征数据,并应用性别分类模型学习所述特征数据,进而判断用户性别,实现了仅通过用户应用程序使用数据识别用户性别的目的。由于用户应用程序使用数据比较丰富,因此性别识别过程中准确率较高,并且可以解决现有技术中用户性别识别时,可能涉及用户隐私或者成本较高的问题。实施例二本实施例以上述实施例为基础,提供一种用户性别识别方法。图2为本专利技术实施例二提供的一种用户性别识别方法的流程示意图。如图2所示,本实施例提供的用户性别识别方法可以包括如下:S210、获取已知性别用户的应用程序使用数据。示例性的,应用程序使用数据可以包括应用程序安装列表和应用程序使用行为中的至少一个。这里,由于已知性别用户的应用程序安装列表可能涉及用户的隐私,出于保护隐私的目的,部分已知性别用户的应用程序安装列表可能是加密存储的,这是将加密存储的应用程序安装列表进行必要的数据格式转换,通过转换解密为相应的已知性别用户的应用程序安装列表。S220、从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据。示例性的,从已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据,可以包括下述至少一项:根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量;根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例;根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据。具体的,根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量,即根据已知性别用户的应用程序安装列表,提取至少两个设定类别的应用程序的数量。由于应用程序在安装使用的时候已经规定了应用程序的类别,例如百度地图的类别为导航,百度糯米的类别为生活。这里,根据已知性别用户的应用程序安装列表,可以提取诸如导航、生活、娱乐、购物、社交、财务、天气、游戏等各个类别的应用程序的数量,将上述各个类别中至少两个设定类别的应用程序的数量作为第一特征数据。具体的,根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为本文档来自技高网...
一种用户性别识别方法及装置

【技术保护点】
一种用户性别识别方法,其特征在于,包括:获取未知性别用户的应用程序使用数据;从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。

【技术特征摘要】
1.一种用户性别识别方法,其特征在于,包括:获取未知性别用户的应用程序使用数据;从所述未知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,其中,所述性别分类模型为根据已知性别用户的应用程序使用数据的特征数据进行训练而确定。2.根据权利要求1所述的方法,其特征在于,所述应用程序使用数据包括:应用程序安装列表和应用程序使用行为中的至少一个。3.根据权利要求2所述的方法,其特征在于,还包括:获取已知性别用户的应用程序使用数据;从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据;根据所述特征数据,训练性别分类模型。4.根据权利要求3所述的方法,其特征在于,从所述已知性别用户的应用程序使用数据中提取具有性别识别性的特征数据,包括下述至少一项:根据所述应用程序安装列表,提取具有性别识别性的第一特征数据,所述第一特征数据为至少两个设定类别的应用程序的数量;根据所述应用程序安装列表,提取具有性别识别性的第二特征数据,所述第二特征数据为至少两个应用程序安装人数之间的性别比例;根据所述应用程序使用行为,提取具有性别识别性的第三特征数据,所述第三特征数据为应用程序中同类使用行为的统计数据。5.根据权利要求4所述的方法,其特征在于,根据所述特征数据,训练性别分类模型,包括:根据所述第一特征数据,基于迭代决策树学习算法和算法参数,生成已知性别用户迭代决策树配置信息,训练迭代决策树模型;根据所述第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成已知性别用户稀疏逻辑回归配置信息,训练稀疏逻辑回归模型。6.根据权利要求4所述的方法,其特征在于,所述应用程序中同类使用行为的统计数据包括下述至少一项:消费应用程序的消费行为中对消费金额、消费频率和/或消费品分类的统计数量或比例;阅读器应用程序的阅读行为中对阅读内容分类的统计数量或比例;健身应用程序的健身训练行为中,对健身训练内容、健身训练强度和/或健身训练频率的统计数量或比例。7.根据权利要求5所述的方法,其特征在于,根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,包括:根据所述未知性别用户的第一特征数据,基于迭代决策树学习算法和算法参数,生成未知性别用户迭代决策树配置信息,应用所述迭代决策树模型,识别未知性别用户性别;或根据所述未知性别用户的第一特征数据以及第二特征数据,基于稀疏逻辑回归学习算法和算法参数,生成未知性别用户稀疏逻辑回归配置信息,应用稀疏逻辑回归模型,识别未知性别用户性别。8.根据权利要求1所述的方法,其特征在于,根据所述未知性别用户的特征数据,基于性别分类模型对未知性别用户进行性别识别,包括:根据所述未知性别用户的特征数据,基于性别分类模型识别所述未知性别用户性别为男或女,以及对应的概率。9.一种用户性别识别装置,其特征在于,包括:第一使用数据...

【专利技术属性】
技术研发人员:马守玉徐锐
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1