一种移动拍照类APP用户的性别识别方法及系统技术方案

技术编号:10962289 阅读:401 留言:0更新日期:2015-01-28 14:45
本发明专利技术公开了一种移动拍照类APP用户的性别识别方法及系统,涉及数据挖掘领域,尤其是针对应用软件,如拍照软件,的用户使用行为特征进行用户性别识别的方法。本发明专利技术技术要点:采集测试对象的目标特征值(x1,x2,...,xm);根据测试对象的目标特征值计算z值,z=w0+w1×x1+w2×x2+...wm×xm;其中,(w0,w1,w2,...wm)为已知的目标特征权值;计算测试对象的sigmoid函数值g,g=1/(1+exp(-z));根据g值求取测试对象的类标号t:其中a为二分类阈值。

【技术实现步骤摘要】
-种移动拍照类APP用户的性别识别方法及系统
本专利技术涉及数据挖掘领域,尤其是一种分类/预测技术。
技术介绍
随着网络及智能移动终端的不断发展,涌现出很多APP,为了扩大用户量,很多 APP降低了用户使用门槛,大多数不需要注册,用户便可使用。如拍照软件等。 拍照软件在移动APP中占有极其重要的地位,为即时数字图像娱乐提供了极大便 利。由于大多拍照软件不需注册,造成了用户资料的基本空白(如:性别等)。对用户信息 不了解,APP开发上对产品的改进、营销活动(针对性地特效推荐、广告投放等)等将很难 开展。 因此,很有必要提供一种基于用户对该类APP的使用行为特征确定用户性别等信 息的方法。
技术实现思路
本专利技术所要解决的技术问题是:针对上述存在的问题,提供一种二分类方法及系 统,尤其是根据应用软件,如拍照软件,的用户使用行为特征进行用户性别识别的方法。 本专利技术提供的二分类方法,包括: 步骤1:采集测试对象使用拍照类APP行为的的目标特征值(Xl,x2,...,Xm); 步骤2 :根据所述目标特征值计算z值,z = Wc^w 1XxJw2Xx2+. .. WmXxm ;其中, (w。,》1,%,... wm)为已知的目标特征权值; 步骤3 :计算测试对象的sigmoid函数值g,g=l/(l+exp(_z)); 步骤4 :根据g值求取测试对象的类标号t:

【技术保护点】
一种移动拍照类APP用户的性别识别方法,其特征在于,包括:步骤1:采集测试对象使用拍照类APP行为的目标特征值(x1,x2,...,xm);步骤2:根据所述目标特征值计算z值,z=w0+w1×x1+w2×x2+...wm×xm;其中,(w0,w1,w2,...wm)为已知的目标特征权值;步骤3:计算测试对象的sigmoid函数值g,g=1/(1+exp(‑z));步骤4:根据g值求取测试对象的类标号t:其中a为二分类阈值。

【技术特征摘要】
1. 一种移动拍照类APP用户的性别识别方法,其特征在于,包括: 步骤1 :采集测试对象使用拍照类APP行为的目标特征值(Xl,x2, ...,xm); 步骤2 :根据所述目标特征值计算z值,z=Wc^w1XXfw2Xx2+. ..wmXxm ;其中, (W。,》1,%,...Wm)为已知的目标特征权值; 步骤3 :计算测试对象的sigmoid函数值g,g=l/(l+exp(-z)); Γ^I当g2u 步骤4 :根据g值求取测试对象的类标号t:b= ^gg^fl其中a为二分类阈值。2. 根据权利要求1所述的一种移动拍照类APP用户的性别识别方法,其特征在于,所述 目标特征的确定步骤为: 步骤al:确定训练对象及训练对象使用拍照类APP行为的初步特征,采集每个训练对 象的初步特征的特征值;将不同训练对象的相同的初步特征的特征值集合在一起作为一个 初步特征值向量; 步骤a2 :将初步特征值向量分别作为InfoGain特征选择函数、Chi_Square特征选择函 数以及CFS特征选择函数的输入得到每个初步特征的InfoGain权值、Chi_Square权值以 及CFS权值; 步骤a3 :将每个初步特征的InfoGain权值与InfoGain筛选阈值比较,将大于InfoGain筛选阈值的初步特征值保留并作为第一特征集合;将每个初步特征的Chi_ Square权值与Chi_Square筛选阈值比较,将大于Chi_Square筛选阈值的初步特征值保留 并作为第二特征集合;将每个初步特征的CFS权值与CFS筛选阈值比较,将大于CFS筛选阈 值的初步特征值保留并作为第三特征集合; 步骤a4 :计算第一特征集合、第二特征集合与第三特征集合的交集,并将交集中的成 员作为目标特征。3. 根据权利要求1所述的一种移动拍照类APP用户的性别识别方法,其特征在于,目标 特征权值的(Wtl,W1,W2, ...Wm)的获取方法包括: η 令目标特征数量为m;对似然函数》') = 1^/4(^.) + (1UnG-g,.)丨求导,将不同训练 对象的目标特征的特征值依次带入求导后的似然函数并令求导后的函数值为〇得到包含η个方程的方程组,利用牛顿-拉斐森方法进行迭代,得到方程组的解(^,Wl,w2,...wm) ;η为 训练对象个数;其中(Xli,x2i,...,xmi)为第i个训练对象的目标特征值山为第i个训练对 象的类标号,h为已知量,其取值为0或I;gi为第i个训练对象的sigmoid值,gi= 1/(1+ θχρ(_(?νΗ¥ιΧχπ+¥2Χχ2?+· · .WmXxmi)));n不小于m+1。4. 根据权利要求1所述的一种移动拍照类APP用户的性别识别方法,其特征在于,目标 特征权值的(Wtl,W1,W2, ...Wm)的获取方法包括: 令 目 标特征 数量为m; 对似 然函数 2 /(VV)=乞!,>(g,.) + (1 -)ln(l-g,)!-乞!In具+ 2^ + 求导,将不同训练对象的目标 1=1 7=1 LIoj 特征的特征值依次带入求导后的似然函数并令求导后的函数值为〇得到包含η个方程的方 程组,利用牛顿-拉斐森方法进行迭代,得到方程组的解(%,W1,w2,. . .Wm) ;n为训练对象个 数; 其中(Xli,x2i,. . .,xmi)为第i个训练对象的目标特征值山为第i个训练对象的类标 号,h为已知量,其取值为O或I;gi为第i个训练对象的sigmoid值,gi=l/(l+exp(-(wQ +W1Xx1^w2Xx2i+. · .WmXxmi))) ;δj为基于η个训练对象的第j个目标特征值计算得到的第 j个目标特征的方差;η不小于m+1。5. 根据权利要求1所述的一种移动拍照类APP用户的性别识别方法,其特征在于,a取 ...

【专利技术属性】
技术研发人员:陈若田
申请(专利权)人:成都品果科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1