The embodiment of the invention provides a method and a device for identifying social business characteristics of the user, the method comprises: a user data acquisition candidate user, in some of the candidate users, according to the first social attribute data mining social business characteristics of users; using the social service characteristics of the user's social attribute data and second data second the business object attribute classifier training; the first social attribute data of neighbor users and the first business object attribute data input to the classifier, the output of the neighbor users after the first time a long time whether the social characteristics of the user's business results, the neighbor users for the candidate user except the social business the characteristics of the user's. The embodiment of the invention increases the amount of data associated with each other, improves the accuracy of the classifier, thereby improving the accuracy of identification and identifying potential social service characteristics of users in the first period of time.
【技术实现步骤摘要】
一种社交业务特征用户的识别方法和装置
本申请涉及计算机的
,特别是涉及一种社交业务特征用户的识别方法和一种社交业务特征用户的识别装置。
技术介绍
网络的迅猛发展将人们带入了信息社会和网络经济时代,对企业的发展和个人生活都产生了深刻的影响。为了提高服务的精确度,很多网站都对用户进行识别,针对群体的特性对群体中用户进行服务。例如,对体育爱好群体的用户提供最新的体育新闻,对动漫爱好群体的用户提供最新的动漫资讯等等。目前,用户的识别一般是通过用户行为之间的相似性进行聚类,行为相似的用户聚集在同一个群体中。一方面,这些识别用户的方法仅仅应用了某一种类型的行为数据进行聚类,数量较少,行为片面。另一方面,这些识别用户的方法仅仅集中在当前的时间内,而用户的行为是随着时间而发生变化的。综上,这些识别用户的方法识别精确度较低,无法识别潜在的部分用户。
技术实现思路
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种社交业务特征用户的识别方法和相应的一种社交业务特征用户的识别装置。为了解决上述问题,本申请实施例公开了一种社交业务特征用户的识别方法,包括:获取候选用户的用户数据,所述用户数据包括在第一时间段内关联的第一社交属性数据和第一业务对象属性数据、在第二时间段内关联的第二社交属性数据和第二业务对象属性数据,所述第二时间段在所述第一时间段之前的一段时间;在部分候选用户中,根据所述第一社交属性数据挖掘社交业务特征用户;采用所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据训练分类器;将近邻用户的第一社交属性数据和第一业务对象属性 ...
【技术保护点】
一种社交业务特征用户的识别方法,其特征在于,包括:获取候选用户的用户数据,所述用户数据包括在第一时间段内关联的第一社交属性数据和第一业务对象属性数据、在第二时间段内关联的第二社交属性数据和第二业务对象属性数据,所述第二时间段在所述第一时间段之前的一段时间;在部分候选用户中,根据所述第一社交属性数据挖掘社交业务特征用户;采用所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据训练分类器;将近邻用户的第一社交属性数据和第一业务对象属性数据输入所述分类器中,输出所述近邻用户在所述第一时间段之后的一段时间是否为社交业务特征用户的结果,所述近邻用户为除所述社交业务特征用户之外的候选用户。
【技术特征摘要】
1.一种社交业务特征用户的识别方法,其特征在于,包括:获取候选用户的用户数据,所述用户数据包括在第一时间段内关联的第一社交属性数据和第一业务对象属性数据、在第二时间段内关联的第二社交属性数据和第二业务对象属性数据,所述第二时间段在所述第一时间段之前的一段时间;在部分候选用户中,根据所述第一社交属性数据挖掘社交业务特征用户;采用所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据训练分类器;将近邻用户的第一社交属性数据和第一业务对象属性数据输入所述分类器中,输出所述近邻用户在所述第一时间段之后的一段时间是否为社交业务特征用户的结果,所述近邻用户为除所述社交业务特征用户之外的候选用户。2.根据权利要求1所述的方法,其特征在于,所述在部分候选用户中,根据所述第一社交属性数据挖掘社交业务特征用户的步骤包括:从所述候选用户的第一社交属性数据中提取与业务处理相关的社交业务消息;采用所述社交业务消息识别社交业务特征用户。3.根据权利要求2所述的方法,其特征在于,所述采用所述社交业务消息识别社交业务特征用户的步骤包括:按照图计算采用所述社交业务消息识别社交业务特征用户。4.根据权利要求1所述的方法,其特征在于,所述采用所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据训练分类器的步骤包括:从所述候选用户的第一社交属性数据和第一业务对象属性数据中,选取表征业务处理的第一社交业务特征数据和第一业务对象特征数据;从所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据中,提取与所述第一社交业务特征数据和所述第一业务对象特征数据同类型的第二社交业务特征数据和第二业务对象特征数据;采用所述第二社交业务特征数据和所述第二业务对象特征数据训练分类器。5.根据权利要求4所述的方法,其特征在于,所述采用所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据训练分类器的步骤还包括:对所述社交业务特征用户的第二社交业务特征数据和第二业务对象特征数据进行特征转换;其中,所述特征转换包括以下的一种或多种:均值转换、方差转换、斜率转换、波峰波谷个数转换。6.根据权利要求4所述的方法,其特征在于,所述采用所述社交业务特征用户的第二社交属性数据和第二业务对象属性数据训练分类器的步骤还包括:计算近邻用户的第一业务对象特征数据、与所述社交业务特征用户的第一业务对象特征数据之间的相似度;当所述相似度大于预设的相似度阈值时,将所述近邻用户的第一业务对象特征数据、与所述社交业务特征用户的第一业务对象特征数据进行合并。7.根据权利要求4或5或6所述的方法,其特征在于,所述从所述候选用户的第一社交属性数据和第一业务对象属性数据中,选取表征业务处理的第一社交业务特征数据和第一业务对象特征数据的步骤包括:从所述候选用户的第一社交属性数据和第一业务对象属性数据中提取与业务处理相关的第一社交业务候选数据和第一业务对象候选数据;在所述第一社交候选数据和所述第一业务候选数据中,按照重要性进行排序;查找所述候选用户所属行业的选择规则;在排序后的第一社交业务候选数据和第一业务对象候选数据中,选取满足所述选择规则的第一社交业务特征数据和第一业务对象特征数据。8.根据权利要求4或5或6所述的方法,其特征在于,所述将近邻用户的第一社交属性数据和第一业务对象属性数据输入所述分类器中,输出所述近邻用户在所述第一时间段之后的一段时间是否为社交业务特征用户的结果的步骤包括:将近邻用户的第一社交业务特征数据和第一业务对象特征数据输入所述分类器中,输出所述近邻用户在所述第一时间段之后的一段时间是否为社交业务特征用户的结果。9.根据权利要求8所述的方法,其特征在于,所述将近邻用户的第一社交属性数据和第一业务对象属性数据输入所述分类器中,输出所述近邻用户在所述第一时间段之后的一段时间是否为社交业务特征用户的结果的步骤还包括:对近邻候选用户的第一社交业务特征数据和第一业务对象特征数据进行特征转...
【专利技术属性】
技术研发人员:叶舟,王瑜,陈凡,杨洋,毛庆凯,杜楠楠,王辉,杜芳雪,袁飞,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。