用户价值评分方法和系统技术方案

技术编号:16365968 阅读:23 留言:0更新日期:2017-10-10 22:08
本发明专利技术涉及一种用户价值评分方法和系统。该方法包括步骤:获取正样本和负样本,其中,所述正样本为产生实际价值的用户的若干个属性,所述负样本为未产生实际价值的用户的若干个属性,用户的属性包括数值型的属性和分类型的属性;根据所述正样本和所述负样本计算每个属性的信息值,其中所述信息值用于评估一个属性对所述正样本的影响程度;根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重;根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分。本发明专利技术提高了用户价值判断的准确性。

User value scoring method and system

The invention relates to a user value scoring method and system. The method comprises the steps of: obtaining positive and negative samples, among them, the number of positive sample attributes for the actual value of the users, the negative samples for the attributes of the actual value of the user is not generated, the user attributes include the attribute value type and type genus; according to the positive the sample and the negative samples is calculated for each attribute value information, wherein the information value is used to evaluate the influence of an attribute of the positive sample; according to the information of each attribute value of all the attributes and values of information, get the weight of each attribute according to the attribute weights; a plurality of attributes of users the obtained values and the corresponding user value score. The invention improves the accuracy of the user value judgment.

【技术实现步骤摘要】
用户价值评分方法和系统
本专利技术涉及计算机
,特别是涉及用户价值评分方法和用户价值评分系统。
技术介绍
一个企业的用户是企业价值的基石,对用户的了解影响企业服务质量,而了解用户的一个有效的手段就是对用户价值进行评分。用户价值评分可用于对不同的价值的用户进行分层管理;或者用于筛选出高价值用户,对高价值用户给予更多关注,提升高价值用户群体的质量;又或者作为运营分析的市场监控,正常来讲用户价值分布处于一个正常范围内,若发现分值的分布有显著变化,则反馈这个异常,由分析师进一步分析产生异常的原因,降低市场风险等。因此,正确评估用户价值对企业来说至关重要。而传统技术中一般是主观判断用户的价值,因此无法准确反映用户价值。
技术实现思路
基于此,有必要针对上述用户价值判断不准确的问题,提供一种用户价值评分方法和系统,能够根据用户属性客观判断用户价值,提高了用户价值判断的准确性。一种用户价值评分方法,包括步骤:获取正样本和负样本,其中,所述正样本为产生实际价值的用户的若干个属性,所述负样本为未产生实际价值的用户的若干个属性,用户的属性包括数值型的属性和分类型的属性;根据所述正样本和所述负样本计算每个属性的信息值,其中所述信息值用于评估一个属性对所述正样本的影响程度;根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重;根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分。一种用户价值评分系统,包括:样本获取模块,用于获取正样本和负样本,其中,所述正样本为产生实际价值的用户的若干个属性,所述负样本为未产生实际价值的用户的若干个属性,用户的属性包括数值型的属性和分类型的属性;信息值计算模块,用于根据所述正样本和所述负样本计算每个属性的信息值,其中所述信息值用于评估一个属性对所述正样本的影响程度;权重获得模块,用于根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重;用户价值评分模块,用于根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分。上述用户价值评分方法和系统,基于用户的属性计算出属性的权重,根据属性的属性值和属性的权重对用户价值进行评分,由于用户价值评分根据客观数据(用户属性)自适应地自动化计算得到,因此该用户价值评分能够客观反映用户价值,提高了用户价值判断的准确性。附图说明图1为一实施例的用户价值评分方法的流程示意图;图2为一实施例的用户价值评分系统的结构示意图。具体实施方式为更进一步阐述本专利技术所采取的技术手段及取得的效果,下面结合附图及较佳实施例,对本专利技术的技术方案,进行清楚和完整的描述。如图1所示,一种用户价值评分方法,包括步骤:S110、获取正样本和负样本,其中,所述正样本为产生实际价值的用户的若干个属性,所述负样本为未产生实际价值的用户的若干个属性,用户的属性包括数值型的属性和分类型的属性;S120、根据所述正样本和所述负样本计算每个属性的信息值,其中所述信息值用于评估一个属性对所述正样本的影响程度;S130、根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重;S140、根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分。上述用户价值评分方法可以通过相应的程序实现,程序运行在终端中,例如电脑或者手机中。该方法根据属性的属性值和属性的权重对用户价值进行评分,由于用户价值的判断基于客观数据,因此能够客观判断用户价值,提高了用户价值判断的准确性。为了更好地理解该方法,下面对各个步骤进行详细介绍。在步骤S110中,用户并不限制于是一个企业相关的用户,还可以是个人创办的网站中所访问的用户等,本专利技术并不对此做出限定。用户的属性包括用户行为和用户基本信息,用户行为指的是用户通过中间资源购买、使用和评价某种产品的记录,同时辅以用户资源产品自身及环境的信息,用户基本信息也可以称之为用户基本属性,一般包括用户的姓名、年龄和性别等等。用户的价值由用户行为和用户基本属性综合得到,而不同的属性有不同的价值,因此准确判断用户价值的关键点在于准确确定每个属性的权重,下面将对如何确定各个属性的权重进行介绍。用户价值可以为用户带来的流水、用户通过产品进行有效数据交换的数量和质量、用户帮助推广产品的力度、用户对产品反馈意见等等。正样本为产生实际价值的用户的属性,负样本为未产生实际价值的用户的属性,是否产生实际价值可以根据实际场景进行确定。例如,在某购物网站中,如果用户在该购物网站购买了产品,则认定为该用户产生了实际价值,如果用户只是浏览了该购物网站,并没有购买任何产品,则认定为该用户未产生实际价值。获取正负样本的方式有很多种,例如,在一个实施例中,获取正样本和负样本的步骤可以包括:获取所有用户的属性,对每个属性进行清洗,获得属性的全量样本;按照预设的正样本和负样本的比例,从所述全量样本中选取正样本和负样本。正样本和负样本的比例可以根据实际需要进行设定,考虑到未产生实际价值的用户一般多于产生实际价值的用户,可选的,选取的负样本的数量一般多于正样本的数量,例如,正样本和负样本的比例为1:9。对数据进行清洗的方法有很多种,例如,在一个实施例中,对每个属性进行清洗的步骤可以包括:S1、若获取的某条记录中属性的属性值不在设定范围内,将该条记录删除或者将该属性值替换为空值;事先设定每个属性取值的范围,如果获取的某条记录中属性的属性值不在设定的范围内,则确定该属性值为异常值,将该条记录删除或者将该属性值替换为空值。以性别为例,设定性别的属性值的范围为女性、男性和中性,如果获取的一条记录中性别的属性值为13,则可以确定该属性值为记录错误的数据,即异常值,将该条记录删除或者将13替换为空值。如果某一个属性下所有的属性值都不在设定的范围内,将该属性删除;S2、对若干个属性进行计算,衍生出新的属性;该步骤实质上是指标衍生的过程,通过多个变量的计算衍生出新的有意义的变量可以根据现有技术中已有的方式实现;S3、若属性为数值型的属性,将该数值型的属性的所有属性值从小到大进行排序,获得在预设位置的分位数,将大于所述分位数的属性值替换为所述分位数;预设位置为所有属性值的总数量与预设比值的乘积;该步骤实质上是对一个属性的极大值的处理,避免不合理的极大值影响后续计算的结果。预设比值可以根据实际需要进行确定,例如预设位置为总数量*99%。对数值型的属性,计算分布的X%分位数,将大于X%分位数的属性值替换为X%分位数。X%分位数为将变量所有属性值从小到大排序,排名在总样本量*X%的那个属性值,即小于X%分位数的样本量占总样本量的X%。在步骤S120中,若某个属性下的某个属性值中正样本比例远远大于全量样本中正样本的比例,则认为这个属性的这个属性值对正样本是正相关的,反之则为负相关,即对于数值型的属性,正样本的比例随着属性的属性值的增大而增大,则认为这个属性的这个属性值对正样本是正相关的,反之则为负相关。因此定义信息值(IV值,InformationValue),评估一个变量对正样本的判断量(影响程度),信息值越大,包含的信息越多,权重也就越大。在一个实施例中,根据所述正样本和所述负样本计算每个属性的信息值的步骤可以包括:S1201、通过分箱法获取抽样样本的所有分箱,其中所述抽样样本包括所本文档来自技高网...
用户价值评分方法和系统

【技术保护点】
一种用户价值评分方法,其特征在于,包括步骤:获取正样本和负样本,其中,所述正样本为产生实际价值的用户的若干个属性,所述负样本为未产生实际价值的用户的若干个属性,用户的属性包括数值型的属性和分类型的属性;根据所述正样本和所述负样本计算每个属性的信息值,其中所述信息值用于评估一个属性对所述正样本的影响程度;根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重;根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分。

【技术特征摘要】
1.一种用户价值评分方法,其特征在于,包括步骤:获取正样本和负样本,其中,所述正样本为产生实际价值的用户的若干个属性,所述负样本为未产生实际价值的用户的若干个属性,用户的属性包括数值型的属性和分类型的属性;根据所述正样本和所述负样本计算每个属性的信息值,其中所述信息值用于评估一个属性对所述正样本的影响程度;根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重;根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分。2.根据权利要求1所述的用户价值评分方法,其特征在于,根据所述正样本和所述负样本计算每个属性的信息值的步骤包括:通过分箱法获取抽样样本的所有分箱,其中所述抽样样本包括所述正样本和所述负样本;计算每个分箱内的正样本占全部正样本的第一比例,以及每个分箱内的负样本占全部负样本的第二比例;根据所述第一比例和所述第二比例的差值与所述第一比例和所述第二比例比值的自然对数的乘积,获得每个分箱的信息值;对包含同一属性的所有分箱的信息值进行求和,获得每个属性的信息值。3.根据权利要求2所述的用户价值评分方法,其特征在于,通过分箱法获取抽样样本的所有分箱的步骤包括:若属性为数值型的属性,将抽样样本按照预设排序规则进行排序,并将排序后的抽样样本分成若干个分箱,得到抽样样本的所有分箱;若属性为分类型的属性,将每个分类型的属性作为一个分箱,得到抽样样本的所有分箱。4.根据权利要求1至3任意一项所述的用户价值评分方法,其特征在于,根据每个属性的信息值与所有属性的信息值的和的比值,获得每个属性的权重的步骤包括:按照预设筛选规则对所有属性进行筛选,获得保留的各个属性;根据保留的每个属性的信息值与保留的所有属性的信息值的和的比值,获得每个属性的权重。5.根据权利要求4所述的用户价值评分方法,其特征在于,按照预设筛选规则对所有属性进行筛选,获得保留的各个属性的步骤包括以下的任意一种或任意组合:若两个属性的相关性大于预设阈值,将两个属性中信息值较大的属性进行保留;将信息值大于预设值的属性进行保留;按照信息值从大到小的顺序,从信息值最大的属性开始选取预设个数的属性,将选取的属性进行保留,得到保留的各个属性。6.根据权利要求2或3所述的用户价值评分方法,其特征在于,根据用户的若干个属性的属性值和对应的权重获得用户的用户价值评分之前,还包括步骤:若属性为分类型的属性,根据所述第一比例和所述第二比例比值的自然对数获得每个分类型的属性的证据权重,将每个分类型的属性的属性值替换为对应的证据权重;对每个属性的属性值进行标准化,并将每个属性的属性值替换为...

【专利技术属性】
技术研发人员:周欢
申请(专利权)人:广东万丈金数信息技术股份有限公司广州快信信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1