一种基于信息增益的推荐方法技术

技术编号：36890505 阅读：19 留言：0更新日期：2023-03-15 21:54

本发明专利技术涉及一种基于信息增益的推荐方法，属于计算机领域。对目标事物的累计兴趣度结果保证了人群整体的偏好度倾向；而用户信息增益的计算，则能够较精准地把握每个用户的兴趣转移状态。所以能够更精准的挖掘潜在业务偏好人群。这个方法兼顾了人群整体行为特性和个体的兴趣状态变化，所以能够更有效地聚焦业务潜在营销群体。本发明专利技术在样本量较大、特征较多且大部分数据特征与目标业务相关度较低的情况下，尽量保留原始样本信息完整性，并结合人群整体的行为特性和个体的特征行为变化对每个用户的兴趣点做精准定位，由此进行业务的扩量和营销的降本。销的降本。销的降本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于信息增益的推荐方法

[0001]本专利技术属于计算机领域，涉及一种基于信息增益的推荐方法。

技术介绍

[0002]随着用户获取信息的渠道和方式越来越多元化，单个特征在反馈用户行为偏好上也越来越片面化，基于海量数据营销的获客成本越来越高。这就需要我们整合用户随机繁杂的行为数据信息，将对目标事物感兴趣的潜在用户进行信息聚焦。
[0003]在我们实际的业务数据分析中，受限于计算资源，偏好使用Randomforest、TGI、LR、基于标签逻辑的规则等简单方法；这些方法推荐的头部用户效果较好，但是随着规则下探，推荐用户的效果衰退较快，往往无法做到快速扩量的目的。经分析，我们常用的方法大都基于极大似然估计，以数据特征的权重计算为主，筛选强相关特征覆盖的用户进行业务营销；而对每个用户本身行为特征的变化分析还不够深入。这里将结合人群整体的行为共性和个体行为的特性做进一步挖掘。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种基于信息增益的推荐方法。
[0005]为达到上述目的，本专利技术提供如下技术方案：
[0006]一种基于信息增益的推荐方法，该方法包括以下步骤：
[0007]S1：对于单个用户网络行为信息值的计算，将该用户浏览行为看成一个事件；对于不同访问行为，看成是对应事件的不同结果，该用户的信息值为：
[0008][0009]P(x
i
)表示随机事件X为x
i
的概率；m表示特征数；使用统计周期内，用户不同访问...

【技术保护点】

【技术特征摘要】
1.一种基于信息增益的推荐方法，其特征在于：该方法包括以下步骤：S1：对于单个用户网络行为信息值的计算，将该用户浏览行为看成一个事件；对于不同访问行为，看成是对应事件的不同结果，该用户的信息值为：P(x
i
)表示随机事件X为x
i
的概率；m表示特征数；使用统计周期内，用户不同访问行为的占比来代替不同访问行为发生的概率；用户接收到的信息量跟具体发生的事件有关，而信息的大小跟随机事件的概率有关；概率越小的事件发生，产生的信息量越大；越大概率的事件发生，产生的信息量越小；当用户的访问行为越来越纯粹时，信息值就会越来越小；S2：使用给定样本人群n，训练集N，其中包含m个特征，计算不同特征所覆盖人群整体的目标偏好度q
i
：q
i
＝(n∩N
i
)/N
i
,i∈1,...,m其中，N
i
代表训练集中特征i覆盖用户量；q
i
是以单个特征下目标用户的占比衡量该特征覆盖人群对目标事物的整体偏好强度；S3：计算单个用户k所有特征行为的目标事物累计兴趣度V
k
：其中，表示用户k对特征i的有效访问频次；V
k
以单用户的有效访问频次乘以对应特征对目标事物偏好度，再对所有特征进行累计求和，得到该用户整体访问行为下对目标事物的偏向程度；S4：计算单个用户带有访问偏好的信息值；用户k访问偏好信息值h
k
公式为：其中，h
k
＞0，用户访问行为越丰富，对应信息值越大；S5：计算周期内用户k访问行为的信息增益Gain(h
k
)：Gain(h
k
)＝h
k<...

【专利技术属性】
技术研发人员：杨睿通，
申请(专利权)人：江苏金信天信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人