当前位置: 首页 > 专利查询>黄锐专利>正文

一种基于Embedding的实时个性化金融产品推荐算法制造技术

技术编号:25692125 阅读:21 留言:0更新日期:2020-09-18 21:03
本发明专利技术公开了一种基于Embedding的实时个性化金融产品推荐算法,包括以下几个步骤:S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;S2、训练集的构建,对用户的历史金融产品购买情况(浏览情况)构建训练集;S3、对数据集进行处理,采集负样本;S4、利用skip‑gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户;本发明专利技术基于大数据分析金融产品数据和用户数据,可以将不同类型的产品推荐给合适的人群。

【技术实现步骤摘要】
一种基于Embedding的实时个性化金融产品推荐算法
本专利技术涉及计算机算法
,具体为一种基于Embedding的实时个性化金融产品推荐算法。
技术介绍
随着互联网的发展,传统金融行业受到冲击,以银行为代表的金融机构面临着营销方面的巨大挑战。每个客户在金融市场中愿意承受风险的意愿各不相同,对于银行等金融机构来说就需要根据不同客户的需求提供满足客户的产品和服务,而这些金融机构的人力物力资源有限,针对客户的推荐效果不明显,特别是一些潜在客户的流失问题尤为严重,这成为了金融机构亟待解决的问题。站在消费者的角度上来看,市面上的金融产品数目繁多,其质量和信用评价参差不齐,在金融市场的海量信息中筛选出符合自己兴趣和购买力的产品,用户需要进行多方面、多维度地数据分析,才能做出合理的产品选择。Embedding指的是通过一个映射函数把X所属空间的物体映射为到为Y空间的多维向量,空间距离相近的Embedding向量对应有着相近的物体含义。skip-gram算法是指在对一个单词进行语义Embedding训练时,假设其中一个长度为T的句子为L1,L2,L3……LT,在指定一个中心词后我们关注的上下文数量为该中心词前m个词和后m个词,通过中心词去预测相对应的上下文词;本方案基于skip-gram算法,提出了一种基于Embedding的实时个性化金融产品推荐算法。
技术实现思路
本专利技术的目的在于提供一种基于Embedding的实时个性化金融产品推荐算法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于Embedding的实时个性化金融产品推荐算法,包括以下几个步骤:S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;S2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;S3、对数据集进行处理,采集负样本;S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。作为本专利技术一种优选的技术方案,所述步骤S1中,用户的个人信息包括但不限于姓名、身份证号、年龄、职业、学历,所述近期资产评估情况包括但不限于客户近期资金进出账情况、客户信用度。作为本专利技术一种优选的技术方案,所述步骤S2中包括如下步骤:S21:将每个用户点击过的金融产品构成一个数据记录集合;S22:按照点击的时间先后顺序进行排序;S23:过滤查看时长在30秒内的产品浏览记录;S24:将保留的浏览记录构造成训练集,其包括两个部分:一是有预定产品行为的预定记录,一种是没有预定行为的查看记录。作为本专利技术一种优选的技术方案,所述步骤S3中,所述负样本从客户没有浏览过的金融产品中进行随机抽取采样,且侧重于抽取不热门的金融产品。作为本专利技术一种优选的技术方案,所述步骤S4中对连续点击的产品记录,通过skip-gram算法,将每个用户连续点击查看的金融产品当成一个句子序列,其中的产品个体当作word,通过中间的产品去预测前后上下文的产品,训练出产品的Embedding。作为本专利技术一种优选的技术方案,所述步骤S4中,训练函数为:其中,vl表示当前查看金融产品的向量,vc表示周围的金融产品的向量,l被称为中心节点,c被称为中心节点前后连续的节点;Rp表示正样本,Rn表示负样本,表示新增的负样本;不带'表示输入向量,带'表示输出向量;函数中第一项代表正样本的似然估计,第二项为负样本的似然估计,第三项为成交的金融产品的似然估计,第四项为对新增的负样本进行似然估计。作为本专利技术一种优选的技术方案,所述步骤S5中,包括如下步骤,S51:对推荐的产品进行分类,并对推荐产品计算相似度;S52:将计算后相似度从高到低排序,取前5~10个金融产品推荐给客户。作为本专利技术一种优选的技术方案,所述步骤S51中,推荐产品一共包括两个类别,其中一个类别为用户最近一个月查看次数过的产品,为历史产品点击集合,用N(a)表示其Embedding集合;另外一个类别为用户实时点击过的产品,用N(b)表示该产品的Embedding。作为本专利技术一种优选的技术方案,所述步骤S51中,将候选产品与上述两种类别中的产品计算产品之间相似度以及用户对候选产品的兴趣度,计算公式为:其中,其中N(i)表示候选产品列表,N(a)为近期一个月内点击的产品列表,N(b)表示用户实时点击的产品,N(i)∩N(a)表示候选产品与用户一个月内点击过的产品列表中相同的产品,N(i)∩N(b)表示候选产品与用户实时点击过的产品列表中相同的产品,wia、wib代表物品之间的相似度,pui用户u对候选物品i的兴趣度,rua、rub是用户对浏览过的产品的兴趣度,α、β分别表示历史点击产品和实时浏览产品对最终推荐结果的影响权重,其中α+β=1,α=0.3,β=0.7。与现有技术相比,本专利技术的有益效果是:本专利技术,提供一种基于Embedding的实时个性化金融产品推荐算法,基于大数据分析金融产品数据和用户数据,通过求产品Embedding与历史点击产品以及实时点击产品之间的相似度获取用户对候选产品的兴趣度,从而有效的达到实时推荐的效果,这不仅解决了用户面对种类繁多的产品却无从下手的情况,同时也可以很好的帮助银行解决推荐数据稀疏的问题,提升银行推荐的准确性。附图说明图1为本专利技术的流程示意图;图2为本专利技术的Embedding向量训练示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-2,本专利技术提供一种技术方案:一种基于Embedding的实时个性化金融产品推荐算法,包括以下几个步骤:S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;S2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;S3、对数据集进行处理,采集负样本;S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。进一步的,所述步骤S1中,用户的个人信息包括但不限于姓名、身份证号、年龄、职业、学历,所述近期资产评估情况包括但不限于客户近期资金进出账情况、客户信用本文档来自技高网...

【技术保护点】
1.一种基于Embedding的实时个性化金融产品推荐算法,其特征在于,包括以下几个步骤:/nS1、银行通过业务系统采集用户的个人信息和近期资产评估情况;/nS2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;/nS3、对数据集进行处理,采集负样本;/nS4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;/nS5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。/n

【技术特征摘要】
1.一种基于Embedding的实时个性化金融产品推荐算法,其特征在于,包括以下几个步骤:
S1、银行通过业务系统采集用户的个人信息和近期资产评估情况;
S2、训练集的构建,对用户的历史金融产品浏览情况构建训练集;
S3、对数据集进行处理,采集负样本;
S4、利用skip-gram分别对离线点击过的产品、实时点击的产品、候选产品进行Embedding训练;
S5、根据Embedding训练结果在基于历史点击产品的基础上计算实时点击产品与候选产品之间的物品相似度,然后基于物品相似度计算出用户对候选产品的兴趣度,根据兴趣度的高低将产品推荐给客户。


2.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S1中,用户的个人信息包括但不限于姓名、身份证号、年龄、职业、学历,所述近期资产评估情况包括但不限于客户近期资金进出账情况、客户信用度。


3.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S2中包括如下步骤:
S21:将每个用户点击过的金融产品构成一个数据记录集合;
S22:按照点击的时间先后顺序进行排序;
S23:过滤查看时长在30秒内的产品浏览记录;
S24:将保留的浏览记录构造成训练集,其包括两个部分:一是有预定产品行为的预定记录,一种是没有预定行为的查看记录。


4.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S3中,所述负样本从客户没有浏览过的金融产品中进行随机抽取采样,且侧重于抽取不热门的金融产品。


5.根据权利要求1所述的一种基于Embedding的实时个性化金融产品推荐算法,其特征在于:所述步骤S4中对连续点击的产品记录,通过skip-gram算法,将每个用户连续点击查看的金融产品当成一个句子序列,其中的产品个体当作word,通过中间的产品去预测前后上下文的产品,训练出产品的Embedding。


6.根据权利要求5所...

【专利技术属性】
技术研发人员:黄锐唐松
申请(专利权)人:黄锐唐松
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1