一种基于深度强化学习的金融产品推荐方法技术

技术编号:34448036 阅读:29 留言:0更新日期:2022-08-06 16:45
本发明专利技术公开了一种基于深度强化学习的金融产品推荐方法包括以下步骤:步骤1、建立客户兴趣偏好模型,得到点击偏好分值、风险偏好分值、资产偏好分值;步骤2、挖掘历史数据,形成理想产品投资分布,根据当前客户所属的客群及其持仓,建立资产均衡模型,得到当前产品分布与理想产品分布差异化分值;步骤3、对客户潜在兴趣进行探索建模;步骤4、对前述步骤所得分值因子采用深度强化学习方法进行融合参数自适应学习;通过实施本方案后,用户的平均点击率、购买转化率以及成交金额均取得了大幅提升,在手机端的APP理财商城页面进行个性化推荐服务;通过对客户持续深入了解,提升客户服务满意度,为公司的财富管理转型提供强有力的技术支持。持。持。

【技术实现步骤摘要】
一种基于深度强化学习的金融产品推荐方法


[0001]本专利技术属于人工智能应用
,具体涉及基于深度强化学习的金融产品推荐方法。

技术介绍

[0002]近年来,我国财富管理市场高速发展;至2020年末,中国的个人金融资产已达205万亿,互联网财富管理市场达8.2万亿,同时,财富管理主要客户人群年龄也持续年轻化,其中互联网财富管理的主要客群为21

35岁,精准营销业务已经成为证券公司非常重要的增长点,例如,证券行业代理销售金融产品净收入逐年增长,在2020年达134.38亿元,同比增长148.76%,财富管理业务主要营销的产品包括资管产品、公募基金、私募基金、代销信托等各个品类;精准营销业务能够为证券公司带来三大能力,第一是流量能力,证券公司正在积极建立围绕财富管理新趋势的科技平台,提升服务水平,第二是顾问和陪伴能力,证券公司实现业务全面转型线上化,通过提供金融服务以及资讯视频等流媒体的内容大大提升客户粘性,为客户提供顾问和陪伴的服务,第三是产品与投资能力,也是证券公司最核心的竞争力,证券公司代销的金融产品形成了以公募及私本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的金融产品推荐方法,其特征在于:包括以下步骤:步骤1、建立客户兴趣偏好模型,得到点击偏好分值、风险偏好分值、资产偏好分值;步骤2、挖掘历史数据,形成理想产品投资分布,根据当前客户所属的客群及其持仓,建立资产均衡模型,得到当前产品分布与理想产品分布差异化分值;步骤3、建立客户潜在兴趣探索模型,使用新产品探索建模实现对客户未知兴趣挖掘;步骤4、对前述步骤所得分值因子使用深度强化学习方法进行融合参数自适应学习后排序推荐。2.根据权利要求1所述的一种基于深度强化学习的金融产品推荐方法,其特征在于:所述客户兴趣偏好建模步骤包括:建立树模型步骤:通过GBDT建模学习活跃客户的点击偏好、购买偏好、风险偏好,并对客户点击、购买的概率为目标学习。3.根据权利要求1所述的一种基于深度强化学习的金融产品推荐方法,其特征在于:所述客户兴趣偏好建模步骤还包括:蒸馏学习步骤:对新客户与活跃客户的偏好进行学习,找到与当前新客户最相似的活跃客户,用相似活跃客户的偏好表达新客户的偏好,对于活跃客户,设置Teacher Model训练活跃客户的相似度,计算的结果为所有理财活跃客户的相似度,再通过蒸馏萃取,输入到Student Model中,此时Student Model不采用客户购买行为数据作为特征,蒸馏萃取以当前新客户为基础,找到与其最相似的老客户。4.根据权利要求1所述的一种基于深度强化学习的金融产品推荐方法,其特征在于:所述当前产品分布与理想产品分布差异化数值进行客户资产均衡性建模步骤包括:通过分布差异化公式,获得当前产品分布与理想产品分布差异化数值;所述分布差异化公式:u∈g其中,p(c|g)表示,用户U所在客户群体G某种产品类型C的目标分布;q(c|u)表示用户U基于某种产品类型C的持仓和推荐分布;C
KL
表示当前产品分布与理想产品分布差异化数值;U代表用户;g代表客户群体;C代表产品类型;代表所有群体中的用户求和;p代表目标分布、q代表当前分布。5.根据权利要求4所述的一种基于深度强化学习的金融产品推荐方法,其特征在于:所述当前产品分布与理想产品分布差异化数值还包括:获取最优子集,其步骤如下:从原始集合Z={1,...,N}中,选取M个item构成:其中,Z代表商品,N代表产品;M代表从N中选择最优产品子集;item代...

【专利技术属性】
技术研发人员:王瑜石宏飞谢晨李海英梁钥刘敏慧王文琳
申请(专利权)人:申万宏源证券有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1