一种推荐系统整合策略及推荐系统技术方案

技术编号:22975096 阅读:47 留言:0更新日期:2019-12-31 23:34
本发明专利技术涉及一种推荐系统整合策略及推荐系统,所述整合策略包括如下步骤:载入服务架构及配置文件;基于业务场景进行召回;载入融合策略,各业务场景均采用统一的融合策略;调用融合策略,各个召回器最终融合后的数据,累加后即为汇总后的数据;将汇总后的数据发送给用户。本发明专利技术,整合策略的兼容性高,可维护性好,针对不同业务场景,仅需相应调整个别参数的设置,即可由具有统一架构的融合器载入系统,使用方便,业务兼容性得到了提升,用户体验好,推荐内容更贴近用户所好。

A recommendation system integration strategy and recommendation system

【技术实现步骤摘要】
一种推荐系统整合策略及推荐系统
本专利技术涉及推荐系统中的数据融合(数据整合)
,具体说是一种推荐系统整合策略及推荐系统。所述整合策略亦可称为融合策略。
技术介绍
现有的推荐系统,包括两个主要的阶段:第一个阶段是召回阶段,召回阶段的主要工作,是通过各种推荐算法,得到推荐数据,产生一个候选集,即由推荐数据构成的候选集,召回阶段,涉及召回器模块及召回策略的设计;第二个阶段是融合阶段,融合阶段的主要工作,是对候选集进行统一的排序,得到排序(精准排序)后的推荐数据,产生最终的推荐结果,融合阶段,涉及融合器模块及融合策略的设计。因此,融合阶段,使用何种整合策略(亦可称为融合策略),将影响到最终的推荐结果,对整合策略的设计,现有技术中,通常有两种方式:基于规则:通常会制定多种加权规则、或切换规则、或融合规则。基于规则对候选集进行处理,产生最终的推荐结果。自动融合:以具体的业务指标为导向的,通过模型对候选集进行处理,产生统一的、最终的推荐结果。常用的模型有:机器学习算法GBDT,因子分解机FM,同时训练线性模型和深度模型WideAndDeep等等。由于推荐系统属于面向B2C(Business-to-Customer)业务,流量大、数据多,在开发推荐系统时,由于融合策略(即融合算法)需要针对不同的应用场景进行相应修改,导致融合器模块(简称融合器)也需要反复改动,影响开发效率,故需要对融合器模块的设计进行优化。以开发、改进音乐类App(酷我音乐APP)为例:我们在设计推荐系统使用的融合器及基于规则的整合策略(融合策略)时发现,由于音乐类App版本的不断更新、迭代,App中包括的功能也在不断丰富、拓展,导致基于规则的整合策略需要兼容多种业务场景,例如:视频场景,音乐片段场景,私人电台场景,歌单场景,等等,这使得整合策略复杂程度越来越高,业务兼容性不足问题严重,影响开发效率。例如:首先,需要确定哪些业务场景需要推荐系统的融入,然后,每个业务场景设计对应的融合器及基于规则的整合策略,如此一来,App功能越多,就会有更多的业务场景需要推荐系统的融入,相应的,就需要设计、开发对应的融合器及基于规则的整合策略,显然这种现有模式产生了业务兼容性不足的问题,影响开发效率。不同业务场景,都需要针对性的调整整合策略,这导致工作量大大增加。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的在于提供一种推荐系统整合策略及推荐系统,整合策略的兼容性高,可维护性好,针对不同业务场景,仅需相应调整个别参数的设置,即可由具有统一架构的融合器载入系统,使用方便,业务兼容性得到了提升,用户体验好,推荐内容更贴近用户所好。为达到以上目的,本专利技术采取的技术方案是:一种推荐系统整合策略,其特征在于,包括如下步骤:载入服务架构及配置文件,具体包括:调用启动脚本,所述启动脚本用于载入融合器的服务架构,用于载入融合策略的配置文件;基于业务场景进行召回,具体包括:首先,获取当前业务场景信息,然后,根据业务场景信息调用不同的召回器,执行对应的召回策略;载入融合策略,各业务场景均采用统一的融合策略,具体包括:首先,读取融合策略所在的文件,然后,解析读取的文件,获取其中记录的文件名、类名、策略类型,再后,将文件名、类名、策略类型封装为参数,以参数的形式传递给服务架构,最后,服务架构加载融合策略到系统中;调用融合策略,具体包括:首先,解析配置文件,获得融合优先级信息,以及融合比例信息,然后,执行融合策略,得到汇总后的数据,即融合后的数据,所述得到汇总后的数据具体包括:各个召回器召回的数据用recall_x_num表示,x表示召回器类型,所述类型至少划分为:个性化数据类型cf、热门数据类型pop、冷门数据类型cold和其他数据类型other,融合比例信息用ratio表示,取值范围为0-10,对应于0%-100%,各个召回器最终融合后的数据用filter_x_num表示,则:filter_x_num=recall_x_num*((ratio*10)%),按融合优先级信息依次计算各个召回器的filter_x_num,再将各个召回器的filter_x_num累加后即为汇总后的数据;将汇总后的数据发送给用户。在上述技术方案的基础上,融合优先级信息的设置原则为:按能体现用户特性的顺序设置各个召回器的融合优先级信息。在上述技术方案的基础上,调用融合策略时,获得融合优先级信息,具体步骤如下:设定一个召回器列表,用于存储融合优先级信息,其中:优先级高的先写入召回器列表,优先级低的后写入召回器列表。在上述技术方案的基础上,所述召回器列表以字符串的形式存储于融合策略的配置文件中,用逗号分隔各召回器,按从左至右的顺序依次读取,读取顺序即体现出优先级高与低。在上述技术方案的基础上,调用融合策略时,默认融合比例信息为:个性化数据类型cf的ratio默认值为6,热门数据类型pop的ratio默认值3,冷门数据类型cold的ratio默认值1,其他数据类型other的ratio默认值10。在上述技术方案的基础上,所述服务架构,具体包括:优先级及比例设定模块,用于调整配置文件中的融合优先级信息,以及融合比例信息,所述融合优先级信息指召回器的融合计算优先级,所述融合比例信息指召回器的融合比例,融合策略根据以上信息,按融合计算优先级依次从对应的召回器获取候选集数据,按融合比例保留指定数量的候选集数据;召回器载入模块,用于基于业务场景,加载不同的召回器,执行对应的召回策略;融合策略调用模块,用于载入的融合策略,执行融合策略,得到汇总后的数据,数据转发模块,用于将汇总后的数据发送给用户;所述服务架构,通过架构文件设定,在所述架构文件中,设定架构各层的数据输入格式及输出格式,所述各层依次为:接入层,输出数据给分发器deliver层,分发器deliver层,输出数据给召回器recall层,召回器recall层,输出数据给过滤器filter层,过滤器filter层,输出数据给融合层,融合层,输出数据给接入层。在上述技术方案的基础上,调用融合策略前,为了获取候选集数据,服务架构链接分发器deliver缓存,形成数据输入通道,服务架构还链接历史数据过滤召回缓存historyredis,用于对召回数据进行去重过滤,历史数据过滤召回缓存historyredis存储过去一定时间内的召回数据,服务架构通过数据输出通道,将融合后的数据写入historyredis,便于召回器进行数据去重工作,服务架构还链接数据接口输出模块缓存,形成数据输出通道。...

【技术保护点】
1.一种推荐系统整合策略,其特征在于,包括如下步骤:/n载入服务架构及配置文件,具体包括:/n调用启动脚本,所述启动脚本用于载入融合器的服务架构,用于载入融合策略的配置文件;/n基于业务场景进行召回,具体包括:/n首先,获取当前业务场景信息,/n然后,根据业务场景信息调用不同的召回器,执行对应的召回策略;/n载入融合策略,各业务场景均采用统一的融合策略,具体包括:/n首先,读取融合策略所在的文件,/n然后,解析读取的文件,获取其中记录的文件名、类名、策略类型,/n再后,将文件名、类名、策略类型封装为参数,以参数的形式传递给服务架构,/n最后,服务架构加载融合策略到系统中;/n调用融合策略,具体包括:/n首先,解析配置文件,获得融合优先级信息,以及融合比例信息,/n然后,执行融合策略,得到汇总后的数据,即融合后的数据,/n所述得到汇总后的数据具体包括:/n各个召回器召回的数据用recall_x_num表示,x表示召回器类型,所述类型至少划分为:个性化数据类型cf、热门数据类型pop、冷门数据类型cold和其他数据类型other,/n融合比例信息用ratio表示,取值范围为0-10,对应于0%-100%,/n各个召回器最终融合后的数据用filter_x_num表示,/n则:filter_x_num=recall_x_num*((ratio*10)%),/n按融合优先级信息依次计算各个召回器的filter_x_num,/n再将各个召回器的filter_x_num累加后即为汇总后的数据;/n将汇总后的数据发送给用户。/n...

【技术特征摘要】
1.一种推荐系统整合策略,其特征在于,包括如下步骤:
载入服务架构及配置文件,具体包括:
调用启动脚本,所述启动脚本用于载入融合器的服务架构,用于载入融合策略的配置文件;
基于业务场景进行召回,具体包括:
首先,获取当前业务场景信息,
然后,根据业务场景信息调用不同的召回器,执行对应的召回策略;
载入融合策略,各业务场景均采用统一的融合策略,具体包括:
首先,读取融合策略所在的文件,
然后,解析读取的文件,获取其中记录的文件名、类名、策略类型,
再后,将文件名、类名、策略类型封装为参数,以参数的形式传递给服务架构,
最后,服务架构加载融合策略到系统中;
调用融合策略,具体包括:
首先,解析配置文件,获得融合优先级信息,以及融合比例信息,
然后,执行融合策略,得到汇总后的数据,即融合后的数据,
所述得到汇总后的数据具体包括:
各个召回器召回的数据用recall_x_num表示,x表示召回器类型,所述类型至少划分为:个性化数据类型cf、热门数据类型pop、冷门数据类型cold和其他数据类型other,
融合比例信息用ratio表示,取值范围为0-10,对应于0%-100%,
各个召回器最终融合后的数据用filter_x_num表示,
则:filter_x_num=recall_x_num*((ratio*10)%),
按融合优先级信息依次计算各个召回器的filter_x_num,
再将各个召回器的filter_x_num累加后即为汇总后的数据;
将汇总后的数据发送给用户。


2.如权利要求1所述的推荐系统整合策略,其特征在于:融合优先级信息的设置原则为:按能体现用户特性的顺序设置各个召回器的融合优先级信息。


3.如权利要求1所述的推荐系统整合策略,其特征在于:调用融合策略时,获得融合优先级信息,具体步骤如下:
设定一个召回器列表,用于存储融合优先级信息,其中:
优先级高的先写入召回器列表,优先级低的后写入召回器列表。


4.如权利要求3所述的推荐系统整合策略,其特征在于:所述召回器列表以字符串的形式存储于融合策略的配置文件中,用逗号分隔各召回器,按从左至右的顺序依次读取,读取顺序即体现出优先级高与低。


5.如权利要求1所述的推荐系统整合策略,其特征在于:调用融合策略时,默认融合比例信息为:
个性化数据类型cf的ratio默认值为6,
热门数据类型pop的ratio默认值3,
冷门数据类型cold的ratio默认值1,
其他数据类型other的ratio默认值10。


6.如权利要求1所述的推荐系统整合策略,其特征在于:所述服务架构,具体包括:
优先级及比例设定模块,用于调整配置文件中的融合优先级信息,以及融合比例信息,
所述融合优先级信息指...

【专利技术属性】
技术研发人员:张力刘永才
申请(专利权)人:北京酷我科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1