【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种通信套餐的推荐方法及装置、设备及介质。
技术介绍
1、随着大数据时代的到来,神经网络技术也被应用于各种各样产品的推荐系统中,以通信套餐推荐为例,可以将用户基本特征输入预先训练的神经网络模型中,输出待推荐用户对各通信套餐的选择概率。
2、在相关技术中,需要使用大量用户通信信息训练神经网络模型,以使得训练后的神经网络模型可以在推理阶基于待推荐用户的基本特征为待推荐用户推荐通信套餐。但是这种神经网络模型增加了样本数据采集成本,不利于降低投入成本。
技术实现思路
1、根据本公开的一方面,提供了一种通信套餐的推荐方法,包括:
2、基于目标用户在多个预设时段的用户通信信息确定多种通信状态和多种套餐动作;
3、基于每个所述预设时段的用户通信信息确定每个所述预设时段的所述套餐动作的奖励值;
4、基于多种通信状态、多种套餐动作以及每个所述预设时段的套餐动作的奖励值进行强化学习,获得每种所述套餐动作在不同通信状态下的价值度;
...【技术保护点】
1.一种通信套餐的推荐方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标用户在每个所述预设时段的用户通信信息至少包括:所述目标用户在每个所述预设时段的数据使用量和套餐累计订阅数据,所述基于每个所述预设时段的用户通信信息确定每个所述预设时段的套餐动作的奖励值,包括:
3.根据权利要求2所述的方法,其特征在于,所述套餐累计订阅数据包括套餐累计流量配额,所述基于所述目标用户在每个所述预设时段的数据使用量和套餐累计订阅数据,确定每个所述预设时段的套餐使用评价参数,包括:
4.根据权利要求2所述的方法,其特征在于,所
...【技术特征摘要】
1.一种通信套餐的推荐方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述目标用户在每个所述预设时段的用户通信信息至少包括:所述目标用户在每个所述预设时段的数据使用量和套餐累计订阅数据,所述基于每个所述预设时段的用户通信信息确定每个所述预设时段的套餐动作的奖励值,包括:
3.根据权利要求2所述的方法,其特征在于,所述套餐累计订阅数据包括套餐累计流量配额,所述基于所述目标用户在每个所述预设时段的数据使用量和套餐累计订阅数据,确定每个所述预设时段的套餐使用评价参数,包括:
4.根据权利要求2所述的方法,其特征在于,所述套餐累计订阅数据包括套餐累计订阅数量,所述基于所述目标用户在每个所述预设时段的套餐累计订阅数据确定每个所述预设时段的套餐订阅变化,包括:
5.根据权利要求2所述的方法,其特征在于,每个所述预设时段的套餐动作的奖励值由每个所述预设时段的套餐使用评价参数和所述套餐订阅变化确定。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述基于多种通信状态、多种套餐动作以及每个所述预设时段的套餐动作的奖励值进行强化学习,获得每种所述套餐动作在不同通信状态下的价值度,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于多种通信状态、多种套餐动作以及每个所述预设时段的套...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。