一种数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37067551 阅读:8 留言:0更新日期:2023-03-29 19:45
本申请实施例公开了一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取用户的线上行为数据,线上行为数据包括用户与多个第一对象在线上交互产生的数据;基于贝叶斯个性化排序算法对线上行为数据进行计算,确定第一对象对应的预测信息,预测信息用于描述用户对第一对象产生正反馈的概率;根据预测信息,从线上行为数据中筛选出第二对象对应的线上行为数据;将第二对象对应的线上行为数据,输入至预先训练的预测模型中,确定用户对第二对象产生正反馈的目标概率。根据本申请的实施例,能够提升预测效率。能够提升预测效率。能够提升预测效率。

【技术实现步骤摘要】
一种数据处理方法、装置、电子设备及存储介质


[0001]本申请属于互联网
,尤其涉及一种数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着信息技术的发展,消费者行为分析的研究日益兴起。在许多应用中,以评分形式出现的显式反馈通常不易收集,因此数量往在较为有限。此时,利用等隐式反馈行为数据进行用户偏好学习和个性化推荐,就变得非常重要。但是隐式反馈通常不能代表用户的绝对偏好。
[0003]因此,目前的推荐算法无法准确高效地确定用户对该物品的喜欢或满意程度。

技术实现思路

[0004]本申请实施例提供一种数据处理方法、装置、设备及存储介质,能够解决目前推荐算法的预测准确性低的问题。
[0005]第一方面,本申请实施例提供一种数据处理方法,该方法包括:
[0006]获取用户的线上行为数据,线上行为数据包括用户与多个第一对象在线上交互产生的数据;
[0007]基于贝叶斯个性化排序算法对线上行为数据进行计算,确定第一对象对应的预测信息,预测信息用于描述用户对第一对象产生正反馈的概率;
[0008]根据预测信息,从线上行为数据中筛选出第二对象对应的线上行为数据;
[0009]将第二对象对应的线上行为数据,输入至预先训练的预测模型中,确定用户对第二对象产生正反馈的目标概率。
[0010]第二方面,本申请实施例提供一种数据处理装置,数据处理装置包括:
[0011]第一转换模块,用于获取用户的线上行为数据,线上行为数据包括用户与多个第一对象在线上交互产生的数据;
[0012]基于贝叶斯个性化排序算法对线上行为数据进行计算,确定第一对象对应的预测信息,预测信息用于描述用户对第一对象产生正反馈的概率;
[0013]根据预测信息,从线上行为数据中筛选出第二对象对应的线上行为数据;
[0014]将第二对象对应的线上行为数据,输入至预先训练的预测模型中,确定用户对第二对象产生正反馈的目标概率。
[0015]第三方面,本申请实施例提供了一种电子设备,该设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时,实现如第一方面或者第一方面的任一可能实现方式中的方法。
[0016]第四方面,本申请实施例提供了一种可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面或者第一方面的任一可能实现方式中的方法。
[0017]本申请实施例中,通过获取用户的线上行为数据,线上行为数据包括用户与多个第一对象在线上交互产生的数据,基于贝叶斯个性化排序算法对线上行为数据进行计算,确定第一对象对应的预测信息,预测信息用于描述用户对第一对象产生正反馈的概率,这里,能够初步预测用户对第一对象的正反馈程度,根据预测信息,从线上行为数据中筛选出第二对象对应的线上行为数据,能够实现数据清洗,减少后续需要进行预测处理的数据量,降低预测成本,提升预测效率。最后,将第二对象对应的线上行为数据,输入至预先训练的预测模型中,确定用户对第二对象产生正反馈的目标概率,能够快速准确地预测用户对第二对象产生正反馈的目标概率。
附图说明
[0018]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本申请实施例提供的一种数据处理方法的流程图;
[0020]图2是本申请实施例提供的一种数据处理装置的结构示意图;
[0021]图3是本申请实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
[0022]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0023]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0024]下面对本申请涉及到的技术术语进行简要介绍。
[0025]隐式反馈通常称为单类反馈,因此,基于隐式反馈的推荐问题又称为单类协同过滤(One Class Collaborative Filtering,OCCF)问题。
[0026]基于贝叶斯后验优化的个性化排序算法(Bayesian Personalized Ranking,BPR),是一种排序算法,并且使用隐式反馈,如点击行为信息,收藏行为信息等,通过对问题进行贝叶斯分析得到的最大后验概率来对对象进行排序,进而产生推荐。
[0027]贝叶斯统计,不同于一般的统计方法,其不仅利用模型信息和数据信息,而且充分利用先验信息。通过实证分析的方法,将贝叶斯预测模型与普通回归预测模型的预测结果
进行比较,结果表明贝叶斯预测模型具有明显的优越性。BPR算法将用户对物品的评分(显示反馈“1”,隐式反馈“0”)处理为一个pair对的集合<i,j>,其中i为评分为1的物品,j为评分为0的物品。假设某用户有M个“1”的评分,N个“0”的评分,则该用户共有M*N个pair对。这样数据集就由三元组<u,i,j>表示,该三元组的物理含义为:相对于物品“j”,用户“u”更喜欢物品“i”。
[0028]本申请实施例提供的数据处理方法至少可以应用于下述应用场景中,下面进行说明。
[0029]近年来,随着大数据的兴起,消费者行为分析的研究方兴未艾,数据库与数据挖掘、信息系统与信息管理、图像处理与计算机视觉、社会网络分析、电子商务等很多领域的学者加人消费者行为研究的队伍。
[0030]同时,这一研究领域也受到了电子商务、社交网络等数字经济形态下的企业的高度关注。在这些新兴的领域,消费者行为研究被称为消费者画像,同时在社会计算等研究领域中占有重要的地位。
[0031]传统的矩阵分解使用显示反馈通过对用户对物品的评分矩阵进行分解从而预测到用户对于未评分物品的得分,根据这个得分进行推荐。在实际中显示反馈有着较高的准确率,但它往往难以收集,有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于第一设备,所述方法包括:获取用户的线上行为数据,所述线上行为数据包括所述用户与多个第一对象在线上交互产生的数据;基于贝叶斯个性化排序算法对所述线上行为数据进行计算,确定所述第一对象对应的预测信息,所述预测信息用于描述所述用户对第一对象产生正反馈的概率;根据所述预测信息,从所述线上行为数据中筛选出第二对象对应的线上行为数据;将所述第二对象对应的线上行为数据,输入至预先训练的预测模型中,确定所述用户对所述第二对象产生正反馈的目标概率。2.根据权利要求1所述的方法,其特征在于,所述基于贝叶斯个性化排序算法对所述线上行为数据进行计算,确定所述第一对象对应的预测信息,包括:基于所述贝叶斯个性化排序算法对所述线上行为数据进行计算,确定所述第一对象的类别与预设对象的类别一致的第一概率;基于所述贝叶斯个性化排序算法对所述线上行为数据进行计算,确定所述第一对象的类别与预设对象的类别不一致的第二概率;根据所述第一概率和所述第二概率,确定所述预测信息。3.根据权利要求2所述的方法,其特征在于,所述根据所述预测信息,从所述线上行为数据中筛选出第二对象对应的线上行为数据,包括:在所述第一概率大于所述第二概率的情况下,确定所述线上行为数据为所述第二对象对应的线上行为数据。4.根据权利要求1所述的方法,其特征在于,所述预先训练的预测模型设置于预设服务器,在所述将所述第二对象对应的线上行为数据,输入至预先训练的预测模型中,确定所述用户对所述第二对象产生正反馈的目标概率之前,所述方法还包括:获取工作线程的饱和度、计算任务饱和度、所述计算任务的缓冲队列增长速率;所述工作线程为多个所述第一设备到所述预设服务器之间的线程,所述计算任务中包括至少一个所述第二对象对应的线上行为数据;基于预设权重系数,对所述工作线程的饱和度、所述计算任务饱和度和所述缓冲队列增长速率进行加权计算,得到线程池负荷度;在所述线程池负荷度大于预设负荷度的情况下,调整所述工作线程的工作状态信息。5.根据权利要求4所述的方法,其特征在于,所述预设服务器包括多个计算节点,在所述将所述第二对象对应的线上...

【专利技术属性】
技术研发人员:槐正徐冬冬付迎鑫姬照中姜承祥徐锐王健徐蕾
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1