【技术实现步骤摘要】
数据处理方法及相关装置
[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、一种数据处理装置、一种计算机设备、一种计算机可读存储介质及一种计算机程序产品。
技术介绍
[0002]在诸如公众号推荐的各类推荐场景中,为了使得所推荐的内容可以有效地被用户采纳和接受,往往会利用负反馈预估模型进行用户负反馈的预估与识别,因此用于训练负反馈预估模型的负反馈数据特征成为推荐场景中的一个重要数据指标。
[0003]目前,主要是线上获取到样本之后,在离线环境下对获取到的样本进行特征处理,然后得到离线环境下对应的负反馈数据特征。由于存在样本获取时间与离线环境下确定负反馈数据特征的时间,二者差异较大的情况,因此导致最终提取到的负反馈数据特征不够准确。因此如何提高负反馈数据特征的准确性是当前亟待解决的一个技术问题。
技术实现思路
[0004]本申请实施例提出了一种数据处理方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,可以提高负反馈数据特征的准确性。
[0005]一方面,本申请实施例提供了一种 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取内容推荐系统的日志数据,所述日志数据包括下发日志、访问日志和负反馈日志;所述下发日志用于记录将内容集向对象集进行推送的信息;所述访问日志用于记录所述内容集在推送后被执行访问操作的信息;所述负反馈日志用于记录所述内容集在推送后被执行负反馈操作的信息;所述下发日志对应的下发数据特征存储于数据库中;根据所述访问日志从所述数据库中查询第一样本数据特征,并根据所述负反馈日志从所述数据库中查询第二样本数据特征;采用所述第一样本数据特征和所述第二样本数据特征训练特征纠偏模型,其中,训练好的特征纠偏模型用于对所述负反馈日志对应的负反馈数据特征进行修正处理。2.如权利要求1所述的方法,其特征在于,所述内容集中包含内容i,内容i为所述内容集中的任一个已推送的内容;所述对象集中包含接收到所述内容i的N个对象;i、N均为正整数;所述下发日志包含内容i对应的下发日志项,所述内容i对应的下发日志项记录了所述内容i的画像特征、以及所述N个对象的画像特征;所述方法还包括:对所述内容i对应的下发日志项进行特征提取处理,得到内容i对应的N条下发数据特征;每条下发数据特征由内容i的画像特征与N个对象中的一个对象的画像特征共同组成;将所述内容i对应的N条下发数据特征存储至数据库中。3.如权利要求2所述的方法,其特征在于,所述访问日志记录有所述内容i在推送后被对象j执行访问操作的信息,所述对象j是所述N个对象中的任一个;所述根据所述访问日志从所述数据库中查询第一样本数据特征,包括:从所述访问日志中抽取内容i对应的访问数据特征,所述访问数据特征包括内容i的画像特征和对象j的画像特征;根据所述内容i对应的访问数据特征在所述数据库中进行查询,得到与所述内容i对应的访问数据特征相匹配的所述内容i对应的第一下发数据特征;将所述第一下发数据特征确定为第一样本数据特征。4.如权利要求3所述的方法,其特征在于,所述根据所述内容i对应的访问数据特征在所述数据库中进行查询之前,还包括:检测所述内容i的点击通过率;当所述内容i的点击通过率大于或者等于点击通过率阈值时,执行所述根据所述内容i对应的访问数据特征在所述数据库中进行查询的步骤。5.如权利要求2所述的方法,其特征在于,所述负反馈日志记录有所述内容i在推送后被对象k执行负反馈操作的信息,所述对象k是所述N个对象中的任一个;所述根据所述负反馈日志从所述数据库中查询第二样本数据特征,包括:从所述负反馈日志中抽取内容i对应的负反馈数据特征,所述负反馈数据特征包括内容i的画像特征和对象k的画像特征;根据所述内容i对应的负反馈数据特征在所述数据库中进行查询,得到与所述内容i对应的负反馈数据特征相匹配的所述内容i对应的第二下发数据特征;将所述第二下发数据特征确定为第二样本数据特征。6.如权利要求1所述的方法,其特征在于,所述采用所述第一样本数据特征和所述第二
样本数据特征训练特征纠偏模型,...
【专利技术属性】
技术研发人员:彭颖鸿,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。