一种电子读物数据处理方法、装置及存储介质制造方法及图纸

技术编号:24251660 阅读:16 留言:0更新日期:2020-05-22 23:38
本申请实施例公开一种电子读物数据处理方法、装置及存储介质,其中,方法包括:响应针对电子读物收藏栏所触发的第一操作,在所述电子读物收藏栏对应的多个维度信息中,将所述第一操作所对应的维度信息确定为目标维度信息;所述电子读物收藏栏中包含电子收藏读物;向服务器发送所述目标维度信息;获取所述服务器返回的与所述目标维度信息相关联的数据推送列表;所述数据推送列表中包含与所述电子收藏读物具有关联关系的电子推荐读物。采用本申请,可以提高数据推荐的效率和准确性。

A data processing method, device and storage medium for electronic reading materials

【技术实现步骤摘要】
一种电子读物数据处理方法、装置及存储介质
本申请涉及互联网
,尤其涉及一种电子读物数据处理方法、装置及存储介质。
技术介绍
现有的电子读物推荐系统在向目标用户推荐电子读物(例如,书籍等互联网信息)时,可以根据书城(即电子读物数据库)中所统计到的电子读物的点击率进行数据推荐,从而导致每个用户所接收到的电子推荐读物都是相同的,难以贴合每个用户的兴趣爱好,以至于数据推荐的准确度偏低。此外,当用户需要查阅某本书籍(例如,书A)相关联的其他书籍时,需要在书城中手动录入相应的索引信息(例如,手动录入书A的关键字等)来进行相关搜索,以搜索到所有包含该书A的关键字的书籍,由于无法保证用户所联想到的关键字属于书A的关键字,所以通过用户所想的关键字进行书籍搜索很可能会导致数据推荐的准确度偏低;此外,为了能够准确找到书A相关联的其他书籍,则需要手动录入多个索引信息,从而导致在整个数据推荐的过程中需要消耗较长的人工交互时长,以至于数据推荐的效率会比较低。
技术实现思路
本申请实施例提供一种电子读物数据处理方法、装置及存储介质,可以提高数据推荐的效率和准确性。本申请实施例一方面提供了一种电子读物数据处理方法,所述方法包括:响应针对电子读物收藏栏所触发的第一操作,在所述电子读物收藏栏对应的多个维度信息中,将所述第一操作所对应的维度信息确定为目标维度信息;所述电子读物收藏栏中包含电子收藏读物;向服务器发送所述目标维度信息;获取所述服务器返回的与所述目标维度信息相关联的数据推送列表;所述数据推送列表中包含与所述电子收藏读物具有关联关系的电子推荐读物。本申请实施例一方面提供了一种电子读物数据处理方法,所述方法包括:获取用户终端发送的目标维度信息;所述目标维度信息是由用户终端响应针对电子读物收藏栏对应的多个维度信息的第一操作所得到的;所述电子读物收藏栏中包含电子收藏读物;基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物;根据所述电子推荐读物生成与所述目标维度信息相关联的数据推送列表,并将所述数据推送列表返回给所述用户终端。其中,所述目标维度信息包含第一维度信息;所述基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物,包括:基于所述第一维度信息从第一推荐数据库中拉取与所述电子收藏读物相匹配的N个数据信息;N为正整数;从N个数据信息中过滤已推荐的S个数据信息,并将过滤后所剩余的K个数据信息作为与所述电子收藏读物具有关联关系的电子推荐读物;K=(N-S)且S为大于或者等于零的整数。其中,所述方法还包括:根据电子读物数据库中的每个电子读物所携带的关键词、所述每个电子读物相关联的用户信息,得到所述每个电子读物的物品向量;将所述电子读物数据库中的所述电子收藏读物确定为第一物品,得到所述第一物品的物品向量;将所述电子读物数据库中除所述电子收藏读物之外的电子读物确定为第二物品,得到所述第二物品的物品向量;确定所述第一物品的物品向量与所述第二物品的物品向量之间的余弦相似度,并将余弦相似度满足推荐条件的第二物品作为所述电子收藏读物相匹配的数据信息,将所述电子收藏读物相匹配的数据信息添加至所述第一推荐数据库。其中,所述根据电子读物数据库中的每个电子读物所携带的关键词、所述每个电子读物相关联的用户信息,得到所述每个电子读物的物品向量,包括:获取电子读物数据库中的所有电子读物,以及所有电子读物相关联的用户行为信息;对所述用户行为信息进行解析,得到每个电子读物相关联的用户信息,并根据所述每个电子读物相关联的用户信息得到所述每个电子读物的用户序列;提取所述每个电子读物携带的关键词,并根据所述每个电子读物的关键词得到所述每个电子读物的关键词序列;基于所述每个电子读物的用户序列和所述每个电子读物的关键词序列,构成所述每个电子读物的物品向量。其中,所述基于所述第一维度信息从第一推荐数据库中拉取与所述电子收藏读物相匹配的N个数据信息,包括:基于所述第一维度信息获取所述第一物品相关联的第一点击模型;将所述第一推荐数据库中的数据信息确定为M个候选数据信息;M为所述推荐数据库中的数据信息的总量;基于所述第一点击模型确定所述M个候选数据信息的预测概率值;对所述M个候选数据信息的预测概率值进行排序,并基于排序后的M个候选数据信息的预测概率值,从排序后的M个候选数据信息选取与所述电子收藏读物相匹配的N个数据信息;N小于或等于M。其中,所述目标维度信息包含第二维度信息;所述基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物,包括:基于所述第二维度信息获取所述电子收藏读物所属的分类类别,从电子读物数据库中拉取与所述电子收藏读物所属的分类类别相关联的X个数据信息;X为正整数;从X个数据信息中过滤已推荐的Z个数据信息,得到过滤后所剩余的Y个数据信息;Y=(X-Z)且Z为大于或者等于零的整数;获取所述Y个数据信息的点击置信度,根据所述Y个数据信息的点击置信度从所述Y个数据信息中确定与所述电子收藏读物具有关联关系的电子推荐读物。其中,所述获取所述Y个数据信息的点击置信度,根据所述Y个数据信息的点击置信度从所述Y个数据信息中确定与所述电子收藏读物具有关联关系的电子推荐读物,包括:从第二推荐数据库中获取第二点击模型,并基于所述第二点击模型以及用户兴趣特征确定所述Y个数据信息的点击置信度,并根据所述Y个数据信息的点击置信度对所述Y个数据信息进行排序;从排序后的Y个数据信息中选取K个数据信息作为与所述电子收藏读物具有关联关系的电子推荐读物;且K为小于或者等于Y的整数。其中,所述方法还包括:根据电子读物数据库中的每个电子读物相关联的用户行为信息,得到用于对初始点击模型进行训练的正样本和负样本;所述正样本包含用户与电子读物之间存在点击关系时所构成的点击向量对;所述负样本包含用户对电子读物之间存在曝光关系时所构成的曝光向量对;基于所述正样本和所述负样本对所述初始点击模型进行训练,将训练后的初始点击模型确定为第二点击模型,将所述第二点击模型添加至所述第二推荐数据库。其中,所述目标维度信息包含第三维度信息;所述基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物,包括:基于所述第三维度信息从第三推荐数据库中拉取与所述电子收藏读物相关联的目标书单信息;将拉取到的所述目标书单信息作为与所述电子收藏读物具有关联关系的电子推荐读物。其中,所述基于所述第三维度信息从第三推荐数据库中拉取与所述电子收藏读物相关联的目标书单信息,包括:基于所述第三维度信息优先在推荐数据库中对包含所述电子收藏读物的第一书单信息进行搜索;若搜索到包含所述电子收藏读物的第一书单信息,则将所述第一书单信息作为与所述电子收藏读物相关联的目标书单信本文档来自技高网...

【技术保护点】
1.一种电子读物数据处理方法,所述方法应用于用户终端,其特征在于,包括:/n响应针对电子读物收藏栏所触发的第一操作,在所述电子读物收藏栏对应的多个维度信息中,将所述第一操作所对应的维度信息确定为目标维度信息;所述电子读物收藏栏中包含电子收藏读物;/n向服务器发送所述目标维度信息;/n获取所述服务器返回的与所述目标维度信息相关联的数据推送列表;所述数据推送列表中包含与所述电子收藏读物具有关联关系的电子推荐读物。/n

【技术特征摘要】
1.一种电子读物数据处理方法,所述方法应用于用户终端,其特征在于,包括:
响应针对电子读物收藏栏所触发的第一操作,在所述电子读物收藏栏对应的多个维度信息中,将所述第一操作所对应的维度信息确定为目标维度信息;所述电子读物收藏栏中包含电子收藏读物;
向服务器发送所述目标维度信息;
获取所述服务器返回的与所述目标维度信息相关联的数据推送列表;所述数据推送列表中包含与所述电子收藏读物具有关联关系的电子推荐读物。


2.一种电子读物数据处理方法,所述方法应用于服务器,其特征在于,包括:
获取用户终端发送的目标维度信息;所述目标维度信息是由用户终端响应针对电子读物收藏栏对应的多个维度信息的第一操作所得到的;所述电子读物收藏栏中包含电子收藏读物;
基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物;
根据所述电子推荐读物生成与所述目标维度信息相关联的数据推送列表,并将所述数据推送列表返回给所述用户终端。


3.根据权利要求2所述的方法,其特征在于,所述目标维度信息包含第一维度信息;
所述基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物,包括:
基于所述第一维度信息从第一推荐数据库中拉取与所述电子收藏读物相匹配的N个数据信息;N为正整数;
从N个数据信息中过滤已推荐的S个数据信息,并将过滤后所剩余的K个数据信息作为与所述电子收藏读物具有关联关系的电子推荐读物;K=(N-S)且S为大于或者等于零的整数。


4.根据权利要求3所述的方法,其特征在于,还包括:
根据电子读物数据库中的每个电子读物所携带的关键词、所述每个电子读物相关联的用户信息,得到所述每个电子读物的物品向量;
将所述电子读物数据库中的所述电子收藏读物确定为第一物品,得到所述第一物品的物品向量;
将所述电子读物数据库中除所述电子收藏读物之外的电子读物确定为第二物品,得到所述第二物品的物品向量;
确定所述第一物品的物品向量与所述第二物品的物品向量之间的余弦相似度,并将余弦相似度满足推荐条件的第二物品作为所述电子收藏读物相匹配的数据信息,将所述电子收藏读物相匹配的数据信息添加至所述第一推荐数据库。


5.根据权利要求4所述的方法,其特征在于,所述根据电子读物数据库中的每个电子读物所携带的关键词、所述每个电子读物相关联的用户信息,得到所述每个电子读物的物品向量,包括:
获取电子读物数据库中的所有电子读物,以及所有电子读物相关联的用户行为信息;
对所述用户行为信息进行解析,得到每个电子读物相关联的用户信息,并根据所述每个电子读物相关联的用户信息得到所述每个电子读物的用户序列;
提取所述每个电子读物携带的关键词,并根据所述每个电子读物的关键词得到所述每个电子读物的关键词序列;
基于所述每个电子读物的用户序列和所述每个电子读物的关键词序列,构成所述每个电子读物的物品向量。


6.根据权利要求4所述的方法,其特征在于,所述基于所述第一维度信息从第一推荐数据库中拉取与所述电子收藏读物相匹配的N个数据信息,包括:
基于所述第一维度信息获取所述第一物品相关联的第一点击模型;
将所述第一推荐数据库中的数据信息确定为M个候选数据信息;M为所述推荐数据库中的数据信息的总量;
基于所述第一点击模型确定所述M个候选数据信息的预测概率值;
对所述M个候选数据信息的预测概率值进行排序,并基于排序后的M个候选数据信息的预测概率值,从排序后的M个候选数据信息选取与所述电子收藏读物相匹配的N个数据信息;N小于或等于M。


7.根据权利要求2所述的方法,其特征在于,所述目标维度信息包含第二维度信息;
所述基于所述目标维度信息获取与所述电子收藏读物具有关联关系的电子推荐读物,包括:
基于所述第二维度信息获取所述电子收藏读物所属的分类类别,从电子读物数据库中拉取与所述电子收藏读物所属的分类类别相关联的X个数据信息;X为正整数;
从X个数据信息中过滤已推荐的Z个数据信息,得到过滤后所剩余的Y个数据信息;Y=(X-Z)且Z为大于或者等于零的整数;
获取所述Y个数据信息的点击置信度,根据所述Y个数据信息的点击置信度从所述Y个数据信息中确定与所述电子收藏读物具有关联关系的电子推荐读物。


8.根据权利要求7所述的方法,其特征在于,所述获取所述Y个数据信息的点击置信度,根据所述Y个数据信息的点击置信度从所述Y个数据信息中确...

【专利技术属性】
技术研发人员:苏丹
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1