【技术实现步骤摘要】
一种网络文学新书推荐的方法
本专利技术涉及一种个性化推荐领域,特别涉及一种网络文学新书推荐的方法。
技术介绍
随着网络文学的兴起,大量的新的网络文学书籍不断涌现,作为一个阅读平台,给用户在海量书籍中给推荐符合用户阅读习惯的书籍显得非常重要。目前的推荐系统中多使用的是海量用户之间阅读的同一性即阅读过同一类书的用户会有类似的阅读习惯,但是对新的书籍来说,只有极少数的用户阅读过该书,缺乏足够的用户阅读和书籍内容相关信息,除了知名作者以外,多数的书籍会被湮没在大量的数据中。由于展现不足,会使得对用户推荐新书较为缓慢和低效与传统出版书籍不同,网络文学的新书起始篇幅很短,作者一遍连载用户一边阅读,书籍的阅读量会逐步增加。基于此网络文学新书推荐中考虑新书的吸引和淘汰,使得在公平的推荐条件下优秀的书籍能尽快突出,较差的书籍能逐步的淘汰。
技术实现思路
针对现有技术的不足,本专利技术所要解决的技术问题是:提供了一种网络文学新书推荐的方法,实现网络文学新书的高效个性化推荐,能够对新书早期展现和推荐能适应用户阅读,从而 ...
【技术保护点】
1.一种网络文学新书推荐的方法,包括:/n获取站点内网络书籍的基础信息,根据基础信息处理得到所述网络书籍的主题特征分布向量;/n根据所述主题特征分布向量计算每一本网络书籍的新书相关度,根据所述新书相关度寻找与每一本网络书籍相关联的新书,以形成与每一本网络书籍对应的新书候选集合I;/n对所述新书候选集合I重新排序以形成排序后的新书候选集合II,其中,通过后台日志获取新书的展现数量以及阅读数量打分,并通过后台推荐历史数据和用户行为信息相关性强的书和相关性弱的网络书籍书作为正/负样本;根据打分数据和正/负样本对所述新书候选集I中的所有新书进行重排序;/n生成用户的新书推荐候选列表 ...
【技术特征摘要】
1.一种网络文学新书推荐的方法,包括:
获取站点内网络书籍的基础信息,根据基础信息处理得到所述网络书籍的主题特征分布向量;
根据所述主题特征分布向量计算每一本网络书籍的新书相关度,根据所述新书相关度寻找与每一本网络书籍相关联的新书,以形成与每一本网络书籍对应的新书候选集合I;
对所述新书候选集合I重新排序以形成排序后的新书候选集合II,其中,通过后台日志获取新书的展现数量以及阅读数量打分,并通过后台推荐历史数据和用户行为信息相关性强的书和相关性弱的网络书籍书作为正/负样本;根据打分数据和正/负样本对所述新书候选集I中的所有新书进行重排序;
生成用户的新书推荐候选列表,其中,通过用户的历史行为信息获取所述用户阅读的书籍,根据该阅读的书籍对应的新书候选集合II,形成用户的新书推荐候选集。
2.如权利要求1所述的网络文学新书推荐的方法,其特征在于:在获取站点内网络书籍的基础信息,根据基础信息处理得到所述网络书籍的主题特征分布向量的步骤中,包括以下子步骤:
处理所述网络书籍的基础信息,其中,所述基础信息包括书名,作者名,标签,创建时间,更新时间,更新频率,书籍前N章内容,N为大于或等于1的整数;将所述网络书籍的基础信息分为内容相关特征词和书籍属性特征向量,所述内容相关特征词从所述书籍书名及前N章内容中获取,所述书籍属性包括书名,作者名,标签,创建时间,更新时间,更新频率;
提取所述网络书籍的内容相关特征词,对所述内容相关特征词进行清洗和处理,构成所述网络书籍的内容相关特征词向量;
根据所述内容相关特征词向量构建所述网络书籍的主题模型,获取每一本网络书籍的主题分布特征向量,所有网络书籍的主题分布特征向量构成主题矩阵。
3.如权利要求2所述的网络文学新书推荐的方法,其特征在于,在处理所述网络书籍的基础信息的步骤中:对所述网络书籍的书名和前N章内容分词,构成所述网络书籍的内容相关特征词列表,所述每一本网络书籍的ID、书籍属性特征向量以及所述内容相关特征词列表组成一数据元组,所述数据元组格式为(bookID,baseInfo,contentsInfo),其中,bookID表示书籍唯一标识,baseInfo表示书籍属性特征向量,contentsInfo表示内容相关特征词列表,所有网络书籍的数据元组构成数据集合。
4.如权利3所述的网络文学新书推荐的方法...
【专利技术属性】
技术研发人员:张世侠,汪溪,孙宽,
申请(专利权)人:北京宜搜天下科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。