一种基于内容的小说推荐方法技术

技术编号：20075087 阅读：40 留言：0更新日期：2019-01-15 00:38

本发明专利技术涉及一种基于内容的小说推荐方法，属于推荐方法技术领域。首先对小说文本进行初始化并提取对应的SinHash指纹，建立动态小说数据库；接着输入参考小说，通过小说的出版时间及小说文本之间基于SinHash指纹的相关度确定待推荐小说；最后对待推荐小说进行相关度排序，输出一定条目的推荐小说。本发明专利技术与现有技术相比，主要解决了现有技术在进行小说推荐时存在的推荐准确率低、类区分能力弱、效率差等现象，增加了目前依靠计算机对小说进行推荐的准确性和灵活性。

A Content-based Novel Recommendation Method

The invention relates to a novel recommendation method based on content, belonging to the technical field of recommendation method. Firstly, the novel text is initialized and the corresponding SinHash fingerprints are extracted, and the dynamic novel database is established. Then, the reference novel is input, and the recommended novel is determined by the publication time of the novel and the correlation between the novel texts based on the SinHash fingerprints. Finally, the recommended novel is ranked by the correlation degree, and the recommended novel with certain entries is output. Compared with the prior art, the invention mainly solves the problems of low recommendation accuracy, weak classification ability and poor efficiency in the prior art when recommending fiction, and increases the accuracy and flexibility of the present recommendation of fiction by computer.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于内容的小说推荐方法
本专利技术涉及一种基于内容的小说推荐方法，属于推荐方法

技术介绍
推荐算法充斥在互联网系统中的各个角落，通常是根据用户的需求，系统为其推荐相关的内容。在小说、书籍等文本推荐方法中，通常使用关键词推荐算法，即根据小说的关键词为其推荐其他关键词相同的小说。但基于关键词的推荐算法所推荐的内容有时并不符合人们的需求，人们更乐意找到与已看小说风格相同、类型较为接近的其他小说。
技术实现思路
本专利技术要解决的技术问题是针对现有技术的局限和不足，提供一种基于内容的小说推荐方法，以解决现有技术在进行小说推荐时存在的推荐准确率低、类区分能力弱、效率差等现象，致力于增加目前依靠计算机对小说进行推荐的准确性和灵活性。本专利技术的技术方案是：一种基于内容的小说推荐方法，具体步骤为：Step0：获取小说文本集合{X1,X2…Xp}，对小说文本X,X∈{X1,X2…Xp}进行预处理，并建立动态小说数据库，具体如Step0.1～Step0.5所示；Step0.1：从小说文本X中提取出小说名称x和该小说的出版时间tx；Step0.2：对小说文本X进行分词、去停...

【技术保护点】
1.一种基于内容的小说推荐方法，其特征在于：Step0：获取小说文本集合{X1,X2…Xp}，对小说文本X,X∈{X1,X2…Xp}进行预处理，并建立动态小说数据库，具体如Step0.1～Step0.5所示；Step0.1：从小说文本X中提取出小说名称x和该小说的出版时间tx；Step0.2：对小说文本X进行分词、去停用词、同义词替换操作，生成小说文本X的实意词集合

【技术特征摘要】
1.一种基于内容的小说推荐方法，其特征在于：Step0：获取小说文本集合{X1,X2…Xp}，对小说文本X,X∈{X1,X2…Xp}进行预处理，并建立动态小说数据库，具体如Step0.1～Step0.5所示；Step0.1：从小说文本X中提取出小说名称x和该小说的出版时间tx；Step0.2：对小说文本X进行分词、去停用词、同义词替换操作，生成小说文本X的实意词集合Step0.3：对实意词集合中的每个元素求其权重xi，并生成实意词集合所对应的权重集合X:{x1,x2…xm}；Step0.4：由小说文本X的实意词集合和所对应的权重集合X，根据SimHash算法生成小说文本X的长度为L的SimHash指纹Step0.5：将小说名称x、小说的出版时间tx、小说文本X、实意词集合权重集合X及SimHash指纹作为元组加入小说数据库；Step1：输入小说名称h；Step2：查找小说数据库，从数据库中提取出小说名称h所对应的小说的出版时间th、小说文本...

【专利技术属性】
技术研发人员：吴晟，韩林峄，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南,53

全部详细技术资料下载我是这个专利的主人