The embodiment of the invention provides a Book Classification and training methods, devices and equipment, which includes books classification method: extracting feature information to be classified books; and use the characteristic information corresponding to at least two kinds of classification rules, the classification of the books classification, the classification results obtained; in accordance with the weights corresponding to each kind of classification rules, were weighted on the classification results obtained; according to the results to determine the type of weighted unspecifide ebook. By the embodiment of the invention, from many different dimensions on the classification of e-books, compared with the traditional single use classification algorithm of e-book classification result is more accurate and the error classification will greatly reduce.
【技术实现步骤摘要】
电子书分类及其训练方法、装置和设备
本专利技术实施例涉及数据处理
,尤其涉及一种电子书分类方法、装置和设备,以及,一种电子书分类训练方法、装置和设备。
技术介绍
电子书是利用计算机技术将文字、图片、声音、影像等信息内容数字化的出版物。随着互联网技术应用的越来越广泛,传统的纸质阅读方式已逐渐被电子书取代,人们越来越趋向于利用互联网和计算机技术,通过用于阅读电子书的电子书阅读应用下载电子书进行阅读。在此情况下,诸如电子书推荐、搜索等多种服务成为电子书服务提供商推广电子书阅读应用,提升用户阅读体验的重要手段。但无论是推荐还是搜索,都需要基于电子书的明确分类。目前,常规做法是使用某一种特定算法先对电子书进行分类,然后基于该分类进行后续的诸如推荐或者搜索或者统计等等操作。这种常规方式虽然能够在一定程度上实现电子书的分类,但因每种算法都有自身的弱点和局限性,因此经常会出现分类不准确或者误分类的情况,使得基于电子书分类的后续操作不能得到有效实现。
技术实现思路
本专利技术实施例提供了一种电子书分类及电子书分类训练的方法、装置和设备,以解决目前电子书分类易出现分类不准确或者误分 ...
【技术保护点】
一种电子书分类方法,包括:获取待分类的电子书的特征信息;使用与所述特征信息对应的至少两种分类规则,对所述待分类的电子书进行分类,获得对应的分类结果;按照每种分类规则对应的权重,分别对获得的分类结果进行加权;根据加权结果确定所述待分类的电子书的类型。
【技术特征摘要】
1.一种电子书分类方法,包括:获取待分类的电子书的特征信息;使用与所述特征信息对应的至少两种分类规则,对所述待分类的电子书进行分类,获得对应的分类结果;按照每种分类规则对应的权重,分别对获得的分类结果进行加权;根据加权结果确定所述待分类的电子书的类型。2.根据权利要求1所述的方法,其中,所述使用与所述特征信息对应的至少两种分类规则,对所述待分类的电子书进行分类的步骤包括以下至少两种:根据所述待分类的电子书的内容特征信息与设定的多个第一电子书集合的内容特征信息的相似度,对所述待分类的电子书进行分类;和,根据所述待分类的电子书的属性特征信息与设定的多个第二电子书集合的属性特征信息的相似度,对所述待分类的电子书进行分类;和,根据接收到的用户对所述待分类的电子书的行为特征信息与设定的多个第三电子书集合的用户的行为特征信息的相似度,对所述待分类的电子书进行分类。3.根据权利要求2所述的方法,其中,当分类规则包括根据所述待分类的电子书的内容特征信息与设定的多个第一电子书集合的内容特征信息的相似度,对所述待分类的电子书进行分类时,所述获取待分类的电子书的特征信息的步骤包括:获取所述待分类的电子书的内容特征分词,将所述内容特征分词作为所述待分类的电子书的特征信息;其中,所述内容特征分词用于表征所述待分类的电子书的内容特征。4.根据权利要求2所述的方法,其中,当分类规则包括根据所述待分类的电子书的属性特征信息与设定的多个第二电子书集合的属性特征信息的相似度,对所述待分类的电子书进行分类时,所述获取待分类的电子书的特征信息的步骤包括:获取所述待分类的电子书的作者信息、书名信息、评论特征信息中的至少一种,将获取的所述信息作为所述待分类的电子书的特征信息;其中,所述评论特征信息用于表征从对所述待分类的电子书的评论中获取的评论特征分词的信息。5.根据权利要求2所述的方法,其中,所述用户的行为特征信息包括:用户对电子书的操作信息,以及以下信息中的至少一种用户的阅读偏好类型信息、用户的好友关系信息、用户的阅读习惯信息;所述根据接收到的用户对所述待分类的电子书的行为特征信息与设定的多个第三电子书集合的用户的行为特征信息的相似度,对所述待分类的电子书进行分类的步骤包括:根据接收到的用户对所述待分类的电子书的操作信息、及所述用户的阅读偏好类型信息,对所述待分类的电子书进行分类;和/或,根据接收到的用户对所述待分类的电子书的操作信息、及所述用户的好友关系信息所指示的用户好友的阅读偏好类型信息,对所述待分类...
【专利技术属性】
技术研发人员:周兴博,佘建民,李帅,贾惠娟,
申请(专利权)人:掌阅科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。