一种电子书信息处理方法及装置制造方法及图纸

技术编号:14399350 阅读:96 留言:0更新日期:2017-01-11 12:38
本发明专利技术公开了一种电子书信息处理方法及装置,该方法包括:获取当前显示的第一电子书的第一特征信息集、电子书数据库中第二电子书的第二特征信息集;获得第一特征信息集与第二特征信息集中至少一对相同类型的信息子集之间的至少一个第一相似度;基于至少一个第一相似度,获得第一电子书与第二电子书的第二相似度。通过上述技术方案,获得特征信息中相同类型的信息子集之间的相似度,根据该特征信息之间的相似度计算电子书之间的相似度,解决了现有技术中电子书相似度计算不准确的技术问题,提高了电子书相似度计算的准确性。

【技术实现步骤摘要】

本专利技术涉及多媒体信息处理
,特别涉及一种电子书信息处理的方法及装置。
技术介绍
随着互联网技术的不断发展,电子书得到了快速发展,用户可以随时随地阅读电子书,为用户的阅读生活提供了极大的方便。与此同时,电子设备还可以根据用户阅读的电子书,为用户推荐类似或相关的书籍,节约了用户查找书籍的时间。现有技术中,电子书推荐方法主要是基于内容的推荐。基于内容的推荐在计算电子书相似度上,直接依据电子书的内容进行特征化,然后根据相同的特征进行权重计算。例如,电子书特征化后包括:标签、作者、分类等特征,现有技术中,对比两个电子书的各个特征是否相同,然后,将各个相同的特征乘以权重并相加得到两本电子书的相似度。然而,现有技术存中,由于特征化存在差异,存在不相同的特征对应的电子书可能很相似。例如,小说《盗墓笔记》被特征化为:“奇幻”、“灵异”、“惊悚”(标签);“南派三叔”(作者);“推理小说”、“侦探小说”(分类)。小说《鬼吹灯》被特征化为:“探险”、“悬疑”(标签);“天下霸唱”(作者);“奇幻小说”、“恐怖小说”(分类)。采用现有技术的推荐方法,《鬼吹灯》与《盗墓笔记》之间几乎没有相同的特征,相似度非常的小,但是实际上《鬼吹灯》与《盗墓笔记》之间存在很强的相似性,但由于特征化存在差异,无法匹配起来导致二者之间的相似度计算不准确。可见,现有技术中,电子书之间的相似度计算存在准确性差的技术问题。
技术实现思路
本专利技术实施例提供一种电子书信息处理方法及装置,用于解决现有技术中电子书之间的相似度计算准确性差的技术问题,提高相似度计算的准确性。本申请实施提供一种电子书信息处理方法,所述方法包括:获取当前显示的第一电子书的第一特征信息集、电子书数据库中第二电子书的第二特征信息集;获得所述第一特征信息集与所述第二特征信息集中至少一对相同类型的信息子集之间的至少一个第一相似度;基于所述至少一个第一相似度,计算所述第一电子书与所述第二电子书的第二相似度。可选的,所述第一特征信息集和所述第二特征信息集分别包含以下至少一类信息子集:电子书的标签信息子集、分类信息子集及作者信息子集。可选的,所述获得所述第一特征信息集和第二特征信息集中至少一对相同类型的信息子集之间的至少一个第一相似度,包括:通过下述公式获得至少一个第一相似度:Sim(b,b)(B1,B2)=ΣI1∈Si(B1)ΣI2∈Si(B2)Sim(i,i)(I1,I2)|Si(B1)|×|Si(B2)|]]>其中,Sim(b,b)(B1,B2)表示第一相似度,i∈{标签信息,分类信息,作者信息本文档来自技高网...
一种电子书信息处理方法及装置

【技术保护点】
一种电子书信息处理方法,其特征在于,所述方法包括:获取当前显示的第一电子书的第一特征信息集、电子书数据库中第二电子书的第二特征信息集;获得所述第一特征信息集与所述第二特征信息集中至少一对相同类型的信息子集之间的至少一个第一相似度;基于所述至少一个第一相似度,计算所述第一电子书与所述第二电子书的第二相似度。

【技术特征摘要】
1.一种电子书信息处理方法,其特征在于,所述方法包括:获取当前显示的第一电子书的第一特征信息集、电子书数据库中第二电子书的第二特征信息集;获得所述第一特征信息集与所述第二特征信息集中至少一对相同类型的信息子集之间的至少一个第一相似度;基于所述至少一个第一相似度,计算所述第一电子书与所述第二电子书的第二相似度。2.如权利要求1所述的方法,其特征在于,所述第一特征信息集和所述第二特征信息集分别包含以下至少一类信息子集:电子书的标签信息子集、分类信息子集及作者信息子集。3...

【专利技术属性】
技术研发人员:袁平广邵正阳
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1