【技术实现步骤摘要】
信息推荐方法、装置和计算机设备
本专利技术涉及互联网
,尤其涉及一种信息推荐方法、装置和计算机设备。
技术介绍
随着移动互联网的普及,互联网用户有越来越多的碎片时间用来获取信息与知识,对信息的需求也越来越高。而随着信息需求的增加,在传统的互联网媒体之外,还涌现了大量的用户原创内容和专业生产内容,使得存在同一事件被多篇不同文章报道、论述,出现同一事件的内容多次推荐给用户,造成重复推荐的现象。为了提高用户阅读效率、提升用户阅读体验,需要识别哪些文章是重复内容。相关技术中,是通过计算文章的文本相似度来识别文章是否重复,但由于语言的多样性,这种方法会造成文本识别不准确,无法准确识别文章是否重复的问题。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种信息推荐方法,以实现通过从已推荐信息中,识别出与待推荐信息的文本部分相似的目标信息,进而识别待推荐信息的图片部分和各目标信息中的图像部分的图片相似度,通过将文本相似度和图片相似度结合来识别待推荐信息是否为重复推荐,双重机制的判别,提高了识别准确率。本专利技术的 ...
【技术保护点】
1.一种信息推荐方法,其特征在于,包括以下步骤:获取待推荐信息;根据所述待推荐信息的文本部分,从向同一用户推荐的已推荐信息中,识别得到目标信息,其中,所述目标信息的文本部分与所述待推荐信息的文本部分相似;识别所述待推荐信息的图片部分与各目标信息中的图片部分之间的图片相似度;根据所述图片相似度,识别所述待推荐信息是否为重复推荐;若不为重复推荐,向所述用户推荐所述待推荐信息。
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括以下步骤:获取待推荐信息;根据所述待推荐信息的文本部分,从向同一用户推荐的已推荐信息中,识别得到目标信息,其中,所述目标信息的文本部分与所述待推荐信息的文本部分相似;识别所述待推荐信息的图片部分与各目标信息中的图片部分之间的图片相似度;根据所述图片相似度,识别所述待推荐信息是否为重复推荐;若不为重复推荐,向所述用户推荐所述待推荐信息。2.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述待推荐信息的文本部分,从向同一用户推荐的已推荐信息中,识别得到目标信息,包括:根据所述待推荐信息的文本部分,生成第一向量;针对每一个已推荐信息,根据所述已推荐信息的文本部分,生成第二向量;若所述第一向量和所述第二向量之间的文本相似度大于或等于第二阈值,且小于或等于所述第一阈值,确定所述已推荐信息为所述目标信息。3.根据权利要求2所述的信息推荐方法,其特征在于,所述方法还包括:若所述第一向量和所述第二向量之间的文本相似度大于第一阈值,确定所述待推荐信息的文本部分与所述已推荐信息的文本部分内容重复,丢弃所述待推荐文本;若所述第一向量和所述第二向量之间的文本相似度小于所述第二阈值,确定所述待推荐信息的文本部分与所述已推荐信息的文本部分内容不重复,向所述用户推荐所述待推荐文本。4.根据权利要求2所述的信息推荐方法,其特征在于,所述根据所述待推荐信息的文本部分,生成第一向量,包括:对所述待推荐信息的文本部分进行切词,并根据所述待推荐文本对切词后的词条进行词频统计;依据各词条的词频对各词条进行排序;根据排序后的各词条,生成所述第一向量。5.根据权利要求2所述的信息推荐方法,其特征在于,所述根据所述已推荐信息的文本部分,生成第二向量,包括:对所述已推荐信息的文本部分进行切词,并根据所述已推荐信息对切词后的词条进行词频统计;依据各词条的词频对各词条进行排序;根据排序后的各词条,生成所述第二向量。6.根据权利要求2所述的信息推荐方法,其特征在于,所述生成第一向量和生成第二向量之后,还包括:计算所述第...
【专利技术属性】
技术研发人员:孟二利,肖思远,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。