The embodiment of the present invention discloses an information recommendation method, device, server and storage medium. The method includes: according to the co-occurrence of knowledge points of text chain in all documents, the frequency of reverse files in all documents, and the knowledge points of text chain contained in the target document, the weight of correlation between the target document and the knowledge points of each text chain is determined; and according to the weight of correlation between the target document and the knowledge points of each text chain, the weight of correlation between the target document and the knowledge points of each text chain is determined. The knowledge points of the text chain to be recommended in the target document are pushed according to the knowledge points of the text chain to be recommended. The technical scheme provided by the embodiment of the present invention improves the accuracy of information recommendation, improves the viscosity between users and push information, and further improves the user experience.
【技术实现步骤摘要】
一种信息推荐方法、装置、服务器及存储介质
本专利技术涉及互联网应用
,尤其涉及一种信息推荐方法、装置、服务器及存储介质。
技术介绍
近年来随着互联网化浪潮的发展,互联网上充斥着各种各样海量的内容信息,如何给用户呈现更优质的内容,让用户找到想找的内容,是目前迫切需要解决的问题之一。目前,常用的推荐方法有:协同过滤,是一种经典的推荐算法,通过用户与商品的喜好数据来判断该用用户推荐什么商品;潜在因子分析,是推荐系统的一种经典派系。这两种常用推荐方法在互联网广告领域取得了巨大的成功。但是,协同过滤法常常会出现缺乏用户交互行为数据导致的冷启动问题,例如:当系统中的新用户没有任何浏览或购买记录,就无法刻画其特征,进而无法进行推荐物品匹配。并且潜在因子分析模型复杂,计算性能要求较高,分解出来的因子是抽象的向量,不可读,无法满足互联网产品快速迭代的需求。另外,基于实体挖掘的方法构建文字链效率低下。
技术实现思路
本专利技术实施例提供一种信息推荐方法、装置、服务器及存储介质,可以提高信息推荐的准确度,提升用户与推送信息之间的黏度,提升用户体验。第一方面,本专利技术实施例提供了一种信息推荐方法,该方法包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。第二方面,本专利技术实施例还提供了一种信息推荐装置,该装置包括:相关性权重确定模 ...
【技术保护点】
1.一种信息推荐方法,其特征在于,包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。
【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。2.根据权利要求1所述的方法,其特征在于,依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重,包括:依据各文字链知识点在所有文档中的共现文字链知识点,构建共现矩阵;依据各文字链知识点在所有文档中的逆向文件频率,确定逆向文件向量;依据目标文档中包含的文字链知识点,确定所述目标文档的文字链相关性矩阵;依据所述目标文档的文字链相关性矩阵、所述共现矩阵以及所述逆向文件向量,确定所述目标文档与各文字链知识点的相关性向量;依据所述目标文档与各文字链知识点的相关性向量,确定所述目标文档与各文字链知识点的相关性权重。3.根据权利要求2所述的方法,其特征在于,依据目标文档中包含的文字链知识点,确定所述目标文档的文字链相关性矩阵,包括:若目标文档中包含第i个文字链知识点,则所述目标文档的文字链相关性矩阵中X1i取1;否则,X1i取0,其中i=1,…,N,N是所有文字链知识点的数量。4.根据权利要求2所述的方法,其特征在于,依据各文字链知识点在所有文档中的共现文字链知识点,构建共现矩阵,包括:统计所有文档确定各文字链知识点的共现文字链知识点;若第j个文字链知识点与第k个文字链知识点共同出现在一篇文档中,则所述共现矩阵中Gjk取1;否则,Gjk取0,其中j=1,…,N,k=1,…,N,N是所有文字链知识点的数量。5.根据权利要求2所述的方法,其特征在于,依据各文字链知识点在所有文档中的逆向文件频率,确定逆向文件向量,包括:依据如下公式,确定所逆向文件向量中IDFn1:其中M是所有文档的总数量,En是包含第n个文字链知识点的文档数量,n=1,…,N,N是所有文字链知识点的数量。6.根据权利要求2所述的方法,其特征在于,包括:依据所述目标文档的文字链相关性矩阵、所述共现矩阵以及所述逆向文件向量,确定所述目标文档与各文字链知识点的相关性向量,包括:依据如下公式,确定所述目标文档与各文字链知识点的相关性向量:其中是所述目标文档与各文字链知识点的相关性向量,X是所述目标文档的文字链相关性矩阵,G是所述共现矩阵,是所述逆向文件向量。7.根据权利要求1所述的方法,其特征在于,依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点,包括:依据所述目标文档与各文字链知识点的相关性权重,对各文字链知识点排序;从排序结果中过滤掉所述目标文档中包含的文字链知识点;依据过滤结果选择相关性权重高的预设数值个文字链知识点作为所述目标文档的待推荐文字链知识点。8.根据权利要求1所述的方法,其特征在于,文档中包含的文字链...
【专利技术属性】
技术研发人员:许瑾,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。