一种信息推荐方法、装置、服务器及存储介质制造方法及图纸

技术编号:20947511 阅读:19 留言:0更新日期:2019-04-24 03:40
本发明专利技术实施例公开了一种信息推荐方法、装置、服务器及存储介质。该方法包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。本发明专利技术实施例提供的技术方案,提高了信息推荐的准确度,提升了用户与推送信息之间的黏度,进而提升了用户体验。

An Information Recommendation Method, Device, Server and Storage Media

The embodiment of the present invention discloses an information recommendation method, device, server and storage medium. The method includes: according to the co-occurrence of knowledge points of text chain in all documents, the frequency of reverse files in all documents, and the knowledge points of text chain contained in the target document, the weight of correlation between the target document and the knowledge points of each text chain is determined; and according to the weight of correlation between the target document and the knowledge points of each text chain, the weight of correlation between the target document and the knowledge points of each text chain is determined. The knowledge points of the text chain to be recommended in the target document are pushed according to the knowledge points of the text chain to be recommended. The technical scheme provided by the embodiment of the present invention improves the accuracy of information recommendation, improves the viscosity between users and push information, and further improves the user experience.

【技术实现步骤摘要】
一种信息推荐方法、装置、服务器及存储介质
本专利技术涉及互联网应用
,尤其涉及一种信息推荐方法、装置、服务器及存储介质。
技术介绍
近年来随着互联网化浪潮的发展,互联网上充斥着各种各样海量的内容信息,如何给用户呈现更优质的内容,让用户找到想找的内容,是目前迫切需要解决的问题之一。目前,常用的推荐方法有:协同过滤,是一种经典的推荐算法,通过用户与商品的喜好数据来判断该用用户推荐什么商品;潜在因子分析,是推荐系统的一种经典派系。这两种常用推荐方法在互联网广告领域取得了巨大的成功。但是,协同过滤法常常会出现缺乏用户交互行为数据导致的冷启动问题,例如:当系统中的新用户没有任何浏览或购买记录,就无法刻画其特征,进而无法进行推荐物品匹配。并且潜在因子分析模型复杂,计算性能要求较高,分解出来的因子是抽象的向量,不可读,无法满足互联网产品快速迭代的需求。另外,基于实体挖掘的方法构建文字链效率低下。
技术实现思路
本专利技术实施例提供一种信息推荐方法、装置、服务器及存储介质,可以提高信息推荐的准确度,提升用户与推送信息之间的黏度,提升用户体验。第一方面,本专利技术实施例提供了一种信息推荐方法,该方法包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。第二方面,本专利技术实施例还提供了一种信息推荐装置,该装置包括:相关性权重确定模块,用于依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;待推荐文字链确定模块,用于依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;信息推送模块,用于依据所述待推荐文字链知识点进行信息推送。第三方面,本专利技术实施例还提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任一所述的信息推荐方法。第四方面,本专利技术实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一所述的信息推荐方法。本专利技术实施例提供的信息推荐方法、装置、服务器及存储介质,根据各文字链知识点在所有文档中的共现文字链知识点、各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定目标文档与各文字链知识点的相关性权重,根据相关性权重确定目标文档的待推荐文字链知识点,并将其推送给用户。解决了现有的推荐方法中冷启动、权重确定模型复杂以及构建文字链效率低等问题,提高了信息推荐的准确度,提升了用户与推送信息之间的黏度,进而提升了用户体验。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1是本专利技术实施例一中提供的一种信息推荐方法的流程图;图2是本专利技术实施例二中提供的一种信息推荐方法的流程图;图3是本专利技术实施例三中提供的一种基于NLP和知识图谱的文档中包含的文字链知识点的确定方法的流程图;图4是本专利技术实施例四中提供的一种信息推荐装置的结构框图;图5是本专利技术实施例五中提供的一种服务器的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。实施例一图1为本专利技术实施例一提供的一种信息推荐方法的流程图,本实施例基于NLP和知识图谱在文库类产品线上的应用文字链来帮助用户找到想要的文档及内容的情况。该方法可以由本专利技术实施例提供的信息推荐装置/服务器/计算机可读存储介质来执行,该装置/服务器/计算机可读存储介质可采用软件和/或硬件的方式实现。参见图1,该方法具体包括:S110,依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重。其中,NLP(NaturalLanguageProcessing,自然语言处理)是人工智能(ArtificialIntelligence,AI)领域中的一个子领域,用于研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。知识图谱是以实体、概念作为节点,以语义关系作为边的语义网络,本质上是一张由知识点相互连接而成的语义网络。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。知识图谱使得知识获取更加直接。文字链知识点是从文档中包含的各知识点中选择一部分作为文字链的知识点。文字链是用来解决用户对文档内容中想了解的知识做进一步解读的需求。文字链可提高内容的分发效率,用户点击文字链可进入下一个网页,该网页包含与文字链知识点相关的文档和该知识的释义。飘绿的文字链可以来源于教育知识图谱中的实体。若一个文字链知识点与另一个文字链知识点在同一篇文档中出现,则这两个文字链知识点互为共现文字链知识点。逆向文件频率(InverseDocumentFrequency,IDF)是一个词语普遍重要性的度量,某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。目标文档可以是所有文档中的第K篇文档,例如从一千万文档中选择一篇文档作为目标文档。S120,依据目标文档与各文字链知识点的相关性权重,确定目标文档的待推荐文字链知识点。其中,待推荐文字链知识点为能够表达用户想要了解更多、潜在的意图的文字链知识点。将得到的目标文档与各文字链知识点的相关性权重进行处理,比如对相关性权重进行排序,依据排序结果筛选出能够表达用户意图的文字链知识点作为待推荐的文字链知识点推送给用户。示例性的,S120具体可以包括:依据目标文档与各文字链知识点的相关性权重,对各文字链知识点排序;从排序结果中过滤掉目标文档中包含的文字链知识点;依据过滤结果选择相关性权重高的预设数值个文字链知识点作为目标文档的待推荐文字链知识点。其中,预设数值可以依据需要进行设定,比如可以是6等。为了想要了解用户潜在的需求,把目标文档中已经包含的文字链知识点去掉,然后把剩下的文字链知识点按权值从大到小的顺序选择权值大的比如前6个文字链知识点作为待推荐文字链知识点。S130,依据所述待推荐文字链知识点进行信息推送。其中,信息推送的方式可以是在搜索结果显示区域的右侧显示。具体的,可以根据待推荐文字链知识点在知识图谱或文库中查找到与其相关内容,比如图片、新闻或文章等在搜索结果显示区域的右侧显示以此来推荐给用户。本专利技术实施例提供的信息推荐方法,根据各文字链知识点在所有文档中的共现文字链知识点、各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定目标文档与各文字链知识点的相关性权重,本文档来自技高网...

【技术保护点】
1.一种信息推荐方法,其特征在于,包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重;依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点;依据所述待推荐文字链知识点进行信息推送。2.根据权利要求1所述的方法,其特征在于,依据各文字链知识点在所有文档中的共现文字链知识点,各文字链知识点在所有文档中的逆向文件频率以及目标文档中包含的文字链知识点,确定所述目标文档与各文字链知识点的相关性权重,包括:依据各文字链知识点在所有文档中的共现文字链知识点,构建共现矩阵;依据各文字链知识点在所有文档中的逆向文件频率,确定逆向文件向量;依据目标文档中包含的文字链知识点,确定所述目标文档的文字链相关性矩阵;依据所述目标文档的文字链相关性矩阵、所述共现矩阵以及所述逆向文件向量,确定所述目标文档与各文字链知识点的相关性向量;依据所述目标文档与各文字链知识点的相关性向量,确定所述目标文档与各文字链知识点的相关性权重。3.根据权利要求2所述的方法,其特征在于,依据目标文档中包含的文字链知识点,确定所述目标文档的文字链相关性矩阵,包括:若目标文档中包含第i个文字链知识点,则所述目标文档的文字链相关性矩阵中X1i取1;否则,X1i取0,其中i=1,…,N,N是所有文字链知识点的数量。4.根据权利要求2所述的方法,其特征在于,依据各文字链知识点在所有文档中的共现文字链知识点,构建共现矩阵,包括:统计所有文档确定各文字链知识点的共现文字链知识点;若第j个文字链知识点与第k个文字链知识点共同出现在一篇文档中,则所述共现矩阵中Gjk取1;否则,Gjk取0,其中j=1,…,N,k=1,…,N,N是所有文字链知识点的数量。5.根据权利要求2所述的方法,其特征在于,依据各文字链知识点在所有文档中的逆向文件频率,确定逆向文件向量,包括:依据如下公式,确定所逆向文件向量中IDFn1:其中M是所有文档的总数量,En是包含第n个文字链知识点的文档数量,n=1,…,N,N是所有文字链知识点的数量。6.根据权利要求2所述的方法,其特征在于,包括:依据所述目标文档的文字链相关性矩阵、所述共现矩阵以及所述逆向文件向量,确定所述目标文档与各文字链知识点的相关性向量,包括:依据如下公式,确定所述目标文档与各文字链知识点的相关性向量:其中是所述目标文档与各文字链知识点的相关性向量,X是所述目标文档的文字链相关性矩阵,G是所述共现矩阵,是所述逆向文件向量。7.根据权利要求1所述的方法,其特征在于,依据所述目标文档与各文字链知识点的相关性权重,确定所述目标文档的待推荐文字链知识点,包括:依据所述目标文档与各文字链知识点的相关性权重,对各文字链知识点排序;从排序结果中过滤掉所述目标文档中包含的文字链知识点;依据过滤结果选择相关性权重高的预设数值个文字链知识点作为所述目标文档的待推荐文字链知识点。8.根据权利要求1所述的方法,其特征在于,文档中包含的文字链...

【专利技术属性】
技术研发人员:许瑾
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1