【技术实现步骤摘要】
一种基于知识感知的新闻推荐方法
本专利技术涉及一种基于知识感知的新闻推荐方法,属于人工智能与网络信息大数据
技术介绍
随着移动互联网的普及,越来越多的人选择通过移动互联网获取新闻资讯。对于新闻内容平台来说,构建一个能够捕获用户阅读兴趣并向其推送相关信息的个性化新闻推荐系统,显得至关重要。一般而言,在新闻推荐场景下,需要注意以下几点:第一,新闻具有很强的时效性,更迭速度很快,基于传统的协同过滤方法并不适用。第二,用户通常会对一些特定话题的新闻内容感兴趣,如何根据用户的浏览历史为用户构建兴趣偏好模型,并在此基础上判断候选新闻是否符合用户偏好,是解决问题的关键。第三,新闻内容中往往包含大量的命名实体,这些实体背后隐含的常识信息,对于建立推荐模型有着很大的帮助。目前,主流的新闻推荐方法,通常先从新闻文本中提取特征向量来表征该新闻,根据用户点击过的新闻特征构建出用户兴趣特征,并基于这些特征进行推荐。然而,文本特征通常是基于单词在语料库中的共现关系来构建的,无法体现单词背后隐含的知识层面的关联。
技术实现思路
本专利技术的目的是为了解决现有的基于文本特征的新闻推荐模型难以捕获文本中隐含的知识关联的问题,创造性地提出一种基于知识感知的新闻推荐方法。本专利技术所述方法,首先从新闻文本中识别出实体,将其与知识图谱中的实体相匹配,利用知识表示学习模型得到实体和关系的向量表示。然后,使用一种知识感知的深度网络DKPN(DeepKnowledgePathNetwork)建立推荐模型。具体 ...
【技术保护点】
1.一种基于知识感知的新闻推荐方法,其特征在于,包括以下步骤:/n首先,从新闻文本中识别出实体,将其与知识图谱中的实体相匹配,利用知识表示学习模型得到实体和关系的向量表示;/n然后,使用一种知识感知的深度网络DKPN建立推荐模型,具体地,用一个卷积神经网络来融合新闻的词向量和实体向量,从中学习新闻的综合特征;/n对于每一个候选新闻,基于用户的浏览历史与候选新闻之间的相关性,使用一个注意力网络动态地构建用户特征;同时,考虑已点击的新闻中的实体与候选新闻中的实体之间的路径,利用长短期记忆网络来从路径中生成路径特征;/n最后,以候选新闻特征、用户特征和路径特征为输入,用一个多层感知机来计算用户点击候选新闻的概率,据此向用户进行新闻推荐。/n
【技术特征摘要】
20190606 CN 20191049530951.一种基于知识感知的新闻推荐方法,其特征在于,包括以下步骤:
首先,从新闻文本中识别出实体,将其与知识图谱中的实体相匹配,利用知识表示学习模型得到实体和关系的向量表示;
然后,使用一种知识感知的深度网络DKPN建立推荐模型,具体地,用一个卷积神经网络来融合新闻的词向量和实体向量,从中学习新闻的综合特征;
对于每一个候选新闻,基于用户的浏览历史与候选新闻之间的相关性,使用一个注意力网络动态地构建用户特征;同时,考虑已点击的新闻中的实体与候选新闻中的实体之间的路径,利用长短期记忆网络来从路径中生成路径特征;
最后,以候选新闻特征、用户特征和路径特征为输入,用一个多层感知机来计算用户点击候选新闻的概率,据此向用户进行新闻推荐。
2.如权利要求1所述的一种基于知识感知的新闻推荐方法,其特征在于,提取新闻文本中实体知识信息的方法为:
步骤2.1:使用实体链接技术,将新闻文本中的单词与知识图谱中的实体进行链接并消歧,得到新闻实体集合;
步骤2.2:基于新闻实体集合,从原始的知识图谱中构造出一个知识图谱子图,并从原图中抽取所有实体之间的边;将该子图扩展一跳,即,引入所有和这些实体距离为1的实体及相关的边;
步骤2.3:使用知识图谱特征学习方法,从扩展的知识子图中,学习实体向量和关系向量;
步骤2.4:为每个实体提取其额外的上下文信息,一个实体e的上下文,是指它在知识图谱中的邻居的集合,即:
context(e)={e′|(e,r,e′)∈G∨(e′,r,e)∈G}(1)
其中,e、e′均表示实体,r表示关系,G表示知识图谱;
将实体e的上下文向量定义为它的上下文实体的向量的平均值:
其中,ei是实体e的上下文实体集合context(e)的第i个实体的向量表示。
3.如权利要求1所述的一种基于知识感知的新闻推荐方法,其特征在于,使用实体知识感知的深度网络DKPN建立推荐模型的方法为:
步骤3.1:构建新闻特征;
具体包括如下步骤:
步骤3.1.1:对于一个新闻标题[w1,w2,...,wn],将每个单词wi与其词向量wi、实体向量ei以及实体上下文向量一一对应,若没有相应的实体向量和实体上下文向量,则用零向量替代;同时,为解决词向量和实体向量的兼容性问题,引入映射函数g():
g(e)=tanh(Me+b)(3)
其中,M∈Rd×k是一个转换矩阵,b为偏置常量,该函数将k维的实体向量和实体上下文向量映射到d维的向量空间中,与词向量一致;将词向量、映射后实体向量和映射后的实体上下文向量堆叠后,得到三通道输入W:
其中,Rd×n×3表示d×n×3的实张量空间,R为实数空间;
步骤3.1.2:用一个知识感知的卷积神经网络,从W中提取新闻特征:
首先,通过卷积核h∈Rd×l×3提取卷积特征,进行卷积操作后...
【专利技术属性】
技术研发人员:刘琼昕,覃明帅,宋祥,王佳升,徐建祥,卢士帅,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。