融合时空特征的新闻推荐方法技术

技术编号:36390804 阅读:10 留言:0更新日期:2023-01-18 09:55
本发明专利技术提供了一种融合时空特征的新闻推荐方法,包括:S1:新闻知识图谱构建;S2:新闻实体模型构建;S3:推荐模型构建,本发明专利技术在构建的新闻知识图谱的基础上,通过构建TransE模型建立新闻实体模型,并通过基于用户的历史点击新闻,利用注意力机制结合新闻发布的历史时间与新闻发生地点的时空特征计算得到新闻实体的新闻点击概率,并根据新闻实体v的新闻点击概率由高至低对新闻实体v所关联的新闻进行排序,生成新闻推荐列表,从而实现时空特征加强的新闻个性化推荐,及时推送用户感兴趣的新闻。闻。闻。

【技术实现步骤摘要】
融合时空特征的新闻推荐方法


[0001]本专利技术涉及信息
,具体涉及融合时空特征的新闻推荐方法。

技术介绍

[0002]随着网络技术与新闻媒体的发展,包括新闻门户网站和新闻APP在内的各种新闻资讯媒介上的网络新闻每天发行量大且类型各异、层出不穷。新闻的时效性、广泛性、公开性、变动性以及针对性等基本特性以及网络新闻的多面化、多渠道以及快速性,使得用户每天接收大量的网络新闻。一方面,用户大量不关心或不感兴趣的新闻,给用户造成了新闻“信息过载”,另一方面,用户感兴趣或持续关注的新闻,没能及时推送给用户。因此,如何挖掘用户的个性化偏好,根据新闻特征为用户推荐感兴趣的新闻,是当前“智媒体”时代亟需解决的关键问题之一。
[0003]传统的新闻推荐方法大部分通过分析用户历史点击新闻的新闻类型或新闻主题来挖掘用户偏好,部分研究进一步分析了用户阅读新闻的时长,但实际上,用户在阅读新闻时同样会关注与地域有关的新闻,例如所在居住地的实时新闻或者特定关注区域的新闻;用户对于某些时事新闻的跟踪报道或重大事件的发展时态的持续关注,例如XX运动会期间会连续多天阅读自己喜欢的项目或喜欢的运动员的相关新闻。上述现象都体现了用户对新闻时间与新闻事件发生的地点的“时空”偏好,然而已有的新闻推荐方法没有考虑“时空”特征进行个性化新闻推荐,无法及时地推送用户感兴趣的新闻。
[0004]综上所述,急需一种能够及时推荐用户感兴趣的新闻的新闻推荐方法以解决现有技术中存在的问题。

技术实现思路

[0005]本专利技术目的在于提供一种融合时空特征的新闻推荐方法,具体技术方案如下:
[0006]融合时空特征的新闻推荐方法,包括:
[0007]S1:新闻知识图谱构建,具体包括:
[0008]S1

1:获取新闻中的实体,构建描述新闻实体的数据模型,并根据新闻实体之间的关系得到对应的关系集;
[0009]S1

2:在步骤S1

1的数据模型中的非结构化数据中抽取新闻实体v,得到对应的实体集;
[0010]S1

3:基于实体集和关系集建立三元组集合,结合实体集、关系集和三元组集合构建新闻知识图谱;
[0011]S2:新闻实体模型构建,包括:基于步骤S1的新闻知识图谱和注意力机制构建TransE 模型,通过TransE模型构建得到包括新闻实体v的新闻实体模型;
[0012]S3:推荐模型构建,具体包括:
[0013]S3

1:采用注意力机制,计算某一新闻实体v与用户历史点击新闻的实体g
i
在历史时间T下的相关程度P
T

[0014]S3

2:通过加权求和方式,计算在相关程度P
T
下用户对某一新闻实体的偏好
[0015]S3

3:通过引入在历史时间T下的时间衰减项以及用户对某一新闻实体的偏好得到用户对某一新闻实体的喜好程度
[0016]S3

4:引入新闻发生地点与用户距离的幂律衰减项,获得用户对某一新闻实体v的新闻点击概率,并根据新闻实体v的新闻点击概率由高至低对新闻实体v所关联的新闻进行排序,生成新闻推荐列表。
[0017]优选的,所述步骤S3

1中相关程度P
T
的表达式如下:
[0018][0019]其中,P
T
表示某一新闻实体v与用户历史点击新闻的实体g
i
在历史时间T下的相关程度,g
i
是用户历史点击新闻的实体,T表示历史时间,v表示新闻实体且其包括头实体h和尾实体t,v
T
表示历史时间T下的新闻实体v,G
i
表示用户在历史时间T下的交互集。
[0020]优选的,所述步骤S3

2中计算用户对某一新闻实体的偏好的表达式如下:
[0021][0022]其中,(g
i
)∈G
i
代表历史点击新闻的实体g
i
的嵌入表示,表示用户对某一新闻实体的偏好,u表示某一用户。
[0023]优选的,所述步骤S3

3中喜好程度的表达式如下:
[0024][0025]其中,表示历史时间T的时间衰减项,e表示自然常数,a2为时间衰减项的常数参数,τ表示当前时间,表示用户对某一新闻实体的喜好程度。
[0026]优选的,所述步骤S3

4中新闻点击概率的表达式如下:
[0027][0028]其中,表示新闻点击概率,为新闻发生地点与用户距离的幂律衰减项, a1、b1以及c1均为幂律衰减项的常数参数,dist表示用户距离。
[0029]优选的,步骤S2中的所述新闻实体模型包括不同新闻事件的关联关系树模型以及同一新闻事件的时空演化树模型。
[0030]优选的,所述步骤S2具体包括:
[0031]S2

1:为新闻知识图谱中不同的关系设定不同的权重值w;
[0032]S2

2:基于注意力机制构建TransE模型,所述TransE模型表达式如下:
[0033]E(h,r,t)=w
·
||h+r

t||;
[0034]其中,E(h,r,t)表示表示头实体h与尾实体t之间的语义关联程度,h表示头实体,r表示关系,t表示尾实体,w表示关系的权重值;
[0035]S2

3:通过TransE模型计算不同新闻事件中新闻实体v之间的语义关联程度,设定
阈值δ1,将超过阈值δ1的新闻实体划分到同一类型下,并通过各实体的关联的关系r构建得到不同新闻事件的关联关系树模型;
[0036]S2

4:通过TransE模型计算同一新闻事件中新闻实体v之间的语义关联程度,设定阈值δ2,将超过阈值δ2的新闻实体划分到同一类型下并通过各实体的关联的关系r构建得到同一新闻事件的时空演化树模型。
[0037]应用本专利技术的技术方案,具有以下有益效果:
[0038]本专利技术在构建的新闻知识图谱的基础上,通过构建TransE模型建立新闻实体模型,并通过基于用户的历史点击新闻,利用注意力机制结合新闻发布的历史时间与新闻发生地点的时空特征计算得到新闻实体的新闻点击概率,并根据新闻实体v的新闻点击概率由高至低对新闻实体v所关联的新闻进行排序,生成新闻推荐列表,从而实现时空特征加强的新闻个性化推荐,及时推送用户感兴趣的新闻。
[0039]除了上面所描述的目的、特征和优点之外,本专利技术还有其它的目的、特征和优点。下面将参照图,对本专利技术作进一步详细的说明。
附图说明
[0040]构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.融合时空特征的新闻推荐方法,其特征在于,包括:S1:新闻知识图谱构建,具体包括:S1

1:获取新闻中的实体,构建描述新闻实体的数据模型,并根据新闻实体之间的关系得到对应的关系集;S1

2:在步骤S1

1的数据模型中的非结构化数据中抽取新闻实体v,得到对应的实体集;S1

3:基于实体集和关系集建立三元组集合,结合实体集、关系集和三元组集合构建新闻知识图谱;S2:新闻实体模型构建,包括:基于步骤S1的新闻知识图谱和注意力机制构建TransE模型,通过TransE模型构建得到包括新闻实体v的新闻实体模型;S3:推荐模型构建,具体包括:S3

1:采用注意力机制,计算某一新闻实体v与用户历史点击新闻的实体g
i
在历史时间T下的相关程度P
T
;S3

2:通过加权求和方式,计算在相关程度P
T
下用户对某一新闻实体的偏好S3

3:通过引入在历史时间T下的时间衰减项以及用户对某一新闻实体的偏好得到用户对某一新闻实体的喜好程度S3

4:引入新闻发生地点与用户距离的幂律衰减项,获得用户对某一新闻实体v的新闻点击概率,并根据新闻实体v的新闻点击概率由高至低对新闻实体v所关联的新闻进行排序,生成新闻推荐列表。2.根据权利要求1所述的新闻推荐方法,其特征在于,所述步骤S3

1中相关程度P
T
的表达式如下:其中,P
T
表示某一新闻实体v与用户历史点击新闻的实体g
i
在历史时间T下的相关程度,g
i
是用户历史点击新闻的实体,T表示历史时间,v表示新闻实体且其包括头实体h和尾实体t,v
T
表示历史时间T下的新闻实体v,G
i
表示用户在历史时间T下的交互集。3.根据权利要求2所述的新闻推荐方法,其特征在于...

【专利技术属性】
技术研发人员:龙怡天唐宏顺牟鹏民尹斌张纯刘亚南
申请(专利权)人:湖南风芒传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1