5G应用领域中一种考虑用户正负隐式反馈关联的医疗资讯推荐方法技术

技术编号:38342080 阅读:7 留言:0更新日期:2023-08-02 09:22
本发明专利技术公开了5G应用领域中一种考虑用户正负隐式反馈关联的医疗资讯推荐方法,基于用户在医疗资讯平台上点击和跳过行为序列,预测用户点击一个医疗资讯的概率。本发明专利技术分为七个部分:第一部分是挖掘出用户正负隐式反馈行为序列中的图结构,并找到正负隐式反馈行为序列中的噪音;第二部分是计算用户正负反馈关联图结构,并结合用户正反馈图结构和负反馈图结构,得到涉及用户所有行为的图结构;第三部分是采用图神经网络更新医疗资讯向量表示;第四部分是采用序列编码器得到用户的正反馈序列向量和用户的负反馈序列向量;第五部分是得到用户向量;第六部分是预测用户对目标医疗资讯的点击率;第七部分是根据模型特性,设计损失函数。函数。函数。

【技术实现步骤摘要】
5G应用领域中一种考虑用户正负隐式反馈关联的医疗资讯推荐方法


[0001]本专利技术属于互联网服务
,尤其是涉及5G应用领域中一种考虑用户正负隐式反馈关联的医疗资讯推荐方法。

技术介绍

[0002]5G通信具有超高数据速率和低时延等特点,这使得用户可以很方便地采用移动终端设备观看医疗领域的资讯。然而医疗资讯平台上积累了大量的医疗资讯,用户需要花很多时间才能找到自己感兴趣的医疗资讯。因此,推荐系统显得尤为重要。本方法是一种序列推荐方法,序列推荐方法是根据用户历史交互行为,从中挖掘出用户的喜好,并给用户推荐他感兴趣的医疗资讯。在医疗平台中,用户如果对推荐的医疗资讯感兴趣,可以点击并进行阅览;如果不感兴趣,则可以选择跳过。把用户的点击行为叫做用户的正面隐式反馈,跳过行为叫做用户的负面隐式反馈。
[0003]现有的推荐方法通常对用户的点击行为进行挖掘,捕捉用户的兴趣,并推荐符合用户兴趣的物品。但是该种方法忽略了用户负面反馈数据中丰富的信息。本方法将用户负面反馈数据也引入推荐系统,不仅可以缓解数据稀疏性,还可以对用户的偏好进行更全面地刻画。但是用户的隐式反馈数据中包含了大量的噪音数据,现有的推荐系统采用的降噪处理是将噪音识别出来,然后把噪音去掉。但是据本方法观察,隐式反馈中的噪音数据通常包含了丰富的用户偏好信息。如用户点击了某医疗资讯,但是却不一定表示用户喜欢该医疗资讯,因为用户是看到了医疗资讯的标题才点进去,可能看到资讯内容后发现和自己想象的不一样,因此又退出去。这样的点击行为就是属于正面隐式反馈中的噪音。同样,负面隐式反馈数据中的噪音也包含了用户偏好的丰富信息,如用户跳过了某条医疗资讯并不一定表示用户不喜欢该医疗资讯,而是可能平台给用户同时展示了多个用户感兴趣的医疗资讯,但是用户只能点击一个资讯或者用户只愿意在一个主题中点击一个资讯。所以,负面反馈中的噪音可能包含了用户的正面兴趣。
[0004]为了从用户的正面和负面隐式反馈数据中的挖掘出噪音,并将该噪音转化为有价值的信息,本方法提出了5G应用领域中一种考虑用户正负隐式反馈关联的医疗资讯推荐方法。从正面隐式反馈数据中挖掘出代表用户负面兴趣信息的噪音,同样从负面隐式反馈数据中挖掘出代表用户正面兴趣信息的噪音。从用户的正负隐式反馈序列中构建图,进行信息交换,并利用图神经网络的过平滑和降噪作用,将序列中的噪音进行进一步地降噪处理。

技术实现思路

[0005]本方法的问题定义为基于用户在医疗资讯平台上点击和跳过行为序列,预测用户点击一个医疗资讯的概率。涉及到的数学符号有:用户集合U,医疗资讯集合V。根据患者的点击和跳过行为,可以把患者的行为序列分为正面隐式反馈行为序列和负面隐式反馈行为序列。正面隐式反馈行为序列就是用户的点击行为序列,表示为负
面隐式反馈行为序列就是用户的跳过行为序列,表示为面隐式反馈行为序列就是用户的跳过行为序列,表示为其中l1和l2分别是用户的点击行为序列和跳过行为序列的长度,且p
i
和n
i
∈V。现有的医疗资讯推荐方法在降噪处理时,通常将噪音识别出来,然后把噪音去掉。但是据本方法观察,隐式反馈中的噪音数据通常包含了丰富的用户偏好信息。如用户点击了某医疗资讯,但是却不一定表示用户喜欢该医疗资讯,因为用户是看到了医疗资讯的标题才点进去,可能看到资讯内容后发现和自己想象得不一样,因此又退出去。这样的点击行为就是属于正面隐式反馈中的噪音。同样,负面隐式反馈数据中的噪音也包含了用户偏好的丰富信息,如用户跳过了某条医疗资讯并不一定表示用户不喜欢该医疗资讯,而是可能平台给用户同时展示了多个用户感兴趣的医疗资讯,但是用户只能点击一个资讯或者用户只愿意在一个主题中点击一个资讯。所以,这样的负面反馈中的噪音包含了用户的正面兴趣。为了从用户的正面和负面隐式反馈数据中的挖掘出噪音,并将该噪音转化为有价值的信息,本方法采用以下技术方案:
[0006]挖掘出用户正负隐式反馈行为序列中的图结构,并找到正负隐式反馈行为序列中的噪音。在医疗资讯推荐场景中,用户正隐式反馈行为是点击行为,用户负隐式反馈行为是跳过行为。以用户正面隐式反馈行为序列为例,用户集合是U,医疗资讯集合是V,用户点击行为序列表示为用户的跳过行为序列表示为其中l1和l2分别是用户的点击行为序列和跳过行为序列的长度,且p
i
和n
i
∈V。对于任一被点击的医疗资讯p
i
,它的向量表征为对于任一被跳过的医疗资讯p
i
,它的向量表征为采用聚类的思想从正面隐式反馈行为序列中挖掘出图结构,通过计算序列中任意两个医疗资讯之间的相似度得到一个全连接的图结构,图结构中边的值就是医疗资讯之间的相似度;然后设置图稀疏度ε,保留值排名前ε
·
l
12
的边,具体公式为:
[0007][0008][0009]其中,S
pp
是一个全连接图结构,表示图中任意两个医疗资讯p
i
和p
j
之间边的值为这两个医疗资讯的cosine相似度,w是模型训练向量参数,

表示元素级别的乘法。M
pp
图结构是对S
pp
图结构进行过滤,保留值较高的边,使得图稀疏度为ε。也就是,对S
pp
图中的边按照值由大到小进行排序,保留前ε
·
l
12
的边,该功能由函数Top(s
pp

·
l
12
)实现。得到M
pp
图结构之后,计算图M
pp
的度D
pp
,度D
pp
的计算公式为的计算公式为过滤出D
pp
中值排名靠后的资讯节点,即度小的资讯节点,度小的资讯节点说明和别的资讯节点的相似度低,是孤立的,即噪点。本方法把正隐式反馈行为序列中噪音称作潜在负反馈行为,为了区分,用户的负反馈行为叫做真实负反馈行为。噪点的映射计算公式为:
[0010][0011]其中,Last(D
pp
,k)表示图M
pp
中度排名靠后的k个资讯节点,k设置为β
·
l1。采用同样的流程从用户负隐式反馈行为序列中挖掘出图结构M
nn
,并找到负隐式反馈行为序列中噪音映射Mask
n

[0012]计算用户正负反馈关联图结构,并结合用户正反馈图结构和负反馈图结构,得到
涉及用户所有行为的图结构。接下来以潜在负反馈行为和真实负反馈行为之间的关联图结构为例,介绍计算用户正负反馈关联图结构的过程。具体步骤是,先计算正反馈和负反馈序列中医疗资讯的相似度,得到一个全连接的二分图,再利用正隐式反馈行为序列中噪音映射Mask
p
得到潜在负反馈行为和真实负反馈行为之间的图结构,最后设置图的稀疏度为ε
nn
,即保留值排名前ε...

【技术保护点】

【技术特征摘要】
1.5G应用领域中一种考虑用户正负隐式反馈关联的医疗资讯推荐方法,其特征在于:挖掘出用户正负隐式反馈行为序列中的图结构,并找到正负隐式反馈行为序列中的噪音;在医疗资讯推荐场景中,用户正隐式反馈行为是点击行为,用户负隐式反馈行为是跳过行为;用户集合是U,医疗资讯集合是V,用户点击行为序列表示为用户的跳过行为序列表示为户的跳过行为序列表示为其中l1和l2分别是用户的点击行为序列和跳过行为序列的长度,且p
i
和n
i
∈V;对于任一被点击的医疗资讯p
i
,它的向量表征为对于任一被跳过的医疗资讯p
i
,它的向量表征为以用户正面隐式反馈行为序列为例,该过程为:采用聚类的思想从正面隐式反馈行为序列中挖掘出图结构,通过计算序列中任意两个医疗资讯之间的相似度得到一个全连接的图结构,图结构中边的值就是医疗资讯之间的相似度;然后设置图稀疏度ε,保留值排名前ε
·
l
12
的边,具体公式为:的边,具体公式为:其中,S
pp
是一个全连接图结构,表示图中任意两个医疗资讯p
i
和p
j
之间边的值为这两个医疗资讯的cosine相似度,w是模型训练向量参数,

表示元素级别的乘法;M
pp
图结构是对S
pp
图结构进行过滤,保留值较高的边,使得图稀疏度为ε;也就是,对S
pp
图中的边按照值由大到小进行排序,保留前ε
·
l
12
的边,该功能由函数Top(S
pp
,ε
·
l
12
)实现;得到M
pp
图结构之后,计算图M
pp
的度D
pp
,度D
pp
的计算公式为的计算公式为过滤出D
pp
中值排名靠后的资讯节点,即度小的资讯节点,度小的资讯节点说明和别的资讯节点的相似度低,是孤立的,即噪点;本方法把正隐式反馈行为序列中噪音称作潜在负反馈行为,为了区分,用户的负反馈行为叫做真实负反馈行为;噪点的映射计算公式为:其中,Last(D
pp
,k)表示图M
pp
中度排名靠后的k个资讯节点,k设置为β
·
l1;采用同样的流程从用户负隐式反馈行为序列中挖掘出图结构M
nn
,并找到负隐式反馈行为序列中噪音映射Mask
n
;计算用户正负反馈关联图结构,并结合用户正反馈图结构和负反馈图结构,得到涉及用户所有行为的图结构;接下来以潜在负反馈行为和真实负反馈行为之间的关联图结构为例,介绍计算用户正负反馈关联图结构的过程;具体步骤是,先计算正反馈和负反馈序列中医疗资讯的相似度,得到一个全连接的二分图,再利用正隐式反馈行为序列中噪音映射Mask
p
得到潜在负反馈行为和真实负反馈行为之间的图结...

【专利技术属性】
技术研发人员:董津刘琛曹兴兵毛夏薇褚炜
申请(专利权)人:浙江纳里数智健康科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1