【技术实现步骤摘要】
一种用于社交网络用户行为序列间的可迁移性度量方法
[0001]本专利技术涉及基于深度学习的行为预测和信息熵领域,尤其涉及信息熵领域中的转移熵方法。
技术介绍
[0002]在线信息平台(比如zhihu、Quora等)中用户多样的行为可以为用户兴趣的建模提供丰富的信息。因此,对于某些数据稀少不足以完整表达用户兴趣的行为,一般使用跨域行为预测或者多行为融合预测的方式来解决。由于不相关的知识的迁移会导致负迁移的现象,我们希望事先度量出行为序列间可迁移性的大小,从而有助于选择合适的行为进行迁移,同时也可以将其作为先验知识提高迁移模型和多行为融合模型的预测性能。
[0003]传统度量可迁移性的方法是基于验证集或测试集上特定模型的损失。它首先设计一个模型来融合不同的源行为,然后比较不同源行为迁移到目标行为上损失的降低程度(或者准确度的提高程度,或者其他的用户预定义的量化函数)来判别源行为到目标行为的可迁移性大小。该方式完全依赖于设计的模型和用户预定义的可迁移性量化函数(比如相似度函数、一层非线性神经网络函数等等),消耗了大量的模型 ...
【技术保护点】
【技术特征摘要】
1.一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述方法采用TEMCS模型来学习行为序列间的可迁移性大小,得到用户行为序列间可迁移性的度量;所述TEMCS模型包括多概念语义压缩模型和归一化转移熵模型;所述多概念语义压缩模型用于最大化序列的语义信息;所述归一化转移熵模型是建模序列间动态的信息转移。2.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述多概念语义压缩模型的建立首先利用所有序列内item的语义信息进行k
‑
means聚类获取概念矩阵C;其中|C|是概念的个数,也就是聚类的个数。3.根据权利要求2所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述|C|的范围在[20,30,50,100,200,300,500]之内。4.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述计算行为序列的多概念分布,是通过行为序列内item的语义信息和概念矩阵C之间的欧氏距离相似度来得到行为序列的多概念分布。5.根据权利要求4所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述item的语义信息是通过嵌入矩阵E得到的;所述嵌入矩阵E是利用收集item的评论信息,利用word2vec模型去获取item评论信息的语义信息,获取item本身的语义信息,即所有item的嵌入矩阵E。6.根据权利要求1所述的一种用于社交网络用户行为序列间的可迁移性度量方法,其特征在于:所述采用TEMCS模型来学习行为序列间的可迁移性大小时,先将整体行为...
【专利技术属性】
技术研发人员:郭斌,李诺,刘琰,丁亚三,徐恩,於志文,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。