【技术实现步骤摘要】
本专利技术涉及计算机领域,尤其涉及一种社交媒体用户表征模型,模型的预训练方法、以及模型设计中的文本图框架。
技术介绍
1、对社交媒体用户进行建模是数字社会时代下社会治理的核心。为了协同处理来自文本和社交网络的信息,研究者尝试去构建融合了不同的数字痕迹的用户表示模型以更好地学习社交媒体用户的表示,包括由预训练语言模型编码的文本信息和由图模型编码的社交网络信息。
2、尽管目前的研究方法在一些用户级的下游任务上有不错的表现,然而,受限于过量的文本信息和难以收集的社交网络信息,它们无法利用全局的用户文本信息,并且在没有社会关系的情况下难以泛化。现有工作中对于社交网络中用户结构信息的探索也主要局限于用户间的网络关系,对于用户在社交网络上多样性的探索不足。
技术实现思路
1、本说明书实施方式的目的是提供一种社交媒体用户表征模型,模型的预训练方法,以及模型设计中的文本图框架。本说明书实施方式提供的新的文本图用户表征模型和预训练方法,可以将社交媒体的通用结构信息注入到模型中,并对用户的全局言论
...【技术保护点】
1.一种社交媒体用户的表征模型的训练生成方法,其特征在于,所述训练生成方法包括:
2.如权利要求1所述方法,其特征在于,步骤“以字、词等混合粒度的文本作为图上的节点,通过点互信息计算节点间的连边,从而构建出文本图;以构建出的所述文本图作为输入,基于图同构网络构建用户表示”包括:
3.如权利要求1所述方法,其特征在于,应用于自监督地训练所述表征模型,所述方法包括:
4.一种社交媒体用户的表征模型的训练生成方法,其特征在于,包括以下步骤:
5.根据权利要求4所述的社交媒体用户的表征模型的训练生成方法,其特征在于,步骤“在用户
...【技术特征摘要】
1.一种社交媒体用户的表征模型的训练生成方法,其特征在于,所述训练生成方法包括:
2.如权利要求1所述方法,其特征在于,步骤“以字、词等混合粒度的文本作为图上的节点,通过点互信息计算节点间的连边,从而构建出文本图;以构建出的所述文本图作为输入,基于图同构网络构建用户表示”包括:
3.如权利要求1所述方法,其特征在于,应用于自监督地训练所述表征模型,所述方法包括:
4.一种社交媒体用户的表征模型的训练生成方法,其特征在于,包括以下步骤:
5.根据权利要求4所述的社交媒体用户的表征模型的训练生成方法,其特征在于,步骤“在用户的每个历史言论上使用固定大小的滑动窗口来收集共现统计数据,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。