System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种个性化话题文本舆材生成方法及系统技术方案_技高网

一种个性化话题文本舆材生成方法及系统技术方案

技术编号:40287085 阅读:7 留言:0更新日期:2024-02-07 20:39
本发明专利技术属于网络空间认知域技术领域,公开了一种个性化话题文本舆材生成方法及系统。该方法将话题下有影响力用户发现引入到个性化文本内容生成中,采用图链接预测和节点重要性的图神经网络方法进行重要用户发现,从话题背景稀疏用户社交关系网络中自动发现高价值和重要影响力的用户,作为个性化文本内容生成的使用对象;同时,结合基于深度学习的大规模对话语言模型,融合用户的社交重要性和文本情感正负面性的特征编码表示,自动化生成基于用户社交特性的情感可控个性化文本。本发明专利技术引入某话题下有影响力的用户发现和情感正负面个性化文本生成,解决上下文语境背景下无法准确基于高价值社交用户属性信息进行评论、对话短文本生成问题。

【技术实现步骤摘要】

本专利技术属于网络空间认知域,尤其涉及一种个性化话题文本舆材生成方法及系统


技术介绍

1、现有技术中提供了复杂网络分析方法、文本生成技术、链路预测技术、节点重要性发现技术。

2、复杂网络分析方法、文本生成技术、链路预测技术、节点重要性发现技术等在各自领域均具有优秀的算法,但是未有将这几种技术相结合的应用方案。由于在文本生成应用场景,有时候生成文本内容没有将用户社交关系和情感正负向考虑进去,生成的文本能满足上下文语境,但是未能深刻反应用户的立场和情感,导致生成的文本无法直观贴切的表达用户的观点。

3、总之,现有技术存在的问题及缺陷为:(1)通过舆材文本库内容相似匹配技术和通用语言模型文本生成方法,通常仅考虑文本上下文语义逻辑层面,缺乏其他知识特征信息,存在文本生成不准确的问题。

4、(2)在特定社交关系语境背景下,不同的用户对同一话题理解的表达有着立场和情感的差异,现有的技术专利技术在制作文本内容时,未考虑社交关系网络中用户的属性信息和社交特性,无法做到生成文本的千人千面且准确贴近用户语境。


技术实现思路

1、为克服相关技术中存在的问题,本专利技术公开实施例提供了一种个性化话题文本舆材生成方法及系统。

2、所述技术专利技术如下:一种个性化话题文本舆材生成方法,该方法将话题下有影响力用户发现引入到个性化文本内容生成中,采用图链接预测和节点重要性的图神经网络方法进行重要用户发现,从话题背景稀疏用户社交关系网络中自动发现高价值和重要影响力的用户,作为个性化文本内容生成的使用对象;同时,结合基于深度学习的大规模对话语言模型,融合用户的社交重要性和文本情感正负面性的特征编码表示,自动化生成基于用户社交特性的情感可控个性化文本;

3、具体包括以下步骤:

4、s1,用户社交关系网络构建;

5、s2,基于图链路预测用户社交网络中潜在关系;

6、s3,高社交价值目标发现;

7、s4,结合重要用户属性信息的个性化文本内容生成。

8、进一步的,在步骤s1中,用户社交关系网络构建包括:

9、从社交媒体平台内获取当前时间段内话题事件相关数据,包括帖文和评论话题文本数据,用户点赞、评论、转发互动关系数据,用户的好友列表和关注列表基本信息,将上述话题相关数据存入信息库中;再通过复杂网络分析方法,利用用户的互动关系数据和好友、关注列表,构建以用户为节点的社交关系网络。

10、进一步的,从社交媒体平台内获取当前时间段内话题事件相关数据中,定期对话题事件数据进行更新,更新的数据包括话题文本数据和用户互动关系数据,同步将新数据更新整合到用户社交关系网络中。

11、进一步的,在步骤s2中,基于图链路预测用户社交网络中潜在关系包括:采用plnlp算法来进行链路预测,基于已构建用户社交网络,采用负样本采样策略来抽样正负样本,其中正样本为网络中已存在连边的节点对,负样本是不存在连边关系的节点对;再通过图神经网络编码器对节点对的邻域子图进行编码,提取网络中有用的关系信息特征;

12、节点对编码表示经过链路预测器中的链接评分函数来计算两个节点连边的概率;通过以上计算流程预测出话题背景下已构建的用户社交关系网络中最有可能出现边关系的一批节点对。

13、进一步的,整个链路预测模型的参数学习通过pairwise ranking的目标函数实现。具体包括:

14、该链路预测模型框架包括邻域编码器、链路预测器、负采样和pairwise ranking目标函数,链路预测的目标为正样本(有连边的节点对)的排名比负样本(无连边的节点对)高,pairwise ranking目标函数采用成对学习排名思想对链路预测模型进行参数优化学习,与链路预测的总体目标保持一致。

15、进一步的,在步骤s3中,高社交价值目标发现包括:采用基于图卷积神经网络的节点重要性识别算法发现网络中的关键节点作为个性化舆材生成用户,利用网络拓扑结构中节点的有限阶邻域信息来学习节点的低维向量表示以训练模型,基于链路预测已扩充的用户社交关系网络,采用随机游走算法计算社交关系网络中各节点的邻域网络;基于邻域网络结构信息生成各节点初始嵌入向量表示;通过卷积层获取节点的深层嵌入表示;再使用全连接层预测用户社交关系网络中每个节点的影响力。

16、进一步的,在步骤s3中结合重要用户属性信息的个性化文本内容生成包括:

17、将对话内容、已发现的重要用户的相关属性信息和情感正负面信息共同作为输入数据,通过个性化文本生成模型对输入数据进行处理,生成若干情感可控符合用户语境的文本内容;利用个性化文本生成模型中的自编码器、邻域交互编码器和情感注意力编码器,分别对对话内容、重要用户社交关系属性和情感正负面信息进行编码处理,得到对应的编码特征向量;

18、基于个性化文本生成模型中的特征向量融合模块,对各个编码器输出的编码特征向量进行融合,得到融合特征向量;采用个性化文本生成模型中的解码器,对融合特征向量进行解码;在发现有高社交价值的目标用户后,基于目标用户和其互动好友的社交关系和大规模对话语言模型进行情感正负面文本内容生成。

19、进一步的,生成若干情感可控符合用户语境的文本内容中,已发现的重要用户的相关属性包括用户的好友关系和与用户有互动的用户社交关系,情感正负面信息包含正面和负面2类文本情感倾向性。

20、进一步的,结合模型已学习的用户及其互动关系信息的邻域交互编码器,推理时只需对输入的对话内容和情感正负面信息进行编码,特征融合模块融合将已训练学习的邻域交互编码器进行整合,经过模型解码器,生成若干条情感可控符合用户语境的候选文本内容。

21、本专利技术的另一目的在于提供一种个性化话题文本舆材生成系统,该系统包括:

22、用户社交关系网络构建模块,用于从社交媒体平台内获取当前时间段内话题事件相关数据,将上述话题相关数据存入信息库中;再通过复杂网络分析方法,利用用户的互动关系数据和好友、关注列表,构建以用户为节点的社交关系网络;

23、基于图链路预测用户社交网络中潜在关系模块,用于采用plnlp算法来进行链路预测,预测出话题背景下已构建的用户社交关系网络中最有可能出现边关系的一批节点对;

24、高社交价值目标发现模块,用于采用基于图卷积神经网络的节点重要性识别算法发现网络中的关键节点作为个性化舆材生成用户,利用网络拓扑结构中节点的有限阶邻域信息来学习节点的低维向量表示以训练模型,基于链路预测已扩充的用户社交关系网络,采用随机游走算法计算户社交关系网络中各节点的邻域网络;基于邻域网络结构信息生成各节点初始嵌入向量表示;通过卷积层获取节点的深层嵌入表示;再使用全连接层预测用户社交关系网络中每个节点的影响力;

25、结合重要用户属性信息的个性化文本内容生成模块,用于在发现有高社交价值的目标用户后,基于目标用户和其互动好友的社交关系和大规模对话语本文档来自技高网...

【技术保护点】

1.一种个性化话题文本舆材生成方法,其特征在于,该方法将话题下有影响力用户发现引入到个性化文本内容生成中,采用图链接预测和节点重要性的图神经网络方法进行重要用户发现,从话题背景稀疏用户社交关系网络中自动发现高价值和重要影响力的用户,作为个性化文本内容生成的使用对象;同时,结合基于深度学习的大规模对话语言模型,融合用户的社交重要性和文本情感正负面性的特征编码表示,自动化生成基于用户社交特性的情感可控个性化文本;

2.根据权利要求1所述的个性化话题文本舆材生成方法,其特征在于,在步骤S1中,用户社交关系网络构建包括:

3.根据权利要求2所述的个性化话题文本舆材生成方法,其特征在于,从社交媒体平台内获取当前时间段内话题事件相关数据中,定期对话题事件数据进行更新,更新的数据包括话题文本数据和用户互动关系数据,同步将新数据更新整合到用户社交关系网络中。

4.根据权利要求1所述的个性化话题文本舆材生成方法,其特征在于,在步骤S2中,基于图链路预测用户社交网络中潜在关系包括:采用PLNLP算法来进行链路预测,基于已构建用户社交网络,采用负样本采样策略来抽样正负样本,其中正样本为网络中已存在连边的节点对,负样本是不存在连边关系的节点对;再通过图神经网络编码器对节点对的邻域子图进行编码,提取网络中有用的关系信息特征;

5.根据权利要求4所述的个性化话题文本舆材生成方法,其特征在于,整个链路预测模型的参数学习通过Pairwise Ranking的目标函数实现,具体包括:

6.根据权利要求1所述的个性化话题文本舆材生成方法,其特征在于,在步骤S3中,高社交价值目标发现包括:采用基于图卷积神经网络的节点重要性识别算法发现网络中的关键节点作为个性化舆材生成用户,利用网络拓扑结构中节点的有限阶邻域信息来学习节点的低维向量表示以训练模型,基于链路预测已扩充的用户社交关系网络,采用随机游走算法计算户社交关系网络中各节点的邻域网络;基于邻域网络结构信息生成各节点初始嵌入向量表示;通过卷积层获取节点的深层嵌入表示;再使用全连接层预测用户社交关系网络中每个节点的影响力。

7.根据权利要求1所述的个性化话题文本舆材生成方法,其特征在于,在步骤S3中结合重要用户属性信息的个性化文本内容生成包括:

8.根据权利要求7所述的个性化话题文本舆材生成方法,其特征在于,生成若干情感可控符合用户语境的文本内容中,已发现的重要用户的相关属性包括用户的好友关系和与用户有互动的用户社交关系,情感正负面信息包含正面和负面2类文本情感倾向性。

9.根据权利要求7所述的个性化话题文本舆材生成方法,其特征在于,结合模型已学习的用户及其互动关系信息的邻域交互编码器,推理时只需对输入的对话内容和情感正负面信息进行编码,特征融合模块融合将已训练学习的邻域交互编码器进行整合,经过模型解码器,生成若干条情感可控符合用户语境的候选文本内容。

10.一种个性化话题文本舆材生成系统,其特征在于,实施权利要求1~9任意一项所述的个性化话题文本舆材生成方法,该系统包括:

...

【技术特征摘要】

1.一种个性化话题文本舆材生成方法,其特征在于,该方法将话题下有影响力用户发现引入到个性化文本内容生成中,采用图链接预测和节点重要性的图神经网络方法进行重要用户发现,从话题背景稀疏用户社交关系网络中自动发现高价值和重要影响力的用户,作为个性化文本内容生成的使用对象;同时,结合基于深度学习的大规模对话语言模型,融合用户的社交重要性和文本情感正负面性的特征编码表示,自动化生成基于用户社交特性的情感可控个性化文本;

2.根据权利要求1所述的个性化话题文本舆材生成方法,其特征在于,在步骤s1中,用户社交关系网络构建包括:

3.根据权利要求2所述的个性化话题文本舆材生成方法,其特征在于,从社交媒体平台内获取当前时间段内话题事件相关数据中,定期对话题事件数据进行更新,更新的数据包括话题文本数据和用户互动关系数据,同步将新数据更新整合到用户社交关系网络中。

4.根据权利要求1所述的个性化话题文本舆材生成方法,其特征在于,在步骤s2中,基于图链路预测用户社交网络中潜在关系包括:采用plnlp算法来进行链路预测,基于已构建用户社交网络,采用负样本采样策略来抽样正负样本,其中正样本为网络中已存在连边的节点对,负样本是不存在连边关系的节点对;再通过图神经网络编码器对节点对的邻域子图进行编码,提取网络中有用的关系信息特征;

5.根据权利要求4所述的个性化话题文本舆材生成方法,其特征在于,整个链路预测模型的参数学习通过pairwise ranking的目标函数实现,具体包括:...

【专利技术属性】
技术研发人员:李健曾宇龙马军汪淼郭先会
申请(专利权)人:深圳市网联安瑞网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1