网络论坛的用户发文说服力预测方法、装置、设备和介质制造方法及图纸

技术编号:36000140 阅读:13 留言:0更新日期:2022-12-17 23:17
本公开涉及用于网络论坛的用户发文说服力预测方法、装置、计算机设备和存储介质。用于网络论坛的用户发文说服力预测方法包括:进行数据采集;进行用户特征提取;进行文本特征提取;进行各类节点信息聚合,获得节点嵌入向量;进行说服力预测。根据本公开,可以对论坛中帖子的直接评论进行是否具有说服力的预测,能够在线上的商品营销、品牌公关和舆论引导等领域提供帮助。提供帮助。提供帮助。

【技术实现步骤摘要】
网络论坛的用户发文说服力预测方法、装置、设备和介质


[0001]本公开涉及自然语言处理领域,特别是涉及一种用于网络论坛的用户发文说服力预测方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着互联网的发展,网络论坛成为一种重要的信息交换渠道,发帖和评论是在论坛中最常见的两个用户行为。用户在论坛中进行信息分享和互动时,一方(即说服者)常常会试图利用带有目的性的发帖或评论促使另一方(被说服者)相信或不相信某事,做或不做某事的目标。例如在网络论坛中,用户通过发文促使其他用户衍生出实际的行动(投票、捐款、转发、甚至购买商品等)。例如,在众筹论坛(KIVA、Reddit网站的Borrow论坛等)中,用户通过发文成功得到了论坛中其他用户的捐赠,即可定义为该用户的发文具有说服力;在ChangeMyView论坛中要求用户在被其他用户的评论成功说服时,必须在论坛中明确发文说明其观点被成功改变;在Debate.org在线论坛中采用投票方式对辩论双方的发文进行投票,得票高的一方即可认为其文本更具有说服力。
[0003]现有的关于说服力的专利文件《基于前序评论的推荐解释说服力判定方法》(CN114663195A)、《用于基于人工智能的计算机辅助说服系统的方法和装置》(CN112488239A),分别针对音频数据、网络电商购物场景。
[0004]通过对评论的文本进行说服力预测,一方面可以识别出潜在的能够改变用户观点的帖子,另一方面通过具有说服力的文本进行分析,有助于分析对不同场景、人群、文本内容的条件下影响说服效果的因素,此技术能广泛应用线上的商品营销、品牌公关和舆论引导等领域。
[0005]针对网络论坛的用户发文说服力的预测,尚未提出有效的解决方案。

技术实现思路

[0006]基于此,有必要针对上述技术问题,提供用于网络论坛的用户发文说服力预测方法、装置、计算机设备和存储介质。
[0007]在已有的心理学研究中,影响用户说服的一大因素是与说服相关的两方用户的性格特点。对于说服力判断的可解释性上,相同的文本描述从不同的用户发出,对于不同的受众影响应当是不同的。
[0008]本公开重点在解决论坛中某用户发表的有争议性的文章能否被其他用户的发文说服的预测问题。
[0009]例如:用户A发表帖子P
a
,用户B针对帖子P
a
发表带有对立观点的评论C
b
,本方法可用于预测C
b
能否成功说服用户A发的帖子P
a

[0010]针对于传统技术的缺点,本方法分别对发文(贴子和评论)的文本提取语义、说服策略、主题等信息,对发文(贴子或评论)的作者提取心理属性、爱好等特征。将用户和不同类型的发文(帖子和评论)定义为不同类型的节点并利用其相互关系构建异构图,将提取的
各类特征作为节点的属性,在异构图网络中应用注意力机制对各类节点进行信息聚合。
[0011]根据本公开的第一方面,提供了一种用于网络论坛的用户发文说服力预测方法,其特征在于,包括:进行数据采集,数据采集包括从论坛中获取用户数据;进行用户特征提取;进行文本特征提取,文本特征提取包括对帖子和评论的文本特征进行提取;进行各类节点信息聚合,各类节点信息聚合包括异构节点、边构建的异构图神经网络,异构节点的类型包括用户、评论、帖子,边包括帖子、评论、用户间相互关系形成的边,获得包含节点信息的节点嵌入向量;进行说服力预测,说服力预测包括利用节点嵌入向量作为输入,预测评论节点与帖子节点之间的说服关系。
[0012]本公开还提供了一种用于网络论坛的用户发文说服力预测方法,其特征在于,包括:进行数据采集,数据采集包括从论坛中获取用户数据;进行用户特征提取,用户特征提取包括获得用户心理特征;进行文本特征提取,文本特征提取包括对帖子和评论的文本特征进行提取;进行说服力预测,说服力预测包括利用用户特征、文本特征作为输入,预测评论与帖子之间的说服关系。
[0013]在一些实施例中,进行各类节点信息聚合包括:在包含异构图神经网络的模型中计算不同类型的节点信息聚合权重,按照对应权重进行各类节点信息的聚合得到聚合后的节点信息。
[0014]在一些实施例中,计算不同类型的节点信息聚合权重包括利用注意力机制计算不同类型的节点信息聚合权重。
[0015]在一些实施例中,节点嵌入向量中的节点信息包括用户特征、文本语义特征、文本说服特征、评论与帖子节点关系。
[0016]在一些实施例中,获取用户数据包括从论坛中获取用户发文以及相关用户的历史发文。
[0017]在一些实施例中,用户特征提取包括获得用户心理特征。
[0018]在一些实施例中,用户特征提取包括获取该用户在网络论坛上的历史发贴、评论的文本数据,并对文本数据进行处理获得用户特征,输出包含用户人格、心理分析和兴趣爱好等固有属性的用户特征向量。
[0019]在一些实施例中,对文本数据进行处理,包括利用基于LIWC文本内容词典和大五人格文本分析模型进行处理。
[0020]在一些实施例中,对帖子和评论的文本特征进行提取包括文本语义特征提取、文本说服特征提取;优选包括文本语义特征提取、文本说服特征提取、文本主题特征提取。
[0021]在一些实施例中,文本语义特征提取包括利用Bert双向编码变换表示文本预训练模型对文本数据进行向量化处理,获得语义信息嵌入向量X
w
;文本说服特征提取包括提取文本中与说服相关的词语特征,计算文本说服特征向量X
p
;作为优选文本主题特征提取进一步包括提取文本中的主题特征向量X
t

[0022]在一些实施例中,异构图为异构图G,异构图G定义如下:
[0023]G={V,E,φ,ψ},其中V为节点集合,E为边集合,φ为节点属性集合,ψ为边属性集合;
[0024]每个节点v属于类型φ(v):每个节点v属于类型φ(v):是节点类型集合,包含用户、评论、
帖子,优选进一步包含主题;
[0025]定义每个边e属于类型ψ(e):定义每个边e属于类型ψ(e):是边类型集合,包含用户

帖子、用户

评论、帖子

评论的关系集,优选进一步包含用户

主题、评论

主题的关系集。
[0026]在一些实施例中,说服力预测包括通过如下公式计算说服概率:
[0027]定义节点k是否说服对应的F
p
(k)节点的概率为Pred
k

[0028]定义评论节点k对应的Post帖子类型的节点j关系表示:
[0029]j=F
p
(k),φ(j)∈Posts,φ(k)∈Comments
[0030]Pred
k
计算公式:
[0031][0032]在一些实施例中,异构节点的类型包括用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于网络论坛的用户发文说服力预测方法,其特征在于,包括:进行数据采集,所述数据采集包括从论坛中获取用户数据;进行用户特征提取;进行文本特征提取,所述文本特征提取包括对帖子和评论的文本特征进行提取;进行各类节点信息聚合,所述各类节点信息聚合包括异构节点、边构建的异构图神经网络,所述异构节点的类型包括用户、评论、帖子,所述边包括帖子、评论、用户间相互关系形成的边,获得聚合各类节点信息的节点嵌入向量;进行说服力预测,所述说服力预测包括利用所述节点嵌入向量作为输入,预测评论节点与帖子节点之间的说服关系。2.一种用于网络论坛的用户发文说服力预测方法,其特征在于,包括:进行数据采集,所述数据采集包括从论坛中获取用户数据;进行用户特征提取,所述用户特征提取包括获得用户心理特征;进行文本特征提取,所述文本特征提取包括对帖子和评论的文本特征进行提取;进行说服力预测,所述说服力预测包括利用用户特征、文本特征作为输入,预测评论与帖子之间的说服关系。3.根据权利要求1中任一项所述的用于网络论坛的用户发文说服力预测方法,其特征在于,所述进行各类节点信息聚合包括:在包含所述异构图神经网络的模型中计算不同类型的节点信息聚合权重,按照对应权重进行各类节点信息的聚合得到聚合后的节点信息;所述计算不同类型的节点信息聚合权重包括利用注意力机制计算不同类型的节点信息聚合权重;所述节点嵌入向量中的节点信息包括用户特征、文本语义特征、文本说服特征、评论与帖子节点关系。4.根据权利要求1

2中任一项所述的用于网络论坛的用户发文说服力预测方法,其特征在于,所述获取用户数据包括从论坛中获取用户发文以及相关用户的历史发文;所述用户特征提取包括获得用户心理特征;所述用户特征提取包括获取该用户在网络论坛上的历史发贴、评论的文本数据,并对文本数据进行处理获得用户特征,输出包含用户人格、心理分析和兴趣爱好的用户特征向量;所述对文本数据进行处理,包括利用基于LIWC文本内容词典和大五人格文本分析模型进行处理。5.根据权利要求1

2中任一项所述的用于网络论坛的用户发文说服力预测方法,其特征在于,所述对帖子和评论的文本特征进行提取包括文本语义特征提取、文本说服特征提取;所述对帖子和评论的文本特征进行提取包括文本主题特征提取;所述文本语义特征提取包括利用Bert双向编码变换表示文本预训练模型对文本数据进行向量化处理,获得语义信息嵌入向量X
w
;所述文本说服特征提取包括提取文本中与说服相关的词语特征,计算文本说服特征向量X
p
;所述文本主题特征提取包括提取文本中的主题特征向量X
t
。6.根据权利要求1所述的用于网络论坛的用户发文说服力预测方法,其特征在于,
所述异构图为异构图G,异构图G定义如下:G={V,E,φ,ψ},其中V为节...

【专利技术属性】
技术研发人员:王逸之杨翊陈辉朱嘉奇王宏安
申请(专利权)人:中国科学院软件研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1