【技术实现步骤摘要】
网络论坛的用户发文说服力预测方法、装置、设备和介质
[0001]本公开涉及自然语言处理领域,特别是涉及一种用于网络论坛的用户发文说服力预测方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着互联网的发展,网络论坛成为一种重要的信息交换渠道,发帖和评论是在论坛中最常见的两个用户行为。用户在论坛中进行信息分享和互动时,一方(即说服者)常常会试图利用带有目的性的发帖或评论促使另一方(被说服者)相信或不相信某事,做或不做某事的目标。例如在网络论坛中,用户通过发文促使其他用户衍生出实际的行动(投票、捐款、转发、甚至购买商品等)。例如,在众筹论坛(KIVA、Reddit网站的Borrow论坛等)中,用户通过发文成功得到了论坛中其他用户的捐赠,即可定义为该用户的发文具有说服力;在ChangeMyView论坛中要求用户在被其他用户的评论成功说服时,必须在论坛中明确发文说明其观点被成功改变;在Debate.org在线论坛中采用投票方式对辩论双方的发文进行投票,得票高的一方即可认为其文本更具有说服力。
[0003]现有的关于说服力的专利文件《基于前序评论的推荐解释说服力判定方法》(CN114663195A)、《用于基于人工智能的计算机辅助说服系统的方法和装置》(CN112488239A),分别针对音频数据、网络电商购物场景。
[0004]通过对评论的文本进行说服力预测,一方面可以识别出潜在的能够改变用户观点的帖子,另一方面通过具有说服力的文本进行分析,有助于分析对不同场景、人群、文本内容的条件下影响说服效果的因 ...
【技术保护点】
【技术特征摘要】
1.一种用于网络论坛的用户发文说服力预测方法,其特征在于,包括:进行数据采集,所述数据采集包括从论坛中获取用户数据;进行用户特征提取;进行文本特征提取,所述文本特征提取包括对帖子和评论的文本特征进行提取;进行各类节点信息聚合,所述各类节点信息聚合包括异构节点、边构建的异构图神经网络,所述异构节点的类型包括用户、评论、帖子,所述边包括帖子、评论、用户间相互关系形成的边,获得聚合各类节点信息的节点嵌入向量;进行说服力预测,所述说服力预测包括利用所述节点嵌入向量作为输入,预测评论节点与帖子节点之间的说服关系。2.一种用于网络论坛的用户发文说服力预测方法,其特征在于,包括:进行数据采集,所述数据采集包括从论坛中获取用户数据;进行用户特征提取,所述用户特征提取包括获得用户心理特征;进行文本特征提取,所述文本特征提取包括对帖子和评论的文本特征进行提取;进行说服力预测,所述说服力预测包括利用用户特征、文本特征作为输入,预测评论与帖子之间的说服关系。3.根据权利要求1中任一项所述的用于网络论坛的用户发文说服力预测方法,其特征在于,所述进行各类节点信息聚合包括:在包含所述异构图神经网络的模型中计算不同类型的节点信息聚合权重,按照对应权重进行各类节点信息的聚合得到聚合后的节点信息;所述计算不同类型的节点信息聚合权重包括利用注意力机制计算不同类型的节点信息聚合权重;所述节点嵌入向量中的节点信息包括用户特征、文本语义特征、文本说服特征、评论与帖子节点关系。4.根据权利要求1
‑
2中任一项所述的用于网络论坛的用户发文说服力预测方法,其特征在于,所述获取用户数据包括从论坛中获取用户发文以及相关用户的历史发文;所述用户特征提取包括获得用户心理特征;所述用户特征提取包括获取该用户在网络论坛上的历史发贴、评论的文本数据,并对文本数据进行处理获得用户特征,输出包含用户人格、心理分析和兴趣爱好的用户特征向量;所述对文本数据进行处理,包括利用基于LIWC文本内容词典和大五人格文本分析模型进行处理。5.根据权利要求1
‑
2中任一项所述的用于网络论坛的用户发文说服力预测方法,其特征在于,所述对帖子和评论的文本特征进行提取包括文本语义特征提取、文本说服特征提取;所述对帖子和评论的文本特征进行提取包括文本主题特征提取;所述文本语义特征提取包括利用Bert双向编码变换表示文本预训练模型对文本数据进行向量化处理,获得语义信息嵌入向量X
w
;所述文本说服特征提取包括提取文本中与说服相关的词语特征,计算文本说服特征向量X
p
;所述文本主题特征提取包括提取文本中的主题特征向量X
t
。6.根据权利要求1所述的用于网络论坛的用户发文说服力预测方法,其特征在于,
所述异构图为异构图G,异构图G定义如下:G={V,E,φ,ψ},其中V为节...
【专利技术属性】
技术研发人员:王逸之,杨翊,陈辉,朱嘉奇,王宏安,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。