当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于写作风格的多任务谣言检测方法、装置及设备制造方法及图纸

技术编号:33535970 阅读:30 留言:0更新日期:2022-05-19 02:17
本发明专利技术提供一种基于写作风格的多任务谣言检测方法、装置及设备,该方法包括:获取待检测文本,并确定对应的内容特征以及写作风格特征;在多任务检测模型中,将内容特征输入至基于内容的谣言检测任务模块,得到谣言检测结果;将写作风格特征输入至基于写作风格的谣言检测任务模块,得到谣言检测结果;其中,在训练过程中,基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块通过共享层进行信息交互。本发明专利技术采用基于内容和写作风格相结合的多任务谣言检测方法,用以解决现有多任务谣言检测方法两个任务数据结果差异较大以及未能充分利用数据本身数据,导致模型预测性能差的缺陷,提升了模型的谣言检测性能。提升了模型的谣言检测性能。提升了模型的谣言检测性能。

【技术实现步骤摘要】
一种基于写作风格的多任务谣言检测方法、装置及设备


[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于写作风格的多任务谣言检测方法、装置及设备。

技术介绍

[0002]基于写作风格的多任务谣言检测方法的主要技术是基于深度学习的多任务学习技术,其主要目的是借助源推文或微博以及相关评论的写作风格特征或内容特征来判断是否为谣言。
[0003]为了缓解数据量不足对深度学习模型的影响,MTL模型(MTL,Multi

Task Learning,即多任务学习模型)被设计了出来,它可以帮助用户重用现有数据进行学习并降低人工标注数据的成本。因为MTL模型利用来自不同任务的数据,可以学到更健壮、更通用和更强大的多任务模型,从而更好地实现任务之间的知识共享,提高模型性能以及降低过拟合风险,所以MTL的模型的表现往往要优于单任务模型。在MTL的启发下,出现了基于多任务的谣言检测方法,这些多任务谣言检测方法往往是将立场检测任务和谣言检测任务组合在一起形成一个MTL模型,因为那些被证实为谣言的信息在对其的评论中往往会比真实的信息包含更多的质疑或否定内容。
[0004]现有的多任务谣言检测方法,其组成MTL模型的两个任务均是立场检测任务和谣言检测任务。但是,由于两个任务之间的关联性不是很强,且两个任务所使用的数据集差异较大,因此,虽然能共享一部分信息,但其未能够充分利用数据中的有效信息,因此导致模型对谣言检测的性能低。

技术实现思路

[0005]本专利技术提供一种基于写作风格的多任务谣言检测方法、装置及设备,用以解决现有技术中无法最大程度地利用数据集中的有效信息,导致模型对谣言检测的性能低的缺陷,实现克服了现有多任务谣言检测方法两个任务关联性不强,未能充分共享信息,同时,未能充分利用数据,导致模型预测性能差的缺陷,提升了模型的谣言检测性能。
[0006]本专利技术提供一种基于写作风格的多任务谣言检测方法,包括:
[0007]获取待检测文本,并确定所述待检测文本对应的内容特征以及写作风格特征;
[0008]在多任务检测模型中,将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果;
[0009]将所述写作风格特征输入至基于写作风格的谣言检测任务模块,得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果;
[0010]其中,所述多任务检测模型包括基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块;
[0011]其中,在训练过程中,所述基于内容的谣言检测任务模块和所述基于写作风格的谣言检测任务模块通过共享层进行信息交互,在同时训练所述基于内容的谣言检测任务模
块与所述基于写作风格的谣言检测任务模块时基于相同的文本数据集进行训练。
[0012]根据本专利技术提供的一种基于写作风格的多任务谣言检测方法,所述将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果的步骤包括:
[0013]将所述内容特征输入至所述共享层中,得到所述共享层输出的包含共享信息的第一中间向量;
[0014]将所述中间向量和所述内容特征拼接后输入至基于内容的谣言检测任务模块中的内容层,得到所述内容层输出包含共享信息和任务独有信息的第二中间向量;
[0015]将所述第二中间向量输入至所述基于内容的谣言检测任务模块中的全连接层,得到谣言检测结果。
[0016]根据本专利技术提供的一种基于写作风格的多任务谣言检测方法,所述将所述第二中间向量输入至所述基于内容的谣言检测任务模块中的全连接层,得到谣言检测结果的步骤包括:
[0017]将每一个时间步的所述第二中间向量经过句子注意力机制加权求和后得到第三中间向量;
[0018]将所述第三中间向量输入至所述基于内容的谣言检测任务模块中的全连接层,得到谣言检测结果。
[0019]根据本专利技术提供的一种基于写作风格的多任务谣言检测方法,所述将所述写作风格特征输入至基于写作风格的谣言检测任务模块,得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果的步骤包括:
[0020]将所述写作风格特征输入至基于写作风格的谣言检测任务模块中的对齐层,得到所述对齐层输出的已对齐的写作风格特征;
[0021]将已对齐的写作风格特征输入至所述共享层中,得到所述共享层输出的包含共享信息的计算结果;
[0022]将所述计算结果与所述已对齐的写作风格特征输入至所述基于风格的谣言检测任务模块中的风格层,得到所述风格层输出的写作风格特征表示;
[0023]将所述写作风格特征表示输入至所述基于风格的谣言检测任务模块中的全连接层,得到谣言检测结果。
[0024]根据本专利技术提供的一种基于写作风格的多任务谣言检测方法,所述确定所述待检测文本对应的内容特征的步骤包括:
[0025]将所述待检测文本输入至词向量嵌入模型,得到所述词向量嵌入模型输出的词向量矩阵;
[0026]将所述词向量矩阵经过单词注意力机制进行编码后得到所述待检测文本对应的内容特征。
[0027]根据本专利技术提供的一种基于写作风格的多任务谣言检测方法,所述待检测文本包括推文、微博、文章或评论。
[0028]本专利技术还提供一种基于写作风格的多任务谣言检测装置,包括:
[0029]待检测文本获取模块,用于获取待检测文本,并确定所述待检测文本对应的内容特征以及写作风格特征;
[0030]第一预测模块,用于在多任务检测模型中,将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果;
[0031]第二预测模块,用于将所述写作风格特征输入至基于写作风格的谣言检测任务模块,得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果;
[0032]其中,所述多任务检测模型包括基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块;
[0033]其中,在训练过程中,所述基于内容的谣言检测任务模块和所述基于写作风格的谣言检测任务模块通过共享层进行信息交互,在同时训练所述基于内容的谣言检测任务模块与所述基于写作风格的谣言检测任务模块时基于相同的文本数据集进行训练。
[0034]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于写作风格的多任务谣言检测方法的步骤。
[0035]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于写作风格的多任务谣言检测方法的步骤。
[0036]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于写作风格的多任务谣言检测方法的步骤。
[0037]本专利技术提供的一种基于写作风格的多任务谣言检测方法、装置及设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于写作风格的多任务谣言检测方法,其特征在于,包括:获取待检测文本,并确定所述待检测文本对应的内容特征以及写作风格特征;在多任务检测模型中,将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果;将所述写作风格特征输入至基于写作风格的谣言检测任务模块,得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果;其中,所述多任务检测模型包括基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块;其中,在训练过程中,所述基于内容的谣言检测任务模块和所述基于写作风格的谣言检测任务模块通过共享层进行信息交互,在同时训练所述基于内容的谣言检测任务模块与所述基于写作风格的谣言检测任务模块时基于相同的文本数据集进行训练。2.根据权利要求1所述的基于写作风格的多任务谣言检测方法,其特征在于,所述将所述内容特征输入至基于内容的谣言检测任务模块,得到所述基于内容的谣言检测任务模块输出的谣言检测结果的步骤包括:将所述内容特征输入至所述共享层中,得到所述共享层输出的包含共享信息的第一中间向量;将所述中间向量和所述内容特征拼接后输入至基于内容的谣言检测任务模块中的内容层,得到所述内容层输出包含共享信息和任务独有信息的第二中间向量;将所述第二中间向量输入至所述基于内容的谣言检测任务模块中的全连接层,得到谣言检测结果。3.根据权利要求2所述的基于写作风格的多任务谣言检测方法,其特征在于,所述将所述第二中间向量输入至所述基于内容的谣言检测任务模块中的全连接层,得到谣言检测结果的步骤包括:将每一个时间步的所述第二中间向量经过句子注意力机制加权求和后得到第三中间向量;将所述第三中间向量输入至所述基于内容的谣言检测任务模块中的全连接层,得到谣言检测结果。4.根据权利要求1所述的基于写作风格的多任务谣言检测方法,其特征在于,所述将所述写作风格特征输入至基于写作风格的谣言检测任务模块,得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果的步骤包括:将所述写作风格特征输入至基于写作风格的谣言检测任务模块中的对齐层,得到所述对齐层输出的已对齐的写作风格特征;将已对齐的写作风格特征输入至所述共享层中,得到所述共享层输出的包含共享信息的计算结果;将...

【专利技术属性】
技术研发人员:万书振唐斌董方敏王梦园杨广浩
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1