一种基于写作风格的多任务谣言检测方法、装置及设备制造方法及图纸

技术编号：33535970 阅读：30 留言：0更新日期：2022-05-19 02:17

本发明专利技术提供一种基于写作风格的多任务谣言检测方法、装置及设备，该方法包括：获取待检测文本，并确定对应的内容特征以及写作风格特征；在多任务检测模型中，将内容特征输入至基于内容的谣言检测任务模块，得到谣言检测结果；将写作风格特征输入至基于写作风格的谣言检测任务模块，得到谣言检测结果；其中，在训练过程中，基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块通过共享层进行信息交互。本发明专利技术采用基于内容和写作风格相结合的多任务谣言检测方法，用以解决现有多任务谣言检测方法两个任务数据结果差异较大以及未能充分利用数据本身数据，导致模型预测性能差的缺陷，提升了模型的谣言检测性能。提升了模型的谣言检测性能。提升了模型的谣言检测性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于写作风格的多任务谣言检测方法、装置及设备

[0001]本专利技术涉及自然语言处理
，尤其涉及一种基于写作风格的多任务谣言检测方法、装置及设备。

技术介绍

[0002]基于写作风格的多任务谣言检测方法的主要技术是基于深度学习的多任务学习技术，其主要目的是借助源推文或微博以及相关评论的写作风格特征或内容特征来判断是否为谣言。
[0003]为了缓解数据量不足对深度学习模型的影响，MTL模型(MTL，Multi
‑
Task Learning，即多任务学习模型)被设计了出来，它可以帮助用户重用现有数据进行学习并降低人工标注数据的成本。因为MTL模型利用来自不同任务的数据，可以学到更健壮、更通用和更强大的多任务模型，从而更好地实现任务之间的知识共享，提高模型性能以及降低过拟合风险，所以MTL的模型的表现往往要优于单任务模型。在MTL的启发下，出现了基于多任务的谣言检测方法，这些多任务谣言检测方法往往是将立场检测任务和谣言检测任务组合在一起形成一个MTL模型，因为那些被证实为谣言的信息在对其的评论中往往会比真实的信息包含更多的质疑或否定内容。
[0004]现有的多任务谣言检测方法，其组成MTL模型的两个任务均是立场检测任务和谣言检测任务。但是，由于两个任务之间的关联性不是很强，且两个任务所使用的数据集差异较大，因此，虽然能共享一部分信息，但其未能够充分利用数据中的有效信息，因此导致模型对谣言检测的性能低。

技术实现思路

[0005]本专利技术提供一种基于写作风格的多任...

【技术保护点】

【技术特征摘要】
1.一种基于写作风格的多任务谣言检测方法，其特征在于，包括：获取待检测文本，并确定所述待检测文本对应的内容特征以及写作风格特征；在多任务检测模型中，将所述内容特征输入至基于内容的谣言检测任务模块，得到所述基于内容的谣言检测任务模块输出的谣言检测结果；将所述写作风格特征输入至基于写作风格的谣言检测任务模块，得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果；其中，所述多任务检测模型包括基于内容的谣言检测任务模块和基于写作风格的谣言检测任务模块；其中，在训练过程中，所述基于内容的谣言检测任务模块和所述基于写作风格的谣言检测任务模块通过共享层进行信息交互，在同时训练所述基于内容的谣言检测任务模块与所述基于写作风格的谣言检测任务模块时基于相同的文本数据集进行训练。2.根据权利要求1所述的基于写作风格的多任务谣言检测方法，其特征在于，所述将所述内容特征输入至基于内容的谣言检测任务模块，得到所述基于内容的谣言检测任务模块输出的谣言检测结果的步骤包括：将所述内容特征输入至所述共享层中，得到所述共享层输出的包含共享信息的第一中间向量；将所述中间向量和所述内容特征拼接后输入至基于内容的谣言检测任务模块中的内容层，得到所述内容层输出包含共享信息和任务独有信息的第二中间向量；将所述第二中间向量输入至所述基于内容的谣言检测任务模块中的全连接层，得到谣言检测结果。3.根据权利要求2所述的基于写作风格的多任务谣言检测方法，其特征在于，所述将所述第二中间向量输入至所述基于内容的谣言检测任务模块中的全连接层，得到谣言检测结果的步骤包括：将每一个时间步的所述第二中间向量经过句子注意力机制加权求和后得到第三中间向量；将所述第三中间向量输入至所述基于内容的谣言检测任务模块中的全连接层，得到谣言检测结果。4.根据权利要求1所述的基于写作风格的多任务谣言检测方法，其特征在于，所述将所述写作风格特征输入至基于写作风格的谣言检测任务模块，得到所述基于写作风格的谣言检测任务模块输出的谣言检测结果的步骤包括：将所述写作风格特征输入至基于写作风格的谣言检测任务模块中的对齐层，得到所述对齐层输出的已对齐的写作风格特征；将已对齐的写作风格特征输入至所述共享层中，得到所述共享层输出的包含共享信息的计算结果；将...

【专利技术属性】
技术研发人员：万书振，唐斌，董方敏，王梦园，杨广浩，
申请(专利权)人：三峡大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人