当前位置: 首页 > 专利查询>厦门大学专利>正文

基于知识约束的两步式辟谣文本生成方法技术

技术编号:30765877 阅读:45 留言:0更新日期:2021-11-10 12:24
基于知识约束的两步式辟谣文本生成方法,涉及自然语言处理领域。针对辟谣文本对外部知识高度依赖以及辟谣长文本生成困难的问题,以谣言为研究对象,基于Transformer的多层解码器架构建立知识文本生成模型,利用知识三元组生成知识文本序列,同时采用pytorch版的GPT2

【技术实现步骤摘要】
基于知识约束的两步式辟谣文本生成方法


[0001]本专利技术涉及自然语言处理领域,尤其是涉及一种基于知识约束的两步式辟谣文本生成方法。

技术介绍

[0002]近年来,随着互联网以及信息技术的高速发展,网络已经成为当今社会最重要信息交流平台。根据“中国互联网络信息中心”发布的报告指出我国网民使用手机上网的比例达到99.3%,网络信息的时效性以及手机的便携性都极大地推动信息传播的效率。然而,随着社交媒体的高速发展,互联网也为谣言的滋生和传播提供丰富的沃土。
[0003]谣言广泛传播后给个人和企业带来的损失,摧毁社会信任体系。因此,谣言相关的研究工作具有很强的现实意义。目前,大多数学者对于谣言的研究主要集中在谣言的特征、谣言的传播模式和谣言的检测等方面,关于自动生成辟谣文本的研究非常有限。
[0004]现有的辟谣工作大多是基于人工的,而人工辟谣工作繁琐,需要消耗大量的人力物力,同时人工辟谣还存在时效性滞后的问题。辟谣文本生技术能够极大降低辟谣工作的人工成本和时间成本,是及时抑制谣言传播、有效降低谣言社会危害性的关键技术。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于知识约束的两步式辟谣文本生成方法,其特征在于包括以下步骤:1)处理数据,得到知识三元组;2)将知识三元组序列传入知识文本生成模型,得到知识文本序列;3)将知识文本序列和谣言文本序列传入辟谣结论生成模型,得到辟谣结论文本序列;4)将谣言文本序列和知识三元组传入辟谣结论生成模型,得到一步式生成的辟谣文本;5)将知识文本序列和辟谣结论文本序列共同作为两步式生成的辟谣文本。2.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤1)中,所述处理数据,得到知识三元组,是利用哈工大开源的LTP模型,先利用LTP模型得到句法分析树,然后以谓词为中心抽取三元组。3.如权利要求1所述这基于知识约束的两步式辟谣文本生成方法,其特征在于在步骤2)中,所述知识文本生成模型采用Transformer多层解码器的架构,在原来tranformer的基础上去掉Encoder

Decoder之间的注意力层,同时更改解码器中的注意力机...

【专利技术属性】
技术研发人员:曹冬林朱多朵李臣林达真
申请(专利权)人:厦门大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1