【技术实现步骤摘要】
文本信息分类处理方法、电子设备及计算机可读存储介质
本申请实施例涉及互联网
,具体而言,本申请涉及一种基于人工智能技术的互联网文本信息分类处理方法、电子设备及计算机可读存储介质。
技术介绍
随着互联网的快速发展,社交媒体已经成为用户获取信息、表达意见的便捷在线平台。由于社交媒体使用方便且用户众多,导致社交媒体上的信息量飞速增长,飞速增长的信息量中难免存在很多谣言,给社会带来巨大危害。于是,如何快速有效地识别社交媒体上的谣言引起了广泛研究,比如基于传统的机器学习方法的谣言检测,又比如基于各种神经网络的谣言检测。然而,本申请的专利技术人在具体实现过程中发现:传统的机器学习方法虽然在谣言检测问题上取得了一定效果,但其依赖人工提取特征,十分耗时费力;循环神经网络、卷积神经网络等,则忽视了谣言的传播结构所包含的特征,递归神经网络则聚合了更多来自于叶子节点的信息,这与谣言传播过程中越晚发布的帖子的信息量越少相违背,难以提高谣言检测的准确度。
技术实现思路
本申请实施例的目的旨在至少能解决上述的技术缺陷之 ...
【技术保护点】
1.一种文本信息分类处理方法,其特征在于,包括:/n根据目标文本信息的转发关系和回复关系,确定所述目标文本信息的传播结构;/n将所述传播结构输入到双向图卷积神经网络中,得到所述目标文本信息的分类信息,其中,所述分类信息是根据所述双向图卷积神经网络的目标特征信息确定出的,所述双向图卷积神经网络包括自顶向下结构的第一图卷积神经网络和自底向上结构的第二图卷积神经网络,所述目标特征信息是根据第一特征信息和第二特征信息确定出的,所述第一特征信息是根据所述传播结构确定出的所述第一图卷积神经网络的特征信息,所述第二特征信息是根据所述传播结构确定出的所述第二图卷积神经网络的特征信息;/n根 ...
【技术特征摘要】
1.一种文本信息分类处理方法,其特征在于,包括:
根据目标文本信息的转发关系和回复关系,确定所述目标文本信息的传播结构;
将所述传播结构输入到双向图卷积神经网络中,得到所述目标文本信息的分类信息,其中,所述分类信息是根据所述双向图卷积神经网络的目标特征信息确定出的,所述双向图卷积神经网络包括自顶向下结构的第一图卷积神经网络和自底向上结构的第二图卷积神经网络,所述目标特征信息是根据第一特征信息和第二特征信息确定出的,所述第一特征信息是根据所述传播结构确定出的所述第一图卷积神经网络的特征信息,所述第二特征信息是根据所述传播结构确定出的所述第二图卷积神经网络的特征信息;
根据所述分类信息对所述目标文本信息进行分类处理。
2.根据权利要求1所述的方法,其特征在于,根据所述传播结构确定所述第一图卷积神经网络的特征信息,得到所述第一特征信息,包括:
确定所述传播结构的第一邻接矩阵和特征矩阵,所述第一邻接矩阵包括所述传播结构中从上层节点到下层节点之间的各个边,所述特征矩阵包括所述传播结构中每个节点的特征向量,每个节点的特征向量为该每个节点对应的文本的词向量的词频逆文本频率值;
对所述第一邻接矩阵中的部分边进行丢弃,得到第二邻接矩阵;
基于所述特征矩阵和所述第二邻接矩阵,确定所述第一图卷积神经网络的特征信息,得到所述第一特征信息。
3.根据权利要求2所述的方法,其特征在于,根据所述传播结构确定所述第二图卷积神经网络的特征信息,得到所述第二特征信息,包括:
对所述第二邻接矩阵进行转置,得到第三邻接矩阵;
基于所述特征矩阵和所述第三邻接矩阵,确定所述第二图卷积神经网络的特征信息,得到所述第二特征信息。
4.根据权利要求2所述的方法,其特征在于,对所述第一邻接矩阵中的部分边进行丢弃,得到第二邻接矩阵,包括:
丢弃所述第一邻接矩阵中预定数量或预定比例的边,得到所述第二邻接矩阵。
5.根据权利要求2所述的方法,其特征在于,所述基于所述特征矩阵和所述第二邻接矩阵,确定所述第一图卷积神经网络的特征信息,得到所述第一特征信息,包括:
对所述第二邻接矩阵进行正则化,得到正则化后的第二邻接矩阵;
确定所述第一图卷积神经网络的M层图卷积层分别对应的参数矩阵,所述M为正整数;
基于预定计算公式,根据所述正则化后的第二邻接矩阵、所述特征矩阵和所述M层图卷积层分别对应的参数矩阵,确定所述M层图卷积层分别对应的初始特征信息;
根据所述M层图卷积层分别对应的初始特征信息,确定所述第一图卷积神经网络的特征信息,得到所述第一特征信息。
6.根据权利要求5所述的方法,其特征在于,基于预定计算公式,根据所述正则化后的第二邻接矩阵、所述特征矩阵和所述M层图卷积层分别对应的参数矩阵,确定所述M层图卷积层分别对应的初始特征信息,包括:
当M等于1时,基于所述预定计算公式,根据所述正则化后的第二邻接矩阵、所述特征矩阵和第一层图卷积层的参数矩阵,确定第一层图卷积层的初始特征信息;
当M大于1时,基于所述预定计算公式,根据所述正则化后的第二邻接矩阵、第M...
【专利技术属性】
技术研发人员:徐挺洋,卞天,荣钰,黄俊洲,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。