一种基于深度学习的区块链违法信息感知方法技术

技术编号：32225966 阅读：15 留言：0更新日期：2022-02-09 17:30

本发明专利技术公开了一种基于深度学习的区块链违法信息感知方法，包括如下步骤：1）收集链上信息；2）文本特征提取；3）图片特征提取；4）特征融合；5）利用训练集对步骤1）

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的区块链违法信息感知方法

[0001]本专利技术涉及深度学习的信息感知技术，具体为一种基于深度学习的区块链违法信息感知方法。

技术介绍

[0002]网络的快速发展和普及产生海量数据，随之而来的是数据类型繁杂、信息规模庞大等问题。在信息感知识别领域，因非法组织与违法活动产生的数据分散、范围广，加之非结构化数据逐渐增多，导致治理行动受阻，这是安全监管行动部门关注的焦点问题。
[0003]在网络违法信息分析领域，针对网络信息流量大流速快的问题，目前并没有特别高效的解决方案能够准确捕获和分析有用信息，主要涉及到两个方面的因素：一是数据量过大，即处理对象难以确定和获取；二是由于人工智能技术近年发展迅速，网民对于传统模型接触较多已能够通过同义(同音，同形)词替换来达到避开人工智能模型的检测。从本质上来看这两个难点均反映出情报工作对数据处理技术的高要求，相较于其他机器学习方法，多编码融合的深度学习算法鼓励大数据集的收集并能够在训练过程中集成特征提取，对链上信息进行多角度综合分析，有效提高信息判断的准确性，从而更方便有效的对链上信息进行管理。

技术实现思路

[0004]本专利技术的目的是针对现有技术的不足，而提供一种基于深度学习的区块链违法信息感知方法。这种方法判断更安全准确可靠。
[0005]实现本专利技术目的的技术方案是：
[0006]一种基于深度学习的区块链违法信息感知方法，包括如下步骤：
[0007]1)收集链上信息，将收集到的信息按照是否违法的标签进行分类制成...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的区块链违法信息感知方法，其特征在于，包括如下步骤：1)收集链上信息，将收集到的信息按照是否违法的标签进行分类制成链上信息数据集，此数据集作为训练集；2)文本特征提取：21)从链上信息的数据集中单独提取文本信息；22)分词：利用jieba分词器对每一段文本进行分词，使其变为各个词组；23)编码：将词组按照词义、词形和词音分别进行编码，将三种编码按权重进行融合处理；编码步骤如下：231)词义编码：采用skip
‑
gram模型应用于学习连续语义词向量，记作T
m
；232)词形编码：先将各词组转化为图片，再采用DLET模型去提取词组的图形特征作为词形向量，记作T
g
；233)词音编码：使用拼音来注释其发音，并且保留文本中的非汉字，然后获得了包含N个拼音形式的N个字符的新序列，最后将词义编码中使用的skip
‑
gram模型应用于将拼音字符形式嵌入到d维度的语音词向量中，记T
v
；234)将词义词向量T
m
，词音词向量T
v
和词形向量T
g
进行级联得到T＝[T
m
,T
v
,T
g
]；235)将级联后的特征向量T利用softmax函数计算图特征向量和文本特征向量各自的权重；236)用步...

【专利技术属性】
技术研发人员：梁海，丁勇，苏子秋，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人