流式大数据安全处理方法技术

技术编号：22308878 阅读：34 留言：0更新日期：2019-10-16 08:57

本发明专利技术提供了一种流式大数据安全处理方法，该方法包括：基于社交网络拓扑，计算用户节点的局部向心度特征；计算每个用户每次发布的会话内容之间的相似度，通过设置风险判别阈值，确定局部向心度低于预设阈值并且会话内容相似度高于预设阈值的用户节点，将其识别为失信用户。本发明专利技术提出了一种流式大数据安全处理方法，减少了待分析用户行为特征的数量，消除了特征间的冗余，采用的分类模型更加高效实用，有效地提高信用评估的速度以及评估的准确性，更好地适应了海量数据的流式计算场景。

Security processing method of streaming big data

全部详细技术资料下载

【技术实现步骤摘要】
流式大数据安全处理方法
本专利技术涉及网络安全，特别涉及一种流式大数据安全处理方法。
技术介绍
互联网通信及大数据技术的发展为确定用户信用等级提供了坚实的数据和技术基础。根据研究发现，用户的互联网行为是人的行为在互联网载体上的实现形式，其本质与社会行为一致，且资产、经营状况的变化会通过其网络行为体现出来。而网络行为数据所表现出的社交关系更被认为与用户征信具有强相关性，因此用户信用不仅存在于财务报表、抵押业务信息之中，而且还可体现在相关的用户行为数据、社会关系等非结构化数据中。这些数据会持续不断产生并输入数据分析和挖掘引擎。与传统数据相比，流式数据呈现出实时性、易失性、突发性、无序性和无限性等特征。由于互联网业务对系统响应时间的高要求，这些数据往往需要实时的分析和计算。因此在互联网海量的流式数据环境下，如何提高用户信用的计算准确率和实时性，成为了大数据分析领域中急需解决的主要问题。在网络规模呈几何级增长的今天，被检测的数据量极其庞大，传统的网络分析监测工具和平台很难应付；并且存储和处理大量的社交网络数据会耗费大量的资源和时间。但随着用户行为和社交关系的日趋复杂化，现有的方法已无法实现风险用户行为特征的识别以及对失信用户进行的控制管理，并导致计算时间滞后。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种流式大数据安全处理方法，包括：基于社交网络拓扑，计算用户节点的局部向心度特征；所述社交关系网络拓扑的节点表示用户，边表示用户之间的社交关系；所述节点的局部向心度表示从网络图移除该节点后，网络的关联能量下降的程度；其中社交网络图G的关联能量被定义为...

【技术保护点】
1.一种流式大数据安全处理方法，其特征在于，包括：基于社交网络拓扑，计算用户节点的局部向心度特征；所述社交关系网络拓扑的节点表示用户，边表示用户之间的社交关系；所述节点的局部向心度表示从网络图移除该节点后，网络的关联能量下降的程度；其中社交网络图G的关联能量被定义为：EL(G)＝∑θ

【技术特征摘要】
1.一种流式大数据安全处理方法，其特征在于，包括：基于社交网络拓扑，计算用户节点的局部向心度特征；所述社交关系网络拓扑的节点表示用户，边表示用户之间的社交关系；所述节点的局部向心度表示从网络图移除该节点后，网络的关联能量下降的程度；其中社交网络图G的关联能量被定义为：EL(G)＝∑θ2θ表示图G的基尔霍夫矩阵的特征值；所述图G的基尔霍夫矩阵为L(G)＝D(G)-A(G)；A(G)是图形G的邻接矩阵，D(G)是顶点出度的对角矩阵。对于有n个节点，出度分别为d1，d2，…，dn的拓扑图G，其关联能量为在社交关系网络中，用节点表示用户，边表示社交关系。从节点Vi指向节点Vj的边a＝(i,j)表示用户i与j存在至少一个会话。。将...

【专利技术属性】
技术研发人员：马涛，
申请(专利权)人：成都威嘉软件有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人