【技术实现步骤摘要】
一种基于混合聚类的以太坊交易数据脱敏方法及系统
[0001]本专利技术属于数据安全
,具体涉及一种基于混合聚类的以太坊交易数据脱敏方法及系统。
技术介绍
[0002]随着企业数字化转型的深入,数据已然成为了企业运行的重要资产。尤其是随着互联网+、云计算、大数据等信息技术与通信技术的迅猛发展,社会逐步进入了数据时代。
[0003]但是,与之而来的是数据泄露风险的加剧。根据近期发布的《2022年数据泄露成本报告》,数据泄露的平均成本创下435万美元的历史新高,比2021年增长了2.6%,自2020年以来增长了12.7%。经过2022年的研究首次发现,83%受访组织已经不是第一次发生数据泄露事件。
[0004]数据的价值在于流动与融合,但数据的可用范围,正常情况下敏感数据是只能存在于生产环境中,而经过脱敏之后就可以在测试环境中存储、在开发环境中存储以及对外部开放访问,进而可以最大限度保证数据的规范使用和数据价值的安全释放,推动企业的数字化发展、业务增收。
[0005]数据脱敏就是一项重要的数据安全防护 ...
【技术保护点】
【技术特征摘要】
1.一种基于混合聚类的以太坊交易数据脱敏方法,其特征在于,包括:收集以太坊区块链上的公开交易数据并进行清洗和格式化处理,作为初始数据集;将初始数据集导入DBSCAN算法中进行运算,得到聚类的数量以及聚类中心的位置;将聚类的数量以及聚类中心的位置代入到K均值聚类算法中,迭代计算,直至各个数据点与聚类中心的距离不再变化,于是数据被归类至各个集群中;对各个集群进行筛选,剔除其中的异常点,获得待脱敏的常规数据;根据设定的敏感数据脱敏规则,对待脱敏的常规数据进行敏感信息识别和数据脱敏,并将脱敏后的数据输出至受保护的镜像库中。2.根据权利要求1所述的基于混合聚类的以太坊交易数据脱敏方法,其特征在于,K均值聚类算法包括k
‑
means算法。3.根据权利要求1所述的基于混合聚类的以太坊交易数据脱敏方法,其特征在于,所述敏感信息包括交易地址、交易金额和交易时间戳。4.根据权利要求1所述的基于混合聚类的以太坊交易数据脱敏方法,其特征在于,所述数据脱敏包括结合静态数据脱敏引擎处理待脱敏的常规数据,脱敏引擎包括脱敏算法,脱敏算法标记敏感数据并制订敏感数据脱敏规则配置。5.根据权利要求4所述的基于混合聚类的以太坊交易数据脱敏方法,其特征在于,所述脱敏算法通过替换、截断、掩码、重排、日期偏移取整,实现对数据的脱敏。6.根据权利要求1所述的基于混合聚类的以太坊交易数据脱敏方法,其特征在于,还包括判断是否需要动态数据,当需要动态数据时,进行动态脱敏,包括:将动态数据引入代理数据库,重新识别敏感信息,进行再次脱敏,存入镜像库中。7.根据权利要求6所述的基于混合聚类的以太坊交易数...
【专利技术属性】
技术研发人员:刘炳杉,穆文鹏,付章杰,王保卫,高莉莉,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。