【技术实现步骤摘要】
一种基于电量数据对虚拟货币挖矿用户识别的方法及系统
[0001]本专利技术涉及数据识别
,尤其涉及一种基于电量数据对虚拟货币挖矿用户识别的方法及系统。
技术介绍
[0002]为有效防范处置虚拟货币“挖矿”活动盲目无序发展带来的风险隐患,助力实现碳达峰、碳中和目标,通过用电数据,运用大数据分析手段识别虚拟货币“挖矿”行为将变得尤为重要。本文针对虚拟货币“挖矿”行为用户根据用电量进行识别。
[0003]传统的挖矿用户识别主要依靠人力对电量曲线的观测分析,效率较低,漏查率、错查率高。从挖矿程序中采集挖矿识别特征,获取当前运行在被测主机内存中的内存字符串,通过比较内存字符串中是否包含任一挖矿识别特征,所以难以快速准确识别挖矿用户。
技术实现思路
[0004]本专利技术提供一种基于电量数据对虚拟货币挖矿用户识别的方法及系统,用以解决现有对挖矿用户难以快速识别的缺陷,实现根据用电量分析准确判定使用矿机挖矿用户。
[0005]本专利技术提供一种基于电量数据对虚拟货币挖矿用户识别的方法,包括:
...
【技术保护点】
【技术特征摘要】
1.一种基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,包括:进行数据获取,获取训练组数据和测试组数据;将获取的所述训练组数据和测试组数据进行合并;对合并后的数据中的每张表进行缺失值查看,计算多项指标;将处理后的数据进行切分后,使用随机森林算法进行拟合调参,建立模型并加上自定义规则;使用训练好的随机森林算法模型来进行预测,筛选出疑似用户。2.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述进行数据获取,获取训练组数据和测试组数据,具体包括:所述训练组数据包括:用户档案明细表、日用电量明细表、月用电量明细表、疑似用户明细表;所述测试组数据包括:用户档案明细表、日用电量明细表、月用电量明细表;练组数据和测试组数据中均包括用户月度用电数据、日用电量数据、日峰电量、日谷电量、日平电量、日期数据、用电类型名称和昨日正向费率1、2、3、4电量。3.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述数据合并,将获取的所述训练组数据和测试组数据进行合并,具体包括:首先使用数据分析模块采用归并排序算法,根据用户ID列进行训练组和测试组中各个类型表数据的合并,合并为用户明细表、月用电量明细表、日用电量明细表。4.根据权利要求1所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述数据处理,对合并后的数据中的每张表进行缺失值查看,计算多项指标,具体包括:对用户明细表、月用电量明细表、日用电量明细表中每张表使用isnull.sum()方法进行缺失值查看,发现日用电量表中昨日正向费率存在大量缺失值,理解字段含义缺失值应当为0,故使用0进行填补;月用电量表与用户明细表均不存在缺失数据,计算多项指标值;处理后的数据表中列名分别为用户ID,总计用电量,子电量的变异系数均值,用电类型,昨日正向费率电量,标签值是否为疑似用户。5.根据权利要求4所述的基于电量数据对虚拟货币挖矿用户识别的方法,其特征在于,所述计算多项指标值包括:电量的变异系数均值、月度总用电量、用电类型和昨日正向费...
【专利技术属性】
技术研发人员:邵向荣,周祖煜,张浩,陈煜人,张澎彬,林波,白博文,莫志敏,李天齐,刘俊,
申请(专利权)人:杭州领见数字农业科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。