【技术实现步骤摘要】
一种基于XGBoost算法的区块链产品检测方法、系统及装置
本专利技术属于区块链
,具体涉及区块链产品交易市场中存在的一些欺诈性区块链产品的检测,尤其涉及一种基于XGBoost算法的区块链产品检测方法、系统及装置。
技术介绍
区块链是近十年来互联网与信息
出现的伟大创新,其去中心、避免人为干预、降低成本、提升协同效率等技术优势和广阔应用前景,引发了社会持续而广泛的关注。对区块链市场进行排查整顿是减少、杜绝区块链产品欺诈事件发生的最有效的手段。但由于一方面区块链技术门槛较高,区块链产品数量巨大、类型繁多,缺乏相应技术手段对区块链产品进行检测、排查;另一方面互联网技术使世界变为地球村,各种交易平台和区块链产品遍布于世界的各个角落,增加了监控的难度。目前亟待提出一种检测方法对区块链产品进行判别、检测。XGBoost全名叫(eXtremeGradientBoosting)极端梯度提升,XGBoost算法属于机器学习中的集成学习方法,指将多个学习模型组合,以获得更好的效果,使组合后的模型具有更强的泛化能力。 ...
【技术保护点】
1.一种基于XGBoost算法的区块链产品检测方法,其特征在于,其步骤包括:/n爬取互联网上区块链产品相关数据,并对所述区块链产品贴标签,根据区块链产品与欺诈属性的相互关系,提取区块链产品的相关特征属性,作为XGBoost区块链检测模型的训练样本集;/n对上述爬取的区块链产品特征属性数据进行数据预处理,得到数值化训练样本集;/n将所述数值化训练样本集输入利用XGBoost算法搭建的学习机器,训练区块链产品检测的XGBoost模型树;/n利用所述区块链产品检测的XGBoost模型树对区块链产品进行检测。/n
【技术特征摘要】
1.一种基于XGBoost算法的区块链产品检测方法,其特征在于,其步骤包括:
爬取互联网上区块链产品相关数据,并对所述区块链产品贴标签,根据区块链产品与欺诈属性的相互关系,提取区块链产品的相关特征属性,作为XGBoost区块链检测模型的训练样本集;
对上述爬取的区块链产品特征属性数据进行数据预处理,得到数值化训练样本集;
将所述数值化训练样本集输入利用XGBoost算法搭建的学习机器,训练区块链产品检测的XGBoost模型树;
利用所述区块链产品检测的XGBoost模型树对区块链产品进行检测。
2.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述训练区块链产品检测的XGBoost模型树,具体是从给定的区块链产品训练集构造出来一棵由特征信息组成的决策树,决策树从根节点开始选择特征,选取分裂点进行特征切分。
3.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述提取区块链产品的相关特征属性具体包括:
区块链产品公司信息公开度、区块链产品公司官网信息是否失真、区块链产品公司员工人数、区块链产品研发团队人数、区块链产品白皮书是否存在技术支撑、区块链产品白皮书内容完整度、区块链产品代码在Github是否开源、区块链产品代码更新次数、区块链代码最后更新时间、区块链产品代币比例信息、区块链产品ICO时长、区块链产品购买门槛、区块链产品交易所日均交易量、区块链产品交易月价格波动、区块链产品交易周价格波动、区块链产品交易当前价格以及区块链产品系统宕机频率。
4.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述对上述爬取互联网上区块链产品特征属性数据进行数据预处理,具体包括:
对所述训练样本集的区块链产品特征信息进行数值化处理;
查看训练样本集中是否存在缺失值,对训练样本集中缺失值进行处理,即,将缺失值记作稀疏矩阵,缺失值数据被分到稀疏矩阵的左子树和右子树中并分别计层损失,并选择损失值最小的分配方式;
对处理后的训练样本集进行对数变换,改善训练样本数据均值分布的不对称性;
通过绘制数值型特征的直方图分析特之间服从的分布,以及绘制热度图可视化特征之间的相关性;
将所述区块链产品特征属性数据分成连续特征和离散特征。
5.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述训练区块链产品检测的XGBoost模型树,具体包括...
【专利技术属性】
技术研发人员:黄步添,刘振广,焦颖颖,周伟华,陈建海,
申请(专利权)人:杭州云象网络技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。