当前位置: 首页 > 专利查询>清华大学专利>正文

地址类型识别方法及装置制造方法及图纸

技术编号:29463467 阅读:93 留言:0更新日期:2021-07-27 17:35
本申请实施例提供一种地址类型识别方法及装置,该方法包括:将无标签的第一地址数据作为预测模型的输入,以使预测模型输出第一地址数据对应的第一地址类型。根据第一地址数据以及第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各扩充地址数据分别对应各自的扩充地址类型。根据多个扩充地址数据对预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,目标模型用于输出地址数据对应的地址类型。通过对获得地址类型的第一地址数据进行扩充处理,得到多个扩充地址数据,这扩大了有标签地址数据的数据量。同时,根据多个扩充地址数据对进预测模型进行多轮训练,提高了预测模型的预测准确率。

Address type identification method and device

【技术实现步骤摘要】
地址类型识别方法及装置
本申请实施例涉及计算机技术,尤其涉及一种地址类型识别方法及装置。
技术介绍
比特币地址类型能够反映交易的特点以及安全性,因此对比特币地址类型进行识别,可以有效提升比特币地址的安全性。目前,在相关技术中,在对比特币的地址类型进行识别时,通常是直接从地址的交易历史记录中提取统计特征,利用基于机器学习的预测模型来预测地址类型,其中,预测模型是根据已知地址类型的地址数据训练得到的。然而,当已知类型的地址数据的数据量较小时,无法保证预测模型输出的地址类型的正确性,从而导致地址类型识别的准确率较低。
技术实现思路
本申请实施例提供一种地址类型识别方法及装置,以增加有标签地址数量、提高地址类型预测模型的预测准确率。第一方面,本申请实施例提供一种地址类型识别方法,包括:将无标签的第一地址数据作为预测模型的输入,以使所述预测模型输出所述第一地址数据对应的第一地址类型;根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各所述扩充地址数据分别对应各自的扩充地址类型;根据所述多个扩充地址数据对所述预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,所述目标模型用于输出地址数据对应的地址类型。在一种可能的设计中,每轮训练包括如下步骤:根据所述多个扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练。在一种可能的设计中,所述根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练,包括:将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测地址类型;根据各所述扩充地址数据各自对应的预测地址类型以及各所述扩充地址数据各自对应的扩充地址类型,确定损失函数值;根据所述损失函数值,对所述预测模型的参数进行调整。在一种可能的设计中,所述根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据之前,所述方法还包括:对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。在一种可能的设计中,所述对所述第一地址数据对应的第一地址类型进行校验,得到校验结果,包括:根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到所述第一地址类型对应的多个扩充地址数据;根据各所述扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测扩充地址类型;根据各所述扩充地址数据各自对应的预测扩充地址类型,对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。在一种可能的设计中,所述根据各所述扩充地址数据各自对应的预测扩充地址类型,对所述第一地址数据对应的第一地址类型进行校验,得到校验结果,包括:在各所述扩充地址数据各自对应的预测扩充地址类型中,确定出现次数最多的目标地址类型;判断所述第一地址类型和所述目标地址类型是否相同;若相同,则确定所述校验结果为校验通过,将所述第一地址数据对应的多个扩充地址数据以及所述多个扩充数据各自对应的特征数据保存下来;若不相同,则确定所述校验结果为校验不通过,将所述第一地址数据、所述第一地址数据对应的多个扩充地址数据以及所述多个扩充数据各自对应的特征数据丢弃。在一种可能的设计中,所述将无标签的第一地址数据作为预测模型的输入,以使所述预测模型输出所述第一地址数据对应的第一地址类型之前,所述方法还包括:构建预测模型;获取至少一个训练样本,各所述训练样本中包括训练地址数据以及所述训练地址数据对应的训练地址类型;根据所述至少一个训练样本进行扩充处理,得到多个扩充样本,各所述扩充样本中包括样本地址数据以及所述样本地址数据对应的样本地址类型;根据所述至少一个训练样本和所述多个扩充样本对所述预测模型进行训练,得到训练后的预测模型。第二方面,本申请实施例提供一种地址类型识别装置,包括:预测模块,用于将无标签的第一地址数据作为预测模型的输入,以使所述预测模型输出所述第一地址数据对应的第一地址类型;扩充模块,用于根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各所述扩充地址数据分别对应各自的扩充地址类型;训练模块,用于根据所述多个扩充地址数据对所述预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,所述目标模型用于输出地址数据对应的地址类型。在一种可能的设计中,每轮训练包括如下步骤:根据所述多个扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练。在一种可能的设计中,所述训练模块具体用于:将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测地址类型;根据各所述扩充地址数据各自对应的预测地址类型以及各所述扩充地址数据各自对应的扩充地址类型,确定损失函数值;根据所述损失函数值,对所述预测模型的参数进行调整。所述装置还包括校验模块;在一种可能的设计中,所述校验模块具体用于:对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。在一种可能的设计中,所述校验模块具体用于:根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到所述第一地址类型对应的多个扩充地址数据;根据各所述扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测扩充地址类型;根据各所述扩充地址数据各自对应的预测扩充地址类型,对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。在一种可能的设计中,所述校验模块具体用于:在各所述扩充地址数据各自对应的预测扩充地址类型中,确定出现次数最多的目标地址类型;判断所述第一地址类型和所述目标地址类型是否相同;若相同,则确定所述校验结果为校验通过;若不相同,则确定所述校验结果为校验不通过;若相同,则确定所述校验结果为校验通过,将所述第一地址数据对应的多个扩充地址数据以及所述多个扩充数据各自对应的特征数据保存下来;若不相同,则确定所述校验结果为校验不通过,将所述第一地址数据、所述第一地址数据对应的多个扩充地址数据以本文档来自技高网...

【技术保护点】
1.一种地址类型识别方法,其特征在于,包括:/n将无标签的第一地址数据作为预测模型的输入,以使所述预测模型输出所述第一地址数据对应的第一地址类型;/n根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各所述扩充地址数据分别对应各自的扩充地址类型;/n根据所述多个扩充地址数据对所述预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,所述目标模型用于输出地址数据对应的地址类型。/n

【技术特征摘要】
1.一种地址类型识别方法,其特征在于,包括:
将无标签的第一地址数据作为预测模型的输入,以使所述预测模型输出所述第一地址数据对应的第一地址类型;
根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据,各所述扩充地址数据分别对应各自的扩充地址类型;
根据所述多个扩充地址数据对所述预测模型进行多轮迭代训练,直至得到输出准确率大于或等于预设准确率的目标模型,其中,所述目标模型用于输出地址数据对应的地址类型。


2.根据权利要求1所述的方法,其特征在于,每轮训练包括如下步骤:
根据所述多个扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;
根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练。


3.根据权利要求2所述的方法,其特征在于,所述根据各所述扩充地址数据各自对应的特征数据对所述预测模型进行训练,包括:
将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测地址类型;
根据各所述扩充地址数据各自对应的预测地址类型以及各所述扩充地址数据各自对应的扩充地址类型,确定损失函数值;
根据所述损失函数值,对所述预测模型的参数进行调整。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一地址数据以及所述第一地址数据对应的第一地址类型进行扩充处理,得到多个扩充地址数据之后,所述方法还包括:
对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。


5.根据权利要求4所述的方法,其特征在于,所述对所述第一地址数据对应的第一地址类型进行校验,得到校验结果,包括:
根据所述第一地址数据对应的多个扩充地址数据分别进行特征提取处理,得到各所述扩充地址数据各自对应的特征数据;
将各所述扩充地址数据各自对应的特征数据分别输入至所述预测模型中,以使得所述预测模型输出各所述扩充地址数据各自对应的预测扩充地址类型;
根据各所述扩充地址数据各自对应的预测扩充地址类型,对所述第一地址数据对应的第一地址类型进行校验,得到校验结果。


6.根据权利要求5所述的方法,其特征在于...

【专利技术属性】
技术研发人员:张超王大宇尹霞
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1