物联网潜在用户识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:32583559 阅读:59 留言:0更新日期:2022-03-09 17:15
本发明专利技术涉及新一代信息技术,提供了物联网潜在用户识别方法、装置、设备及介质,先基于第一数据集和第二数据集标注样本集和非标注样本集,然后根据标注策略及标注样本集对未标注样本集中各一类型用户数据进行若干次标注得到若干组标注集,之后基于若干组标注集对待训练LightGBM模型进行训练得到分类模型集,最后基于分类模型集对待预测用户数据进行分类结果获取并求平均值得到分类结果平均值,并基于分类结果平均值与分类阈值的比较结果确定标注值。实现了基于第一数据集和第二数据集得到的标注样本集和非标注样本集对多个LightGBM模型进行训练组成分类模型集,并基于分类模型集对待预测用户数据同时进行多模型分类求平均值,得到更加准确的分类结果。得到更加准确的分类结果。得到更加准确的分类结果。

【技术实现步骤摘要】
物联网潜在用户识别方法、装置、计算机设备及存储介质


[0001]本专利技术涉及新一代信息
,尤其涉及一种物联网潜在用户识别方法、装置、计算机设备及存储介质。

技术介绍

[0002]物联网作为新一代信息技术自主创新突破的重点方向,蕴含着巨大的创新空间,在芯片、传感器、近距离传输、海量数据处理以及综合集成、应用等领域,创新活动日趋活跃,创新要素不断积聚。物联网在各行各业的应用不断深化,将催生大量的新技术、新产品、新应用、新模式。
[0003]目前,运营商主要通过客户经理在网上收集目标企业信息、或通过上门拜访等方式了解企业需求,然后再将其需求与运营商产品服务进行匹配,进而判断企业是否为潜在客户、并采取相应的营销活动。但是,这种方法缺乏导向性、极度依赖人工和经验,没有充分地利用到大数据(例如,企业工商数据、运营商存量客户数据等)以及相关技术(例如,机器学习等),所以潜在客户挖掘效率低下、而且易受到主观因素影响导致准确率不高。

技术实现思路

[0004]本专利技术实施例提供了一种物联网潜在用户识别方法、装置、计算机设备及存储本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种物联网潜在用户识别方法,其特征在于,包括:获取第一数据集和第二数据集;其中,所述第一数据集的第一类型用户数据和所述第二数据集中的第二类型用户数据均包括用户唯一识别码;获取所述第一数据集中具有第二类型用户数据的用户唯一识别码的目标第一类型用户数据以组成标注样本集,并由所述标注样本相对于第一数据集的补集获取未标注样本集;将所述标注样本集中的每一条第一类型用户数据根据预设的字段值转换策略转换为相应的第一用户特征向量,并将所述未标注样本集中的每一条第一类型用户数据根据所述字段值转换策略转换为相应的第二用户特征向量;根据预设的标注策略及所述标注样本集对所述未标注样本集中各第一类型用户数据进行若干次标注,得到所述未标注样本集对应的若干组标注集;获取所述未标注样本集对应的若干组标注集中分别对待训练LightGBM模型进行模型训练,得到与若干组标注集分别对应的LightGBM模型,由若干组标注集分别对应的LightGBM模型组成分类模型集;获取待预测用户数据,并根据所述字段值转换策略获取所述待预测用户数据相应的待预测用户特征向量,将所述待预测用户特征向量输入至所述分类模型集中各LightGBM模型进行运算,得到与各LightGBM模型分别对应的分类结果以组成分类结果集;获取所述分类结果集中分类结果的平均值,作为分类结果平均值;以及若确定所述分类结果平均值大于预设的分类阈值,将待预测用户数据的标注值设置为第一标注值。2.根据权利要求1所述的物联网潜在用户识别方法,其特征在于,所述字段值转换策略包括文本型字段值转换子策略、类别型字段值转换子策略和数值型字段值转换子策略;所述文本型字段值转换子策略用于将用户数据中文本型的字段取值转换为特征向量,所述类别型字段值转换子策略用于将用户数据中类别型的字段取值转换为特征向量,所述数值型字段值转换子策略用于将用户数据中数值型的字段取值转换为特征向量。3.根据权利要求2所述的物联网潜在用户识别方法,其特征在于,所述将所述标注样本集中的每一条第一类型用户数据根据预设的字段值转换策略转换为相应的第一用户特征向量,包括:获取所述标注样本集中的第i号第一类型用户数据,并获取所述第i号第一类型用户数据中文本型字段取值集、类别型字段值集和数值型字段取值集;其中,i的初始取值为1且i的取值范围是[1,N1],N1为所述标注样本集中所包括第一类型用户数据的总条数;将所述第i号第一类型用户数据中文本型字段取值集中各文本型字段取值根据所述文本型字段值转换子策略对应转换为第一字段特征向量;将所述第i号第一类型用户数据中类别型字段取值集中各类别型字段取值根据所述类别型字段值转换子策略对应转换为第二字段特征向量;将所述第i号第一类型用户数据中数值型字段取值集中各数值型字段取值根据所述数值型字段值转换子策略对应转换为第三字段特征向量;将所述第i号第一类型用户数据中各字段取值分别对应的第一字段特征向量、第二字段特征向量和第三字段特征向量进行连接,得到所述第i号第一类型用户数据的第i号第一
用户特征向量;将i自增1以更新i的取值;若确定i未超出N1,返回执行所述获取所述标注样本集中的第i号第一类型用户数据,并获取所述第i号第一类型用户数据中文本型字段取值集、类别型字段值集和数值型字段取值集的步骤;若确定i超出N1,将第1号第一用户特征向量至第N1号第一用户特征向量保存。4.根据权利要求1所述的物联网潜在用户识别方法,其特征在于,所述根据预设的标注策略及所述标注样本集对所述未标注样本集中各第一类型用户数据进行若干次标注,得到所述未标注样本集对应的若干组标注集,包括:获取k值,随机生成取值范围在[0,1]的第k组随机数;其中,k的初始取值为1,且k的取值范围是[1,N3],N3为预设的标注总次数;获取所述未标注样本集中的第j号第一类型用户数据相应的第j号第二用户特征向量;其中,j的初始取值为1且j的取值范围是[1,N2],N2为所述未标注样本集中所包括第一类型用户数据的总条数;获取所述第j号第二用户特征向量与所述未标注样本集中其他第一类型用户数据相应的其他第二用户特征向量之间的向量相似度值,并获取所述第j号第二用户特征向量与所述标注样本集中各第一类型用户数据相应第一用户特征向量之间的向量相似度值,得到第j号向量相似度集;获取所述第j号向量相似度集中向量相似度值的降序排名值未超出已存储的排名阈值的目标向量相似度值,及各目标向量相似度值分别对应的目标用户特征向量,组成第j号目标用户特征向量集;根据预设的正例判定策略获取所述第j号目标用户特征向量集中的第j号正例比例,将所述第j号正例比例与取值范围在[0,1]的第k组随机数进行数值大小比较得到第j号比较结果;若第j号比较结果为第j号正例比例大于或等于所述随机数,将所述第j号第一类型用户数据的标注值赋值为1;若第j号比较结果为第j号正例比例小于所述随机数,将所述第j号第一类型用户数据的标注值赋值为

1;将j自增1以更新j的取值;若确定j未超出N2,返回执行所述获取所述未标注样本集中的第j号第一类型用户数据相应的第j号第二用户特征向量的步骤;若确定j超出N2,将第1号第一类型用户数据的标注值至第N2号第N2号第一类型用户数据的标注值均与对应第二用户特征...

【专利技术属性】
技术研发人员:毛江俊曾广宇夏丰盛
申请(专利权)人:天翼物联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1