无宽带用户的确定方法、装置及可读存储介质制造方法及图纸

技术编号:36688451 阅读:11 留言:0更新日期:2023-02-27 19:53
本申请公开了一种无宽带用户的确定方法、装置及可读存储介质,涉及通信技术领域,用于准确的确定无宽带用户。该方法包括:获取多个待识别用户在第一预设时间段内的业务数据;根据每个待识别用户的业务数据确定每个待识别用户的多个特征值,多个特征值包括第一数值、第二数值和第三数值;针对第一特征值,根据第一特征值及对应的特征阈值确定第一预测结果,得到与多个特征值一一对应的多个第一预测结果,第一特征值为多个特征值中的任一个;根据预设的预测模型及多个待识别用户的业务数据确定第二预测结果;根据预设投票机制、第一预测结果及第二预测结果,从多个待识别用户中确定无宽带用户。定无宽带用户。定无宽带用户。

【技术实现步骤摘要】
无宽带用户的确定方法、装置及可读存储介质


[0001]本申请实施例涉及通信
,尤其涉及一种无宽带用户的确定方法、装置及可读存储介质。

技术介绍

[0002]随着高清视频、云游戏、智慧家庭等新场景的不断成熟,宽带业务发展仍具有较大的潜力,如何准确确定用户家中是否已安装家庭宽带,是制约宽带业务发展的主要问题。
[0003]现有的确定用户家中是否已安装家庭宽带主要是根据安装宽带时的统计信息进行判断,然而安装宽带时的统计信息仅包括宽带联系人的信息,除宽带联系人之外,还包括大量不需要安装宽带的宽带联系人的家庭用户,以及具有未安装家庭宽带的目标用户,如何准确的确定未安装家庭宽带的目标用户是亟待解决的技术问题。

技术实现思路

[0004]本申请提供了一种无宽带用户的确定方法、装置及可读存储介质,用于准确的确定未安装家庭宽带的目标用户。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,提供了一种无宽带用户的确定方法,包括:获取多个待识别用户在第一预设时间段内的业务数据,业务数据包括运营支持系统O域数据和业务支持系统B域数据;根据每个待识别用户的业务数据确定每个待识别用户的多个特征值,多个特征值包括第一数值、第二数值和第三数值;第一数值为第一目标天数与第一预设时间段的比值,第二数值为第二目标天数与第一预设时间段的比值,第三数值为第三目标天数与第一预设时间段的比值,第一目标天数为每个待识别用户的第二预设时间段的流量与全天流量之比大于或等于第一阈值的天数,第二目标天数为每个待识别用户的第二预设时间段的流量与第三预设时间段的流量之比大于或等于第二阈值的天数,第三目标天数为每个待识别用户的第二预设时间段的流量与宽带用户的第二预设时间段的流量的平均数之比大于或等于第三阈值的天数;针对第一特征值,根据第一特征值及对应的特征阈值确定第一预测结果,得到与多个特征值一一对应的多个第一预测结果,第一特征值为多个特征值中的任一个;第一预测结果用于表征每个待识别用户为无宽带用户的概率得分;根据预设的预测模型及多个待识别用户的业务数据确定第二预测结果;根据预设投票机制、多个第一预测结果及第二预测结果,从多个待识别用户中确定无宽带用户。
[0007]基于本申请实施例提供的技术方案,确定装置可以通过多个待识别用户的业务数据,确定每个待识别用户的多个特征值,多个特征值包括第一数值、第二数值和第三数值,由于多个特征值中的第一数值和第二数值可以反映待识别用户在第一预设时间段内第二预设时间段的流量的使用占比大于预设值的天数,如此,可以确定待识别用户在不同时段的流量使用习惯。考虑到无宽带用户只能使用移动流量进行生活娱乐等活动,确定装置确定多个特征值中的第三数值,以反映待识别用户在第一预设时间段内第二预设时间段的流
量与宽带用户在第一预设时间段内第二预设时间段的流量的大小关系。在得到每个待识别用户的多个特征值,可以通过每个特征值及对应的特征阈值确定与多个特征值一一对应的多个第一预测结果。另外,确定装置还可以通过预设的预测模型确定第二预测结果。并通过预设投票机制、第一预测结果和第二预测结果从多个待识别用户中确定无宽带用户。如此,确定装置从多角度对多个待识别用户的业务数据进行分别,可以准确的从多个待识别用户中确定无宽带用户。
[0008]可选的,根据第一特征值及对应的特征阈值确定第一预测结果,包括:对多个待识别用户的第一特征值进行排序,以确定第一待识别用户的第一特征值排名,第一待识别用户为多个待识别用户中的任一个;在第一待识别用户的第一特征值排名大于或等于第四阈值的情况下,确定第一待识别用户为无宽带用户。
[0009]如此,确定装置可以确定每个待识别用户得多个特征值一一对应的第一预测结果。由于一一对应的第一预测结果从不同角度确定待识别用户确定是否为无宽带用户,避免单一角度预测无宽带用户准确率不高的问题,可以准确的确定多个待识别用户中的无宽带用户。
[0010]可选的,第二预测结果包括第一子预测结果和/或第二子预测结果,第一子预测结果用于表征每个待识别用户为无宽带用户的概率得分;第二子预测结果用于表征每个待识别用户为宽带用户的概率得分;根据预设的预测模型及业务数据确定第二预测结果,包括:根据多个待识别用户的业务数据和第一预测模型确定第一子预测结果;和/或,根据多个待识别用户的业务数据和第二预测模型确定第二子预测结果;其中,第一预测模型对应的正向结果为第四数值,第二预测模型对应的负向结果为第四数值,正向结果用于表示待识别用户为无宽带用户,负向结果用于表示待识别用户为宽带用户。
[0011]如此,通过设置不同的正负样本标识,选择差异化的特征,可以训练出不同的最优参数得到第一预测模型和第二预测模型。可以避免样本不均衡导致的比例大的样本造成过拟合,进而提高了确定无宽带用户的准确率。
[0012]可选的,在第二预测结果不包括第二子预测结果的情况下,根据预设投票机制、多个第一预测结果及第二预测结果,从多个待识别用户中确定无宽带用户,包括:针对第一待识别用户,若第一预测结果、以及第一子预测结果中预测第一待识别用户为无宽带用户的得分之和大于或等于第五阈值,则确定第一待识别用户为无宽带用户。
[0013]如此,由于多种预测结果都是从不同角度确定待识别用户确定是否为无宽带用户,确定装置可以利用预设的投票机制对多种预测结果进行汇总分析,最终确定待识别用户是否为无宽带用户,避免单一角度预测无宽带用户准确率不高的问题,可以准确的确定多个待识别用户中的无宽带用户。
[0014]可选的,在第二预测结果包括第二子预测结果的情况下,根据预设投票机制、多个第一预测结果及第二预测结果,从多个待识别用户中确定无宽带用户,包括:对第二子预测结果进行数值转换,数值转换后的第二子预测结果用于表征每个待识别用户为无宽带用户的概率得分;针对第一待识别用户,若目标预测结果预测第一待识别用户为无宽带用户的得分之和大于或等于第五阈值,则确定第一待识别用户为无宽带用户,目标预测结果至少包括第一预测结果和数值转换后的第二子预测结果。
[0015]如此,由于多种预测结果都是从不同角度确定待识别用户确定是否为无宽带用
户,确定装置可以利用预设的投票机制对多种预测结果进行汇总分析,得到最终待识别用户是否为无宽带用户的预测结果,避免单一角度预测无宽带用户准确率不高的问题,可以准确的确定多个待识别用户中的无宽带用户。
[0016]第二方面,提供了一种无宽带用户的确定装置,包括获取单元、确定单元;获取单元,用于获取多个待识别用户在第一预设时间段内的业务数据,业务数据包括运营支持系统O域数据和业务支持系统B域数据;确定单元,用于根据每个待识别用户的业务数据确定每个待识别用户的多个特征值,多个特征值包括第一数值、第二数值和第三数值;第一数值为第一目标天数与第一预设时间段的比值,第二数值为第二目标天数与第一预设时间段的比值,第三数值为第三目标天数与第一预设时间段的比值,第一目标天数为每个待识别用户的第二预设时间段的流量与全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无宽带用户的确定方法,其特征在于,所述方法包括:获取多个待识别用户在第一预设时间段内的业务数据;根据所述每个待识别用户的所述业务数据确定每个待识别用户的多个特征值,所述多个特征值包括第一数值、第二数值和第三数值;所述第一数值为第一目标天数与所述第一预设时间段的比值,所述第二数值为第二目标天数与所述第一预设时间段的比值,所述第三数值为第三目标天数与所述第一预设时间段的比值,所述第一目标天数为所述每个待识别用户的第二预设时间段的流量与全天流量之比大于或等于第一阈值的天数,所述第二目标天数为所述每个待识别用户的第二预设时间段的流量与白天流量之比大于或等于第二阈值的天数,所述第三目标天数为所述每个待识别用户的第二预设时间段的流量与宽带用户的第二预设时间段的流量的平均数之比大于或等于第三阈值的天数;针对第一特征值,根据所述第一特征值及对应的特征阈值确定第一预测结果,得到与所述多个特征值一一对应的多个第一预测结果,所述第一特征值为所述多个特征值中的任一个;所述第一预测结果用于表征所述每个待识别用户为所述无宽带用户的概率得分;根据预设的预测模型及所述多个待识别用户的所述业务数据确定第二预测结果;根据预设投票机制、所述多个第一预测结果及所述第二预测结果,从所述多个待识别用户中确定所述无宽带用户。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征值及对应的特征阈值确定第一预测结果,包括:对所述多个待识别用户的所述第一特征值进行排序,以确定第一待识别用户的所述第一特征值排名,所述第一待识别用户为所述多个待识别用户中的任一个;在所述第一待识别用户的所述第一特征值排名大于或等于第四阈值的情况下,确定所述第一待识别用户为所述无宽带用户。3.根据权利要求1所述的方法,其特征在于,所述第二预测结果包括第一子预测结果和/或第二子预测结果,所述第一子预测结果用于表征所述每个待识别用户为所述无宽带用户的概率得分;所述第二子预测结果用于表征所述每个待识别用户为宽带用户的概率得分;所述根据预设的预测模型及所述业务数据确定第二预测结果,包括:根据所述多个待识别用户的业务数据和所述第一预测模型确定所述第一子预测结果;和/或,根据所述多个待识别用户的业务数据和所述第二预测模型确定所述第二子预测结果;其中,所述第一预测模型对应的正向结果为第四数值,所述第二预测模型对应的负向结果为所述第四数值,所述正向结果用于表示所述待识别用户为所述无宽带用户,所述负向结果用于表示所述待识别用户为所述宽带用户。4.根据权利要求1

3中任一项所述的方法,其特征在于,在所述第二预测结果不包括所述第二子预测结果的情况下,所述根据预设投票机制、所述多个第一预测结果及所述第二预测结果,从所述多个待识别用户中确定所述无宽带用户,包括:针对所述第一待识别用户,若所述第一预测结果、以及所述第一子预测结果中预测所述第一待识别用户为所述无宽带用户的得分之和大于或等于第五阈值,则确定所述第一待识别用户为所述无宽带用户。5.根据权利要求4所述的方法,其特征在于,在所述第二预测结果包括所述第二子预测
结果的情况下,所述根据预设投票机制、所述多个第一预测结果及所述第二预测结果,从所述多个待识别用户中确定所述无宽带用户,包括:对所述第二子预测结果进行数值转换,数值转换后的所述第二子预测结果用于表征所述每个待识别用户为无宽带用户的概率得分;针对所述第一待识别用户,若目标预测结果预测所述第一待识别用户为所述无宽带用户的得分之和大于或等于第五阈值,则确定所述第一待识别用户为所述无宽带用户,所述目标预测结果至少包括所述第一预测结果和数值转换后的所述第二子预测结果。6.一种无宽带用户的确定装置,其特征在于,所述装置包括获取单元、确定单元;所述获取单元,用于获取多个待识别用户在第一预设时间段内的业务数据;所述确定单元,用于根据所述每个待识别用户的所述业务数据确定每个待识别用...

【专利技术属性】
技术研发人员:张晴晴张涛韩玉辉王云云程新洲成晨王天翼吴洋高洁
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1