高速用户的识别方法、装置和计算机可读存储介质制造方法及图纸

技术编号:23486680 阅读:64 留言:0更新日期:2020-03-10 13:25
本公开涉及一种高速用户的识别方法、装置和计算机可读存储介质,涉及移动通信技术领域。该方法包括:获取待识别话单中用户在单位时间内途经的基站数;将基站数大于第一阈值的用户确定为高速用户样本;提取待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;将用户信息、途经基站信息和位置移动信息输入机器学习模型,以确定待识别用户是否为疑似高速用户;通过比较疑似高速用户途经不同基站的时间差和高速用户样本途经不同基站的时间差,确定疑似高速用户是否为高速用户。本公开的技术方案能够扩大适用范围、提高识别的准确率。

High speed user identification method, device and computer readable storage medium

【技术实现步骤摘要】
高速用户的识别方法、装置和计算机可读存储介质
本公开涉及移动通信
,特别涉及一种高速用户的识别方法、高速用户的识别装置和计算机可读存储介质。
技术介绍
五高场景(高铁、高速、高校、高价值、高密度)下的无线网络建设和优化是运营商在无线领域的重点课题。如何识别跟踪高速典型场景下用户(即高速用户),以对高速场景的网络覆盖和质量进行评估,决定了运营商是否能提供更好的无线网络服务。在相关技术中,通过定期路测来获取高速沿线的信号覆盖和感知情况;或者通过站台的车次、位置信息进行预过滤;或者采用固定的速度阈值进行用户筛选和识别;或者通过对接外部票务系统进行高速用户识别。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题:依赖外部数据和设施的支持,导致适用范围小;仅通过速度进行识别,导致识别准确率低。鉴于此,本公开提出了一种高速用户的识别技术方案,能够扩大适用范围、提高识别准确率。根据本公开的一些实施例,提供了一种高速用户的识别方法,包括:获取待识别话单中用户在单位时间内途经的基站数;将所述基站数大于第一阈值的用户确定为高速用户样本;提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户;通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。在一些实施例中,还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。在一些实施例中,将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;获取所述高速用户样本途经各基站对的时间差;计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差;根据所述时间差的均值和方差,确定所述各基站对的时间差范围;在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。在一些实施例中,在所述疑似高速用户途经基站对中两个基站的顺序与这两个基站的预设排列顺序一致的情况下,将该基站对确定为正序基站对;在所述匹配基站对的数量与途经总数的比值大于第二阈值,且所述正序基站对的数量与所述途经总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经总数为所述疑似高速用户途经基站对的总数;或者在所述匹配基站对的数量与所述途经总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。在一些实施例中,该方法还包括:按照经纬度将高速路段所在区域划分为多个栅格;确定各栅格内主小区的ID以获取基站列表;提取所述基站列表中基站的话单作为所述待识别话单。在一些实施例中,所述用户信息包括:是否为外省用户;所述途经基站信息包括:经过的高铁基站数量、经过的非高铁基站数量、经过的高铁基站数量占比、经过的基站数中的多项;所述位置移动信息包括:最大经纬度偏移距离、在单位时间内的最大经纬度偏移。在一些实施例中,将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。根据本公开的另一些实施例,提供一种高速用户的识别装置,包括:获取单元,用于获取待识别话单中用户在单位时间内途经的基站数;提取单元,用于提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;确定单元,用于将所述基站数大于第一阈值的用户确定为高速用户样本,将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户,通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。在一些实施例中,所述确定单元还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。在一些实施例中,该装置还包括:组合单元,用于将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;其中,所述获取单元获取所述高速用户样本途经各基站对的时间差;所述确定单元计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差,根据所述时间差的均值和方差,确定所述各基站对的时间差范围,在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。在一些实施例中,所述确定单元还用于执行如下步骤:在所述疑似高速用户途经基站对中两个基站的顺序与所述高速用户样本途经该基站对中两个基站的顺序一致的情况下,将该基站对确定为正序基站对;在所述匹配基站对的数量与途经总数的比值大于第二阈值,且所述正序基站对的数量与所述途经总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经总数为所述疑似高速用户途经基站对的总数;或者在所述匹配基站对的数量与所述途经总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。在一些实施例中,该装置还包括:划分单元用于按照经纬度将高速路段所在区域划分为多个栅格;其中,所述获取单元确定各栅格内主小区的ID以获取基站列表,提取所述基站列表中基站的话单作为所述待识别话单。在一些实施例中,将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。根据本公开的又一些实施例,提供一种高速用户的识别装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例中的高速用户的识别方法中的一个或多个步骤。根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例中的高速用户的识别方法中的一个或多个步骤。在上述实施例中,无需依赖外部数据和设施,通过话单中的相关信息即可识别高速用户,从而扩大了适用范围;利用机器学习模型和高速用户样本的统计特性对高速用户进行双重识别,从而提高了识别的准确率。附图说明构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本公本文档来自技高网...

【技术保护点】
1.一种高速用户的识别方法,包括:/n获取待识别话单中用户在单位时间内途经的基站数;/n将所述基站数大于第一阈值的用户确定为高速用户样本;/n提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;/n将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户;/n通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。/n

【技术特征摘要】
1.一种高速用户的识别方法,包括:
获取待识别话单中用户在单位时间内途经的基站数;
将所述基站数大于第一阈值的用户确定为高速用户样本;
提取所述待识别话单中的待识别用户的用户信息、位置移动信息和在单位时间内的途经基站信息;
将所述用户信息、所述途经基站信息和所述位置移动信息输入机器学习模型,以确定所述待识别用户是否为疑似高速用户;
通过比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差,确定所述疑似高速用户是否为高速用户。


2.根据权利要求1所述的识别方法,其中,所述确定所述疑似高速用户是否为高速用户包括:
还通过比较所述疑似高速用户途经不同基站的顺序和不同基站的预设排列顺序,确定所述疑似高速用户是否为高速用户。


3.根据权利要求1或2所述的识别方法,其中,所述比较所述疑似高速用户途经不同基站的时间差和所述高速用户样本途经不同基站的时间差包括:
将所述待识别话单中的各基站组合为多个基站对,所述基站对中包括两个不同基站;
获取所述高速用户样本途经各基站对的时间差;
计算多个所述高速用户样本途经所述各基站对的时间差的均值和方差;
根据所述时间差的均值和方差,确定所述各基站对的时间差范围;
在所述疑似高速用户途经基站对的时间差落在该基站对的所述时间差范围内的情况下,将该基站对确定为匹配基站对。


4.根据权利要求3所述的识别方法,其中,所述确定所述疑似高速用户是否为高速用户包括:
在所述疑似高速用户途经基站对中两个基站的顺序与这两个基站的预设排列顺序一致的情况下,将该基站对确定为正序基站对;
在所述匹配基站对的数量与途经总数的比值大于第二阈值,且所述正序基站对的数量与所述途经总数的比值大于第三阈值的情况下,确定所述疑似高速用户为高速用户,所述途经总数为所述疑似高速用户途经基站对的总数;或者
在所述匹配基站对的数量与所述途经总数的比值大于所述第二阈值,且所述正序基站对的数量与所述途经总数的比值小于第四阈值的情况下,确定所述疑似高速用户为高速用户,所述第四阈值小于所述第三阈值。


5.根据权利要求1或2所述的识别方法,还包括:
按照经纬度将高速路段所在区域划分为多个栅格;
确定各栅格内主小区的ID以获取基站列表;
提取所述基站列表中基站的话单作为所述待识别话单。


6.根据权利要求1或2所述的识别方法,其中,
所述用户信息包括:是否为外省用户;
所述途经基站信息包括:经过的高铁基站数量、经过的非高铁基站数量、经过的高铁基站数量占比、经过的基站数中的多项;
所述位置移动信息包括:最大经纬度偏移距离、在单位时间内的最大经纬度偏移。


7.根据权利要求1或2所述的识别方法,还包括:
将所述基站数小于第五阈值的用户确定为低速用户样本,所述第五阈值小于所述第一阈值;
其中,所述机器学习模型以所述待识别话单中的各用户的所述用户信息、所述位置移动信息和所述在单位时间内的途经基站信息为输入,以高速用户或低速用户为输出,以所述高速用户样本和所述低速用户样本为验证依据进行训练。


8.一种高速用户的识别装置,包括:
获取单元,用于获取待识别话单中用户在单位时间内途经的基站数;
提取单元,用于提取所述待识别话单中的待识别用户的用户信息...

【专利技术属性】
技术研发人员:陆中远
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1