一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法技术

技术编号:17544564 阅读:37 留言:0更新日期:2018-03-25 01:04
本发明专利技术公开一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,包括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码信息;(2)对这些号码在连接该基站的预设时间范围内的话单数据进行分析,进而给出这些号码连接其他基站的信息;(3)针对上述基站,根据与该基站进行连接的号码与上、下文基站数据经、纬度信息的时间间距作为量度给出该基站可信度;(4)以此可信度作为该基站周围基站位置信息的权值,对存疑基站的经、纬度信息进行加权估计。

A weighted base station location correction method based on the reliability of base station location in user's single data

The invention discloses a method of weighted base station location deviation of base station location if a single user credibility in large data based, which comprises the following steps: (1) to the base station latitude and longitude information doubt, looking for all the connected telephone number information and the base station in big data; (2) of these the number in the preset time range is connected with the base station within the single data analysis, and then give the number to connect with other base station information; (3) to the base station and the base station, according to the connection number, and below the base station data of longitude and latitude information of the time interval as the base station gives a measure of credibility; (4 this credibility as the base station) around the base station location information weights, longitude and latitude information of the base station are weighted estimates of doubt.

【技术实现步骤摘要】
一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法
本专利技术属于统计学习理论,特别是涉及一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法。
技术介绍
电信运营商话单大数据中包含有当前通话的接入基站信息,而这些基站信息是由基站维护人员事先人为手动输入、制表存储于服务器端的。这些数据常常因为输入人员的疏忽而引起错误数据的输入,因此常带有不可避免的错误信息。这些错误信息的存在,常常给电信运营商的基站维护,用户服务等带来很多问题,严重影响最终用户的使用体验,为此有必要通过适当的技术手段,对上述基站的错误位置信息进行更正。显然,人为的去修正上述信息是繁重的,笨拙的。基于此,本专利技术提出一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,通过海量的用户话单大数据信息,对位置存疑的基站进行发现。然后,根据对话单大数据的分析、挖掘,给出恰当的存疑基站位置估算方法。
技术实现思路
针对基站数据手动输入中可能引入的错误信息,提出一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法,通过对用户话单中连接基站的上、下文信息的挖掘、分析与计算,给出不同基站在当前基站位置估计中的可信度,作为加权计算的权值信息,给出当前存疑基站的经、纬度估计值。一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,包括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码信息;(2)对这些号码在连接该基站的一定时间范围内(例如,前后半小时内或者1小时内)的话单数据进行分析,进而给出这些号码连接其他基站的信息;(3)针对上述基站,根据与该基站进行连接的号码与上、下文基站数据经、纬度信息的时间间距作为量度给出该基站可信度;(4)以此可信度作为该基站周围基站位置信息的权值,对存疑基站的经、纬度信息进行加权估计。与现有技术相比,本专利技术具有以下明显的优势和有益效果:(1)本专利技术提出一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,算法通过对用户话单中连接基站的上、下文信息的挖掘、分析与计算,基于连接两基站(存疑基站与当前待加权基站)时间间距的长短,给出不同基站在当前基站位置估计中的可信度度量。(2)本专利技术根据该可信度度量值对集合中不同基站的经、纬度数据进行加权,克服了原有的为集合中不同基站经、纬度赋予完全相同权值进行存疑基站位置估计的传统方法。(3)本专利技术采用根据不同基站的可信度为集合内基站的地理信息设置自适应权值,保证与当前存疑基站位置跃进基站权值越大,自动的完成存疑基站的位置纠偏工作,确保了大量存疑数据的准确修复。附图说明图1为本专利技术所提出的一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法功能框图;具体实施方式下面结合附图和具体实施方式对本专利技术做进一步的描述。如图1所示,本专利技术提供一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,包括以下步骤:(1)一定时间T内,话单大数据中存疑基站连接电话号码查找、制表对话单大数据中全部的已标出带有纠偏存疑的基站,建立存疑基站表单B1,在oracle数据库中选取一定时间内(例如前后60分钟)该基站所连接的全部电话号码,使用select语句进行查询,给出这段时间与该基站相连全部电话的表单P1;(2)一定时长内,电话号码连接基站信息提取对于P1中每一个电话号码,以该存疑基站为参考基站,以连接该参考基站时间点to为参考时间,查找连接该参考基站之前和之后最近相连接的两基站(bi,bj),并建立基站集合B2,分别提取这些基站的经、纬度信息lo、la;(3)时间间隔计算计算P1中每个电话号码与存疑基站连接的前一个、后一个基站的连接时间,并与参考时间to做差值,得到2个时间间隔Δti,Δtj;(4)滤除不符合条件基站统计信息对于给定的时间间隔阈值T,如Δti或Δtj大于该阈值,则舍弃上述两基站的本次统计信息,否则将其计入最后基站可信度信息计算的统计集合Bf中,此集合保存了一系列基站信息及对应的一系列电话号码从不同基站切换到参考基站连接的时间间隔Δt;(5)不同基站的可信度计算针对上述基站集合Bf,以各个电话号码连接当前基站与连接参考基站(存疑基站)之间的时间差值度量作为该基站的可信度度量(可信度计算:某一号码连接该参考基站与其切换到前、后紧邻基站的时间间隔,Δti,Δtj。如连接存疑基站之后x分钟、之前y分钟与两基站相连,采用自然指数作为这两个基站的可信度度量,分别定义为e^(-(x/60))和e^(-(y/60)),对全部基站上述信息进行统计,求取相关统计量;(6)干扰数据去除因为电信话单数据中话单统计信息不可避免的存在一定量的误差(主要是由于各种原因引起的时间记录误差,如时间延迟误差,数据录入误差,数据传输误差等),因此为提高对误差的抑制作用和去除干扰数据,采用中位数去噪方法。例如,某基站不同次计算所得的可信度按降序排列分别为C1,C2,C3,...,Cn,取该基站这些可信度的中位数作为该基站整体的可信度度量;(7)基于可信度度量的基站经、纬度加权计算以此可信度作为该基站集合中不同基站位置信息的权值w,对存疑基站的经、纬度信息进行加权计算,则存疑基站经、纬度Lo、La分别为:Lo=Σwi·loi/nLa=Σwi·lai/n本专利技术的基于用户话单大数据中基站位置可信度的加权基站位置纠偏方法,包括几个步骤:1、对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码;2、针对上述号码,分析其在连接该基站的一定时间范围内(例如,已连接当前存疑基站时间点为时间零点,其前、后1小时内)连接其他基站的上、下文信息;3、针对上述基站建立附近基站的集合,以各个电话号码连接当前基站与连接存疑基站之间的时间差值度量作为该基站的可信度度量(可信度计算:该号码连接该基站的时间距离其时间零点与时间跨度的比值,如连接存疑基站之后x分钟、之前y分钟与该基站相连,则这两个基站的可信度分别为e^(-(x/60))和e^(-(y/60)),对全部基站上述信息进行统计,求取相关统计量,为提高对误差的抑制作用和去除干扰数据,取其前n位数据的中位数作为每个基站整体的可信度度量;4、以此可信度作为该基站集合中不同基站位置信息的权值,对存疑基站的经、纬度信息进行加权计算。本专利技术基于用户终端连接基站中不同基站的经、纬度信息的可信度度量,提出一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法。通过对用户话单中连接基站的上、下文信息的挖掘、分析与计算,给出不同基站在当前基站位置估计中的可信度,作为加权计算的权值信息,给出当前存疑基站的经、纬度估计值,可实现较高可信度的基站经、纬度估计,达到对存疑基站经、纬度的估计。本文档来自技高网...
一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法

【技术保护点】
一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,其特征在于,包括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码信息;(2)对这些号码在连接该基站的预设时间范围内的话单数据进行分析,进而给出这些号码连接其他基站的信息;(3)针对上述基站,根据与该基站进行连接的号码与上、下文基站数据经、纬度信息的时间间距作为量度给出该基站可信度;(4)以此可信度作为该基站周围基站位置信息的权值,对存疑基站的经、纬度信息进行加权估计。

【技术特征摘要】
1.一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,其特征在于,包括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码信息;(2)对这些号码在连接该基站的预设时间范围内的话单数据进行分析,进而给出这些号码连接其他基站的信息;(3)针对上述基站,根据与该基站进行连接的号码与上、下文基站数据经、纬度信息的时间间距作为量度给出该基站可信度;(4)以此可信度作为该基站周围基站位置信息的权值,对存疑基站的经、纬度信息进行加权估计。2.一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,其特征在于,包括以下步骤:(1)一定时间T内,话单大数据中存疑基站连接电话号码查找、制表;(2)一定时长内,电话号码连接基站信息提取对于P1中每一个电话号码,以该存疑基站为参考基站,以连接该参考基站时间点to为参考时间,查找连接该参考基站之前和之后最近相连接的两基站(bi,bj),并建立基站集合B2,分别提取这些基站的经、纬度信息lo、la;(3)时间间隔计算计算P1中每个电话号码与存疑基站连...

【专利技术属性】
技术研发人员:曹万鹏林绍福罗云彬徐青史辉李鹏李浩
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1