一种对呼叫进行分类的方法和装置制造方法及图纸

技术编号:16220026 阅读:61 留言:0更新日期:2017-09-16 02:23
本申请实施例公开了一种对呼叫进行分类的方法和装置,所述方法包括:获取数据包,数据包包括与N个呼叫分别对应的N个数据集合,N个呼叫中的任一呼叫Hi对应的数据集合包括通信终端在所述呼叫Hi过程中依次向基站发送的所有测量报告MR;对N个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定每个呼叫经各预设时间窗切分后对应的特征集,特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值;根据每个呼叫经各预设时间窗切分后对应的特征集,对所述N个呼叫按照预设的移动状态的类别进行分类。本申请实施例可以根据呼叫对应的小区数、切换数、以及自定义特征确定呼叫的类别,有利于提高对呼叫进行分类时的精度。

A method and apparatus for classifying calls

The embodiment of the invention discloses a method and a device for classifying the call, the method comprises: acquiring data packets, packet including a call set and N corresponding to the N data, the N calls the Hi call any corresponding data set including communication terminal calls in the Hi process in turn to all the MR measurement report sent by the base station; for each N call in the call to w a preset time window were determined for each feature segmentation, call the preset time window segmentation after the corresponding set, and the corresponding feature set including the call after a small number of segmentation, switching number, and at least one custom characteristic value; according to the characteristics of each call through the preset time window segmentation after the corresponding set to the N call in accordance with the preset mobile state category classification. The embodiment of the utility model can determine the classification of the call according to the number of calls corresponding to the cell number, the number of switches, and the user-defined features, and is beneficial to improve the accuracy when classifying the call.

【技术实现步骤摘要】
一种对呼叫进行分类的方法和装置
本申请涉及通信
,尤其涉及一种对呼叫进行分类的方法和装置。
技术介绍
在进行网络优化时,运营商常常需要利用服务器等处理装置对获取的数据包中的各呼叫的移动状态进行分类。需要说明的是,使用手机、平板电脑(portableandroiddevice,Pad)等通信终端进行通话时,我们认为一次通话过程对应两次呼叫,其中,发起通话的通信终端对应一次呼叫,接收通话的通信终端也对应一次呼叫。另外手机、pad等便携式通讯设备通过基站上网时,一次上网过程也对应一次呼叫。在服务器获取的数据包中,每次呼叫对应一个数据集合,每个数据集合包括在一次呼叫过程中通信终端发送给基站的所有测量报告(measurementreport,MR)。本申请的专利技术人发现,在对呼叫进行分类时,现有技术是对一次呼叫对应的数据集合进行简单处理,根据获取的小区数和切换数这两个参数进行分类的。以用户使用通信终端在某个区域来回走动这个场景对应的呼叫为例,数据集合中小区数和切换数可能都比较大,现有技术可能会将这次呼叫分到高速运动的类别,这显然是与呼叫的实际移动状态不一致。因此,现有技术对呼叫进行分类时不准确。
技术实现思路
本申请实施例提供了一种对呼叫进行分类的方法和装置,用于提高对呼叫进行分类的精度。第一方面,本申请实施例提供了一种对呼叫进行分类的方法,所述方法包括:获取数据包,所述数据包包括与N个呼叫分别对应的N个数据集合,所述N个呼叫中的任一呼叫Hi对应的数据集合包括通信终端在所述呼叫Hi过程中依次向基站发送的所有测量报告MR,其中,所述N为大于1的整数,所述1≤i≤N;对所述N个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定所述每个呼叫经各预设时间窗切分后对应的特征集,所述特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值,所述自定义特征与呼叫的移动状态相关;根据所述每个呼叫经各预设时间窗切分后对应的特征集,对所述N个呼叫按照预设的移动状态的类别进行分类。本申请各实施例中,所述至少一个自定义特征,包括如下自定义特征中的至少一个:接收信号强度标准差、切换熵、室外小区占比、和站间距离速度;其中,所述接收信号强度标准差,是所述呼叫Hj接收信号强度值的标准差;所述切换熵,用于表示所述呼叫Hj接入小区的不确定度;所述室外小区占比,是所述呼叫Hj接入室外类型小区的个数占所有接入小区总个数的百分比;所述站间距离速度,是所述呼叫Hj获得的所有位置信息的均值与所述呼叫的所有位置的最远距离。在一些可能的实施方式中,,所述切换熵根据如下公式计算得到:其中,所述entropy为所述呼叫Hj对应的切换熵,所述其中N表示所述呼叫Hj接入的小区总数,i表示所述呼叫Hj接入的第i个小区,#i表示所述呼叫Hj接入第i个小区的次数,T表示接入不同小区的总次数,pi表示在这段时间内接入第i个小区的概率。可以看出,上述技术方案中,由于设置了与呼叫的移动状态相关的自定义特征,所以在对移动状态进行判断时,除了可以根据呼叫对应的小区数和切换数,还可以结合自定义特征进行判断,这样有利于提高对呼叫进行分类时的精度。在一些可能的实施方式中,根据接入小区性质的不同,所述呼叫Hj对应的预设特征集中的所述接收信号强度标准差,包括:主服务小区的接收信号强度标准差、相邻小区的接收信号强度标准差和全部小区的接收信号强度标准差:所述呼叫Hj对应的预设特征集中的所述切换熵,包括:主服务小区的熵、相邻小区的熵和全部小区的熵。在一些可能的实施方式中,当所述N个呼叫中有N'个呼叫对应的数据集合中包括精确地理位置信息时,所述N'个呼叫中的任一呼叫对应的预设特征集还包括:平均速度,其中,所述N'≥1。在一些可能的实施方式中,所述精确地理位置信息包括通过AGPS或OTT定位服务获得的位置信息。在一些可能的实施方式中,当所述N个呼叫中有N'个呼叫对应的数据集合中包括精确地理位置信息时,所述对所述N个呼叫按照预设的移动状态的类别进行分类,包括:所述N'个呼叫中的任一呼叫Hk根据其对应的平均速度按照预设的移动状态的类别分别对应的平均速度确定所述呼叫Hk的类别,其中,所述1≤K≤N';根据所述N'个呼叫中的每个呼叫对应的类别、以及所述N'个呼叫中的每个呼叫对应的所述特征集的集合,使用监督学习算法确定任意两个所述预设的移动状态的类别在M维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述M维空间分布的区域范围,所述M为所述呼叫Hk对应的所述特征集中特征的个数;对于所述N个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(N-N')个呼叫,任一所述(N-N')个呼叫根据其对应的特征集的集合得到该呼叫在所述M维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述M维空间分布的区域范围,确定所述任一所述(N-N')个呼叫对应的移动状态。在一些可能的实施方式中,对所述N个呼叫按照预设的移动状态的类别进行分类,包括:当所述N'个呼叫中包括地理信息(GeographyInformationSystem,GIS)信息时,获取所述GIS信息中指定的地物信息的位置,所述指定的地物信息是与所述预设的移动状态强相关的地物信息;地物信息比如可以是:住宅、商场、公园、道路、路口、高速公路或者铁路等。所述N'个呼叫中的任一呼叫Hk根据其对应的平均速度按照预设的移动状态的类别分别对应的速度确定所述呼叫Hk的类别,其中,所述1≤K≤N';确定所述任一呼叫Hk匹配的地物信息;确定与所述N'个呼叫对应的地物信息的集合J;根据所述N'个呼叫中的每个呼叫对应的类别、以及所述N'个呼叫中的每个呼叫对应的所述特征集的集合,以及所述地物信息的集合J使用监督学习算法确定任意两个所述预设的移动状态的类别在M维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述M维空间分布的区域范围,所述M为所述呼叫Hk对应的所述特征集中特征的个数;对于所述N个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(N-N')个呼叫,任一所述(N-N')个呼叫根据其对应的特征集的集合得到该呼叫在所述M维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述M维空间分布的区域范围,确定所述任一所述(N-N')个呼叫对应的移动状态。在一些可能的实施方式中,确定所述集合J中任一地物信息对应的所述N'个呼叫中呼叫的集合Ji,若所述集合Ji中包括N”个呼叫,所述N”个呼叫对应的移动状态的类型的集合为Ji',所述集合Ji'对应的移动状态的类型数为N”',若所述集合Ji'中某一移动状态的类型对应的呼叫的个数小于则复制该移动状态的类型对应的呼叫对应的向量F。通过这种方式可以提高概率较小的类别的分类精度。根据所述N'个呼叫中的每个呼叫对应的移动状态的类别、所述向量F以及与每个呼叫对应的预设特征集对应的向量,使用监督学习算法确定任意两个所述预设的移动状态的类别在M维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述M维空间分布的区域范围,所述M为所述呼叫Hk对应的所述预设特征集中特征的个数;对于所述N个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(N-N')个呼叫,任一所述(N-N')个呼本文档来自技高网...
一种对呼叫进行分类的方法和装置

【技术保护点】
一种对呼叫进行分类的方法,其特征在于,所述方法包括:获取数据包,所述数据包包括与N个呼叫分别对应的N个数据集合,所述N个呼叫中的任一呼叫Hi对应的数据集合包括通信终端在所述呼叫Hi过程中依次向基站发送的所有测量报告MR,其中,所述N为大于1的整数,所述1≤i≤N;对所述N个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定所述每个呼叫经各预设时间窗切分后对应的特征集,所述特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值,所述自定义特征与呼叫的移动状态相关;根据所述每个呼叫经各预设时间窗切分后对应的特征集,对所述N个呼叫按照预设的移动状态的类别进行分类。

【技术特征摘要】
1.一种对呼叫进行分类的方法,其特征在于,所述方法包括:获取数据包,所述数据包包括与N个呼叫分别对应的N个数据集合,所述N个呼叫中的任一呼叫Hi对应的数据集合包括通信终端在所述呼叫Hi过程中依次向基站发送的所有测量报告MR,其中,所述N为大于1的整数,所述1≤i≤N;对所述N个呼叫中的每个呼叫以w个预设时间窗分别进行切分,确定所述每个呼叫经各预设时间窗切分后对应的特征集,所述特征集包括与切分后的呼叫对应的小区数、切换数、和至少一个自定义特征的值,所述自定义特征与呼叫的移动状态相关;根据所述每个呼叫经各预设时间窗切分后对应的特征集,对所述N个呼叫按照预设的移动状态的类别进行分类。2.根据权利要求1所述的方法,其特征在于,所述至少一个自定义特征,包括如下自定义特征中的至少一个:接收信号强度标准差、切换熵、室外小区占比、和站间距离速度;其中,所述接收信号强度标准差,是所述呼叫Hj接收信号强度值的标准差;所述切换熵,用于表示所述呼叫Hj接入小区的不确定度;所述室外小区占比,是所述呼叫Hj接入室外类型小区的个数占所有接入小区总个数的百分比;所述站间距离速度,是所述呼叫Hj获得的所有位置信息的均值与所述呼叫的所有位置的最远距离。3.根据权利要求2所述的方法,其特征在于,所述切换熵根据如下公式计算得到:其中,所述entropy为所述呼叫Hj对应的切换熵,所述其中N表示所述呼叫Hj接入的小区总数,i表示所述呼叫Hj接入的第i个小区,#i表示所述呼叫Hj接入第i个小区的次数,T表示接入不同小区的总次数,pi表示在这段时间内接入第i个小区的概率。4.根据权利要求3所述的方法,其特征在于,根据接入小区性质的不同,所述呼叫Hj对应的预设特征集中的所述接收信号强度标准差,包括:主服务小区的接收信号强度标准差、相邻小区的接收信号强度标准差和全部小区的接收信号强度标准差:所述呼叫Hj对应的预设特征集中的所述切换熵,包括:主服务小区的熵、相邻小区的熵和全部小区的熵。5.根据权利要求4所述的方法,其特征在于,当所述N个呼叫中有N'个呼叫对应的数据集合中包括精确地理位置信息时,所述N'个呼叫中的任一呼叫对应的预设特征集还包括:平均速度,其中,所述N'≥1。6.根据权利要求5所述的方法,其特征在于,所述精确地理位置信息包括通过AGPS或OTT定位服务获得的位置信息。7.根据权利要求6所述的方法,其特征在于,当所述N个呼叫中有N'个呼叫对应的数据集合中包括精确地理位置信息时,所述对所述N个呼叫按照预设的移动状态的类别进行分类,包括:所述N'个呼叫中的任一呼叫Hk根据其对应的平均速度按照预设的移动状态的类别分别对应的平均速度确定所述呼叫Hk的类别,其中,所述1≤K≤N';根据所述N'个呼叫中的每个呼叫对应的类别、以及所述N'个呼叫中的每个呼叫对应的所述特征集的集合,使用监督学习算法确定任意两个所述预设的移动状态的类别在M维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述M维空间分布的区域范围,所述M为所述呼叫Hk对应的所述特征集中特征的个数;对于所述N个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(N-N')个呼叫,任一所述(N-N')个呼叫根据其对应的特征集的集合得到该呼叫在所述M维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述M维空间分布的区域范围,确定所述任一所述(N-N')个呼叫对应的移动状态。8.根据权利要求6所述的方法,其特征在于,所述,对所述N个呼叫按照预设的移动状态的类别进行分类,包括:当所述N'个呼叫中包括GIS信息时,获取所述GIS信息中指定的地物信息的位置,所述指定的地物信息是与所述预设的移动状态强相关的地物信息;所述N'个呼叫中的任一呼叫Hk根据其对应的平均速度按照预设的移动状态的类别分别对应的速度确定所述呼叫Hk的类别,其中,所述1≤K≤N';确定所述任一呼叫Hk匹配的地物信息;确定与所述N'个呼叫对应的地物信息的集合J;根据所述N'个呼叫中的每个呼叫对应的类别、以及所述N'个呼叫中的每个呼叫对应的所述特征集的集合,以及所述地物信息的集合J使用监督学习算法确定任意两个所述预设的移动状态的类别在M维空间的界限,根据所述界限得到任一所述预设的移动状态的类别在所述M维空间分布的区域范围,所述M为所述呼叫Hk对应的所述特征集中特征的个数;对于所述N个呼叫中,呼叫对应的数据集合中不包括精确地理位置信息的(N-N')个呼叫,任一所述(N-N')个呼叫根据其对应的特征集的集合得到该呼叫在所述M维空间中的映射位置,根据所述映射位置及任一所述预设的移动状态在所述M维空间分布的区域范围,确定所述任一所述(N-N')个呼叫对应的移动状态。9.根据权利要求2所述的方法,其特征在于,当所述N个呼叫中不包括精确地理位置信息时,所述对所述N个呼叫按照预设的移动状态的类别进行分类,包括:根据所述N个呼叫对应的所述预设特征集的集合,得到与所述N个呼叫分别对应的N个与所述预设特征集对应的向量;根据N个所述向量和非监督学习算法,将所述N个呼叫分为M个集合,所述M大于预设的移动状态的类别的个数;根据专家规则,将所述M个集合按照预设的移动状态的类别进行分类,则任一呼叫的类别与其所属集合的类别相同。10.一种对呼叫进行分类的装置,其特征在于,所述装置包括:获取单元,用于获取数据包,所述数据包包括与N个呼叫分别对应的N个数据集合,所述N个呼叫中的任一呼叫Hi对应的数据集合...

【专利技术属性】
技术研发人员:彼得·巴詹诺夫·瓦拉瑞也斯基克里斯托·劳得亚斯王高虎李汐王瑞岩
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1