基站数据唯一数字化标识的方法技术

技术编号:17541642 阅读:35 留言:0更新日期:2018-03-24 18:42
本发明专利技术提供了一种基站数据唯一数字化标识的方法,包括以下步骤:步骤1,根据基站的名称或者简称和能作为唯一性标识的字段做为输入,如果是字段类型字段必须是固定长度且每个组成字符串的字符可以穷举限定字符且不可重复;步骤2,根据字段为固定长度的字符串转换成唯一的数字;步骤3,重复步骤2,直到所有字符串字段都转成唯一的数字,并将所有转化的数字拼接起来;步骤4,数字标识可逆化,如果有查找可视化需求可以将唯一标识转换成基站名称和发生时间。本发明专利技术便于实现,并有效的提高检索效率。本发明专利技术仅在各类测绘基站定时上传所述数据集,降低重复上传所占用的流量和存储数据带来不必要的空间浪费,同时减少检索过程中的时间消耗。

A method of unique digital identification of base station data

【技术实现步骤摘要】
基站数据唯一数字化标识的方法
本专利技术涉及软件开发
,具体涉及大数据存储检索清洗

技术介绍
近年来,随着技术的发展,人类对各类精准定位服务的需求日益迫切。各个传统基站定时上传数据量暴增。现今的大数据在数据清洗检索领域对海量基站的唯一性标识要求比较高,传统字符串唯一标识在检索过程中不仅耗费CPU资源同时检索效率低下,即使现今传统数据库中对字符串唯一标识做索引的方式随着数据量暴增,索引成本也急剧增加。很多完全采用数字标识来表示基站数据,因为无法在标识中可逆化表示基站原先所蕴含的信息,造成在检索中需要查询另外的关系表获取有用的信息,这无形中提高检索成本和降低检索效率。
技术实现思路
本专利技术解决的技术问题就是将传统基站数据标识转化成唯一而且可逆的数字标识,通过一次标识将标识内信息数字编码,同时反编码同样可以还原参与唯一标识基站的基本信息。本专利技术采用的技术方案如下:一种基站数据唯一数字化标识的方法,包括以下步骤:步骤1,根据物理基站的名称或者简称和能作为唯一性标识的字段做为输入,如果是字符串类型字段,必须是固定长度且每个组成字符串的字符可以穷举,且限定字符不可重复。步骤2,根据字段为固定长度的字符串类型字段,转换成唯一的数字标识。步骤3,重复步骤2,直到所有字符串字段都转成唯一的数字标识,并将所有转化的数字标识拼接起来。步骤4,数字标识可逆化,如果有查找可视化需求可以将唯一标识转换成基站名称和播发时间。本专利技术的有益效果如下:1、提高检索效率,而且相比传统数据库的检索,拿出数字标识同时需要做额外查找;本专利技术可以实现一次查找就能将主要唯一性的信息全部检索出来。2、提高存储效率,通过特定长度的编码方式,可以减少字符串类型唯一标识的存储空间。附图说明图1是本专利技术流程示意图。具体实施方式下文中,结合附图和实施例对本专利技术作进一步阐述。图1是本专利技术一种基站数据唯一数字化标识的方法流程示意图,包括以下步骤:定义一:输入数据确定:任何基站定义的固定长度字符串字段或者数字类型字段都可以作为输入。定义二:字符串字段转换唯一数字标识:对于长度固定的字符串,字符串的类型基本判定可以穷举,下面阐述假定字段字符串为(a-z或者A-Z)中选取的限定固定长度字符标示。确定长度并且可以限定字符的字符串字段转化成唯一数字标识可以认为是将这些数字在固定长度的全排列,并且用这个数字来给每个全排列元素标号。具体转化公式如下:(cantor展开,cantor展开就是一种特殊的哈希函数,它的使用范围是对于若干个数的排列进行状态的压缩和存储):X=an*(n-1)!+an-1*(n-2)!+...+ai*(i-1)!+...+a2*1!+al*0!其中,an为当前未出现的元素中是排在第几个(从0开始),n为固定字符串的长度。举例来说:对于固定长度为4的基站编码”SFGA”,其转换公式为:X(“SFGA”)=a4*3!+a3*2!+a2*1!+a1*0!a4=″S″这个元素在限定的数组[S,F,G,A]中是第几大的元素。通过ASCII表比对可知,S是第3大元素(从0开始计算)。所以a4=3。a3=“F”,由于比F小的字符有1个,所以a3=1。a2=“G”,比G小的元素有2个,但是因为前一个元素F已经出现过,所以a2=1X(“SFGA”)=3*3!+1*2!+1*1!+0*0!=18+2+1=21定义三:唯一标识数字可逆化:对于给定的数字21,穷举组合[S,F,G,A]中:1)首先用21-1得到20,说明给定字符串之前有20个排列(将此数本身减去1)。2)用20去除3!得到3余2,说明有3个数比第1位小,所以第一位是G。3)用2去除2!得到1余0,说明有1个数比第2位小,所以是F。4)用1去除1!得到1余0,类似地,说明有1个数比第3位小,在剩下字符串数组中A和G中,只能是元素G。5)最后剩下的元素只能是A。所以这个字符串是SFGA。定义四:多个字符串唯一数字标识拼接:多个数字标识可以将各个字段固定编码来做拼接成新的唯一的字符串。举例来说,有两个字符串字段:基站时间和基站代码字段,将两字段按照定义二可以转换成数字标识,同时根据限定的字符串可以估算出最大的数字位数,比如,基站简称字段的穷举数组[S,F,G,A],最大的数字标识可以限定为999,所以数字标识字段前三位数字可以表示字段简称,同理可以限定后5位数字表示基站的时间字段。以测绘物理基站作为实施例,各个基站每秒钟会播发其状态数据,确定基站唯一性一般采用基站的简称和播发时间戳做为数据的唯一标识。基站的简称一般都是限定字符集的4-8位做为标识,通过对基站简称采用定义二方法解码,可以将所有基站字符串简称映射成3-5位数字表示,再根据时间戳一般限定的13位数字(精确到毫秒的数字时间戳)。通过上述定义三将基站唯一标识控制在18位范围内,有效的节省了存储字符串多余的空间。由于根据定义三编码规则,同样根据已有的数字标识符解码成原来的参与编码的字段内容,节省了查找索引的时间。本专利技术的主要优点包括:1、本方法的降低了存储空间,如果采用一些支持尾递归的语言来实现上述方法,进一步提高空间复用率和节省实现和存储的空间复杂度。2、本专利技术提高了运行效率,如上所述,一次编码可以提高查找定位数据的效率,降低CPU使用率。同时一次解码,可以得到参与编码的内容,避免多余查找。3、本专利技术易于实现,降低了实现复杂度,也降低了维护成本。本方法基于常见的cantor展开来编解码,方法的实现门槛低,同时易于测试和维护。本专利技术虽然已以较佳实施例公开如上,但其并不是用来限定本专利技术,任何本领域技术人员在不脱离本专利技术的精神和范围内,都可以利用上述揭示的方法和
技术实现思路
对本专利技术技术方案做出可能的变动和修改,因此,凡是未脱离本专利技术技术方案的内容,依据本专利技术的技术实质对以上实施例所作的任何简单修改、等同变化及修饰,均属于本专利技术技术方案的保护范围。本文档来自技高网
...
基站数据唯一数字化标识的方法

【技术保护点】
一种基站数据唯一数字化标识的方法,其特征在于,包括以下步骤:步骤1,将基站的字段作为输入;步骤2,将字段转换成唯一的数字标识;步骤3,重复步骤2,直到所有字段都转换成唯一的数字标识,并将所有转换的数字标识拼接起来;步骤4,数字标识可逆化。

【技术特征摘要】
1.一种基站数据唯一数字化标识的方法,其特征在于,包括以下步骤:步骤1,将基站的字段作为输入;步骤2,将字段转换成唯一的数字标识;步骤3,重复步骤2,直到所有字段都转换成唯一的数字标识,并将所有转换的数字标识拼接起来;步骤4,数字标识可逆化。2.如权利要求1所述的一种基站数据唯一数字化标识的方法,其特征在于,所述字段包括基站的字符串类型字段或者数字类型字段。3.如权利要求2所述的一种基站数据唯一数字化标识的方法,其特征在于,所述字符串类型字段包括基站的名称或者简称。4.如权利要求2所述的一种基站数...

【专利技术属性】
技术研发人员:万景琨高山岳
申请(专利权)人:千寻位置网络有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1