地理位置数据压缩方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37479550 阅读:16 留言:0更新日期:2023-05-07 09:20
本发明专利技术涉及大数据技术领域,提供了一种地理位置数据压缩方法、装置、电子设备及存储介质,所述方法包括:获取预先构建的字符树,字符树是根据多个地理位置数据中所有不重复字符构建的,字符树包括一个根节点和除根节点之外关联节点和字符节点,每一关联节点用于关联其父节点和子节点,除根节点的子节点之外的每一关联节点均还关联至少一个字符节点,每一字符节点表征一个不重复字符;根据字符树,确定每一地理位置数据中每一字符的编码;将每一地理位置数据中所有字符的编码进行组合,得到每一地理位置数据压缩后的编码。本发明专利技术能够对地理位置数据进行有效压缩。位置数据进行有效压缩。位置数据进行有效压缩。

【技术实现步骤摘要】
地理位置数据压缩方法、装置、电子设备及存储介质


[0001]本专利技术涉及大数据
,具体而言,涉及一种地理位置数据压缩方法、装置、电子设备及存储介质。

技术介绍

[0002]地理位置数据会保存用户所有的驻留信息,以地理位置数据用geohash编码为例,一个人一天大约有4个geohash,若时间跨度超过一年,就会导致驻留信息的数据量非常大,因而占用巨大的存储空间,如何减小地理位置数据占用的存储空间为本领域技术人员亟待解决的问题。

技术实现思路

[0003]本专利技术的目的在于提供了一种地理位置数据压缩方法、装置、电子设备及存储介质,其能够对地理位置数据进行有效压缩,极大地减少了地理位置数据占用的存储空间。
[0004]本专利技术的实施例可以这样实现:第一方面,本专利技术提供一种地理位置数据压缩方法,所述方法包括:获取预先构建的字符树,所述字符树是根据多个地理位置数据中所有不重复字符构建的,所述字符树包括一个根节点、多个关联节点及与每一所述关联节点关联的至少一个字符节点,每一所述关联节点用于关联其父节点和子节点,每一所述字符节点表征一个所述不重复字符;根据所述字符树,确定每一所述地理位置数据中每一字符的编码;将每一所述地理位置数据中所有字符的编码进行组合,得到每一所述地理位置数据压缩后的编码。
[0005]在可选的实施方式中,所述字符树包括第一分支和第二分支,所述根节点包括第一子节点和第二子节点,所述第一子节点和所述第二子节点分别与所述第一分支和所述第二分支相关联,所述第一子节点的权重值预先设置为第一预设值、所述第二子节点的权重值预先设置为第二预设值,所述第一分支和所述第二分支均包括多层,每一层包括一个关联节点和至少一个字符节点,处于同一个分支的各层的关联节点的权重值相同,处于同一个分支的各层的位置相同的字符节点的权重值相同,所述根据所述字符树,确定每一所述地理位置数据中每一字符的编码的步骤包括:对于每一所述地理位置数据中任一目标字符而言,将所述根节点与目标字符节点之间途径节点数最少的路径作为目标路径,所述目标字符节点为表征所述目标字符的字符节点;按照各节点途径顺序,将各节点的权重值依次排列而成的序列确定为所述目标字符的编码;将每一所述地理位置数据的每一字符作为所述目标字符,得到每一所述地理位置数据中每一字符的编码。
[0006]在可选的实施方式中,所述方法还包括:获取多个地理位置数据,每一所述地理位置数据包括至少一个字符;对所有地理位置数据包括的所有字符进行去重,得到所述多个地理位置数据中的不重复字符;根据所述不重复字符中每一字符在所述多个地理位置数据中出现的次数,计算所述不重复字符中每一字符的权重;根据所有所述不重复字符的权重,构建所述字符树。
[0007]在可选的实施方式中,所述字符树包括第一分支和第二分支,所述根据所有所述不重复字符的权重,构建所述字符树的步骤包括:生成所述根节点的第一子节点和第二子节点、并将所述第一子节点和所述第二子节点分别与所述第一分支和所述第二分支关联;基于所述第一子节点和所述第二子节点,根据所有所述不重复字符的权重生成所述第一分支的各层的关联节点和字符节点以及所述第二分支的各层的关联节点和字符节点,得到所述字符树;将所述第一子节点的权重值设置为第一预设值、将与所述第二子节点的权重值预先设置为第二预设值,将处于同一个分支的各层的关联节点的权重值设置为相同,将处于同一个分支的各层的位置相同的字符节点的权重值设置为相同。
[0008]在可选的实施方式中,将所述不重复字符按照其权重从大到小的顺序组成字符序列,并将与所述第一子节点作为第一父节点、将与所述第二子节点作为第二父节点;所述基于所述第一子节点和所述第二子节点,根据所有所述不重复字符的权重生成所述第一分支的各层的关联节点和字符节点以及所述第二分支的各层的关联节点和字符节点,得到所述字符树的步骤包括:获取所述字符序列中不重复字符的字符数;根据所述字符数确定一次需要插入的不重复字符的目标数;若所述字符序列不为空,则从所述字符序列中按照权重从大到小的顺序取出所述目标数个目标不重复字符;基于所述第一父节点和所述第二父节点将所述目标数个所述目标不重复字符插入至所述字符树;生成所述第一父节点的关联节点和所述第二父节点的关联节点、并用所述第一父节点的关联节点替换所述第一父节点、用所述第二父节点的关联节点替换所述第二父节点,重复所述获取所述字符序列中不重复字符的字符数的步骤,直至所述字符序列为空,得到所述字符树。
[0009]在可选的实施方式中,所述根据所述字符数确定一次需要插入的不重复字符的目标数的步骤包括:若所述字符数大于或者等于参考节点数,则将所述参考节点数作为目标数,否则,将所述字符数作为所述目标数,所述参考节点数根据所述第一分支和所述第二分支中任一层包括的字符节点的最大个数确定。
[0010]在可选的实施方式中,所述基于所述第一父节点和所述第二父节点将所述目标数个所述目标不重复字符插入至所述字符树的步骤:
生成所述目标数个所述第一父节点的字符节点、并生成所述目标数个所述第二父节点的字符节点;按照所述目标不重复字符的权重的从大到小的顺序,依次为所述第二父节点的字符节点赋值和为所述第一父节点的字符节点赋值,所述第二父节点的字符节点表征的目标不重复字符的权重大于所述第一父节点的字符节点表征的目标不重复字符的权重,以将所述目标不重复字符插入至所述字符树。
[0011]第二方面,本专利技术提供一种地理位置数据压缩装置,所述装置包括:获取模块,用于获取预先构建的字符树,所述字符树是根据多个地理位置数据中所有不重复字符构建的,所述字符树包括一个根节点、多个关联节点及与每一所述关联节点关联的至少一个字符节点,每一所述关联节点用于关联其父节点和子节点,每一所述字符节点表征一个所述不重复字符;确定模块,用于根据所述字符树,确定每一所述地理位置数据中每一字符的编码;编码模块,用于将每一所述地理位置数据中所有字符的编码进行组合,得到每一所述地理位置数据压缩后的编码。
[0012]第三方面,本专利技术提供一种电子设备,包括处理器和存储器,所述存储器用于存储程序,所述处理器用于在执行所述程序时,实现如前述实施方式中第一方面所述的地理位置数据压缩方法。
[0013]第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述实施方式中第一方面所述的地理位置数据压缩方法。
[0014]与现有技术相比,本专利技术利用预先构建的字符树确定每一地理位置数据中每一字符的编码,再将每一地理位置数据中所有字符的编码进行组合,最终得到每一地理位置数据压缩后的编码,由于字符树是根据多个地理位置数据中所有不重复字符构建的,每一字符节点表征一个不重复字符,字符树包括一个根节点多个关联节点及与每一关联节点关联的至少一个字符节点,每一关联节点用于关联其父节点和子节点,除根节点的子节点之外的每一关联节点均还关联至少一个字符节点,通过字符树能够确定每一地理位置数据中每一个字符的编码,最终将每一地理位置数据中所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种地理位置数据压缩方法,其特征在于,所述方法包括:获取预先构建的字符树,所述字符树是根据多个地理位置数据中所有不重复字符构建的,所述字符树包括一个根节点、多个关联节点及与每一所述关联节点关联的至少一个字符节点,每一所述关联节点用于关联其父节点和子节点,每一所述字符节点表征一个所述不重复字符;根据所述字符树,确定每一所述地理位置数据中每一字符的编码;将每一所述地理位置数据中所有字符的编码进行组合,得到每一所述地理位置数据压缩后的编码。2.如权利要求1所述的地理位置数据压缩方法,其特征在于,所述字符树包括第一分支和第二分支,所述根节点包括第一子节点和第二子节点,所述第一子节点和所述第二子节点分别与所述第一分支和所述第二分支相关联,所述第一子节点的权重值预先设置为第一预设值、所述第二子节点的权重值预先设置为第二预设值,所述第一分支和所述第二分支均包括多层,每一层包括一个关联节点和至少一个字符节点,处于同一个分支的各层的关联节点的权重值相同,处于同一个分支的各层的位置相同的字符节点的权重值相同,所述根据所述字符树,确定每一所述地理位置数据中每一字符的编码的步骤包括:对于每一所述地理位置数据中任一目标字符而言,将所述根节点与目标字符节点之间途径节点数最少的路径作为目标路径,所述目标字符节点为表征所述目标字符的字符节点;按照各节点途径顺序,将各节点的权重值依次排列而成的序列确定为所述目标字符的编码;将每一所述地理位置数据的每一字符作为所述目标字符,得到每一所述地理位置数据中每一字符的编码。3.如权利要求1所述的地理位置数据压缩方法,其特征在于,所述方法还包括:获取多个地理位置数据,每一所述地理位置数据包括至少一个字符;对所有地理位置数据包括的所有字符进行去重,得到所述多个地理位置数据中的不重复字符;根据所述不重复字符中每一字符在所述多个地理位置数据中出现的次数,计算所述不重复字符中每一字符的权重;根据所有所述不重复字符的权重,构建所述字符树。4.如权利要求3所述的地理位置数据压缩方法,其特征在于,所述字符树包括第一分支和第二分支,所述根据所有所述不重复字符的权重,构建所述字符树的步骤包括:生成所述根节点的第一子节点和第二子节点、并将所述第一子节点和所述第二子节点分别与所述第一分支和所述第二分支关联;基于所述第一子节点和与所述第二子节点,根据所有所述不重复字符的权重生成所述第一分支的各层的关联节点和字符节点以及所述第二分支的各层的关联节点和字符节点,得到所述字符树;将所述第一子节点的权重值设置为第一预设值、将与所述第二子节点的权重值预先设置为第二预设值,将处于同一个分支的各层的关联节点的权重值设置为相同,将处于同一个分支的各层的位置相同的字符节点的权重值设置为相同。
5.如权利要求4所述的地理位置数据压缩方法,其特征在于,将所述不重复字符按照其权重从大到小的顺序组成字符...

【专利技术属性】
技术研发人员:邹炎炎陶周天刘祖军
申请(专利权)人:智慧足迹数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1