话单数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:38899037 阅读:12 留言:0更新日期:2023-09-22 14:19
本申请提供一种话单数据处理方法、装置、设备及存储介质。该方法包括:获取话单文件,话单文件中包括多条话单数据,话单数据中包括多个字段;根据多条话单数据中的重复字段生成话单文件的文件头,对话单文件进行第一次压缩;根据经过第一次压缩的话单文件中各字段中各元素的离散度,对话单文件的文件头进行更新,得到更新后的文件头,对话单文件进行第二次压缩。本申请的方法,提高了话单数据处理效率。提高了话单数据处理效率。提高了话单数据处理效率。

【技术实现步骤摘要】
话单数据处理方法、装置、设备及存储介质


[0001]本申请涉及通信
,尤其涉及一种话单数据处理方法、装置、设备及存储介质。

技术介绍

[0002]电信行业的话单中可以包含上百种数据字段,包括但不限于主叫号码、主叫号码归属地市、主叫号码归属省、被叫号码、被叫号码归属地市、被叫号码归属省、呼叫开始时间、呼叫结束时间等等信息。话单处理程序在处理的过程中需要针对每条话单的信息进行处理,包括号码和用户编码的转换、产品信息的查询、省市编码的查询、关键信息的转换等等。随着各种信息在话单文件中的增加,最终的单条话单的容量会急剧增加。一个话单文件需要在多个程序中进行流转,话单的大小严重影响处理效率、存储容量、IO吞吐、外部资源支撑等多种资源。
[0003]现有技术可以将话单文件中的多个话单数据,例如:通话话单或流量话单进行合并,或通过压缩算法对话单文件中的话单数据进行单条压缩。
[0004]然而,将多个话单进行合并时,能够合并的话单数量有限,压缩效果较差,通过压缩算法进行话单压缩时会浪费大量计算资源,且效率较低。

技术实现思路

[0005]本申请提供一种话单数据处理方法、装置、设备及存储介质,用以解决话单数据处理效率低的问题。
[0006]第一方面,本申请提供一种话单数据处理方法,包括:
[0007]获取话单文件,所述话单文件中包括多条话单数据,所述话单数据中包括多个字段;
[0008]根据多条所述话单数据中的重复字段生成所述话单文件的文件头,对所述话单文件进行第一次压缩;
[0009]根据经过第一次压缩的话单文件中各字段中各元素的离散度,对所述话单文件的文件头进行更新,得到更新后的文件头,对所述话单文件进行第二次压缩。
[0010]第二方面,本申请提供一种话单数据处理装置,包括:
[0011]获取模块,用于获取话单文件,所述话单文件中包括多条话单数据,所述话单数据中包括多个字段;
[0012]压缩模块,用于根据多条所述话单数据中的重复字段生成所述话单文件的文件头,对所述话单文件进行第一次压缩;
[0013]所述压缩模块,还用于根据经过第一次压缩的话单文件中各字段中各元素的离散度,对所述话单文件的文件头进行更新,得到更新后的文件头,对所述话单文件进行第二次压缩。
[0014]第三方面,本申请提供一种话单数据处理设备,包括:
[0015]处理器,存储器,通信接口;
[0016]所述存储器用于存储所述处理器的可执行指令;
[0017]其中,所述处理器配置为经由执行所述可执行指令来执行如上第一方面所述的话单数据处理方法。
[0018]第四方面,本申请提供一种可读存储介质,包括:其上存储有计算机程序,所述计算机程序被处理器执行时实现执行如上第一方面所述的话单数据处理方法。
[0019]本申请提供的话单数据处理方法、装置、设备及存储介质,通过获取话单文件,根据多条话单数据中的重复字段生成话单文件的文件头,对话单文件进行第一次压缩,根据经过第一次压缩的话单文件中各字段中各元素的离散度,对话单文件的文件头进行更新,得到更新后的文件头,对话单文件进行第二次压缩,其中,根据重复字段对话单文件进行提取汇总,完成对话单文件的第一次压缩,压缩方式简单,效率较高,进一步的,通过各字段中各元素的离散度确定部分重复字段,以对话单文件进行二次压缩,压缩方式也较为简单,效率较高,在第一次压缩的基础上增加了第二次压缩,一定程度上也增加了话单数据的压缩比重。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0021]图1为本申请实施例提供的话单数据处理方法的流程示意图;
[0022]图2为具有字段重复性的部分话单文件的示例图;
[0023]图3为话单重复字段以及提取重复字段后的剩余话单数据的示例图;
[0024]图4为本申请实施例提供的根据多条话单数据中的重复字段生成话单文件的文件头,对话单文件进行第一次压缩的流程示意图;
[0025]图5为本申请实施例提供的根据经过第一次压缩的话单文件中各字段中各元素的离散度,对话单文件的文件头进行更新,得到更新后的文件头,对话单文件进行第二次压缩的流程示意图;
[0026]图6为本申请实施例提供的对经过第二次压缩的话单文件进行读取的流程示意图;
[0027]图7为本申请实施例提供的一种话单数据处理装置的结构示意图;
[0028]图8为本申请实施例提供的一种话单数据处理设备的结构示意图。
[0029]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0030]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0031]现有技术可以将话单文件中的多个话单数据,例如:通话话单或流量话单进行合并,或通过压缩算法对话单文件中的话单数据进行单条压缩。然而,将多个话单进行合并时,能够合并的话单数量有限,压缩效果较差,通过压缩算法进行话单压缩时会浪费大量计算资源,且效率较低。
[0032]本申请通过获取话单文件,根据多条话单数据中的重复字段生成话单文件的文件头,对话单文件进行第一次压缩,根据经过第一次压缩的话单文件中各字段中各元素的离散度,对话单文件的文件头进行更新,得到更新后的文件头,对话单文件进行第二次压缩,其中,根据重复字段对话单文件进行提取汇总,完成对话单文件的第一次压缩,压缩方式简单,效率较高,进一步的,通过各字段中各元素的离散度确定部分重复字段,以对话单文件进行二次压缩,压缩方式也较为简单,效率较高,在第一次压缩的基础上增加了第二次压缩,一定程度上也增加了话单数据的压缩比重。
[0033]下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
[0034]图1为本申请第一实施例提供的话单数据处理方法的流程示意图,执行主体为话单数据处理装置,一般而言可以通过软件实现,或者硬件实现,或者软件和硬件相结合的方式实现。
[0035]如图1所示,本实施例的话单数据处理方法可以包括以下步骤:
[0036]步骤S101、获取话单文件,话单文件中包括多条话单数据,话单数据中包括多个字段。
[0037]具体地,可以获取待处理的话单文件,话单文件本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种话单数据处理方法,其特征在于,包括:获取话单文件,所述话单文件中包括多条话单数据,所述话单数据中包括多个字段;根据多条所述话单数据中的重复字段生成所述话单文件的文件头,对所述话单文件进行第一次压缩;根据经过第一次压缩的话单文件中各字段中各元素的离散度,对所述话单文件的文件头进行更新,得到更新后的文件头,对所述话单文件进行第二次压缩。2.根据权利要求1所述的方法,其特征在于,所述根据多条所述话单数据中的重复字段生成所述话单文件的文件头,包括:对多条所述话单数据中的重复字段设置对应的替代符;将所述替代符、对应的重复字段的列号以及对应重复字段的内容,作为所述话单文件的文件头。3.根据权利要求2所述的方法,其特征在于,所述对所述话单文件进行第一次压缩,包括:从所述文件头中提取所述替代符及其对应的重复字段;运用所述替代符替代所述多条话单数据中对应的重复字段,得到所述经过第一次压缩的话单文件;将所述经过第一次压缩的话单文件存储至所述话单数据处理装置中。4.根据权利要求3所述的方法,其特征在于,所述根据经过第一次压缩的话单文件中各字段中各元素的离散度,对所述话单文件的文件头进行更新,包括:统计所述经过第一次压缩的话单文件中各字段中各元素的离散度;计算各字段中离散度较高的一定数量的所述元素的离散度之和;根据所述各字段中离散度较高的一定数量的所述元素的离散度之和,对所述文件头进行更新。5.根据权利要求4所述的方法,其特征在于,所述根据所述各字段中离散度较高的一定数量的所述元素的离散度之和,对所述文件头进行更新,包括:从所述字段中筛选大离散度字段,所述大离散度字段是指所述离散度较高的一定数量的所述元素的离散度之和大于离散度阈值的字段;若存在一定数量的连续的所述大离散度字段,对连续的所述大离散度字段中离散度最高的元素进行交叉组合,得到至少一个部分重复字段;根据所述部分重复字段对所述文件头进行更新。6.根据权利要求5所述的方法,其特征在于,所述根据所述部分重复字段对所述文件头进行更新,包括:对至少一个所述...

【专利技术属性】
技术研发人员:王飞毛聪李光明
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1