话单信息重复判断方法及装置制造方法及图纸

技术编号:32559733 阅读:11 留言:0更新日期:2022-03-09 16:43
本发明专利技术公开了一种话单信息重复判断方法及装置,其中,方法包括:接收步骤,接收一条话单信息,提取话单信息的话单主键;第一判断步骤,判断话单主键是否存在布隆过滤器中;若否,将话单主键存储在布隆过滤器中,并执行存储步骤;若是,执行第二判断步骤;第二判断步骤,查询话单主键是否存储在指定数据库中;若否,执行存储步骤;若是,执行重单步骤;存储步骤,将话单信息的话单主键存储在指定数据库中,并返回话单信息非重复话单信息;重单步骤,记录并返回话单信息为重复话单信息。采用布隆过滤器对话单信息进行第一级剔重判断,提升剔重速度。当布隆过滤器在判断时发现有重复话单主键时,通过指定数据库再次进行验证,保障重单判断的准确性。断的准确性。断的准确性。

【技术实现步骤摘要】
话单信息重复判断方法及装置


[0001]本专利技术涉及业务支撑领域,具体涉及一种话单信息重复判断方法及装置。

技术介绍

[0002]在电信企业计费账务处理过程中,为了避免给用户多计费,基于话单主键进行话单信息重复判断处理是必不可少的环节,现有绝大多数话单重复判断处理都是基于在关系型数据库如ORACLE数据库中建立剔重表来进行。具体的,剔重时将话单主键作为剔重表的主键,当接收一张话单时向该话单对应类型的剔重表插入该话单的主键,如果插入成功表示没有重单,否则表明有重单。
[0003]现有基于关系型数据库建立剔重表方式进行剔重的优点是简单快捷,但缺点是会占用核心数据库大量的存储空间和IO、成本昂贵。随着移动互联网业务的磅礴发展,计费系统接收的话单量成指数曲线急速增长,导致剔重表占用的空间和IO消耗也急剧增长,增加成本开销。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的话单信息重复判断方法及装置。
[0005]根据本专利技术的一个方面,提供了一种话单信息重复判断方法,其包括:
[0006]接收步骤,接收一条话单信息,提取话单信息的话单主键;
[0007]第一判断步骤,判断话单主键是否存在布隆过滤器中;若否,将话单主键存储在布隆过滤器中,并执行存储步骤;若是,执行第二判断步骤;
[0008]第二判断步骤,查询话单主键是否存储在指定数据库中;若否,执行存储步骤;若是,执行重单步骤;
[0009]存储步骤,将话单信息的话单主键存储在指定数据库中,并返回话单信息非重复话单信息;
[0010]重单步骤,记录并返回话单信息为重复话单信息。
[0011]根据本专利技术的另一方面,提供了一种话单信息重复判断装置,其包括:
[0012]接收模块,适于接收一条话单信息,提取话单信息的话单主键;
[0013]第一判断模块,适于判断话单主键是否存在布隆过滤器中;若否,将话单主键存储在布隆过滤器中,并执行存储模块;若是,执行第二判断模块;
[0014]第二判断模块,适于查询话单主键是否存储在指定数据库中;若否,执行存储模块;若是,执行重单模块;
[0015]存储模块,适于将话单信息的话单主键存储在指定数据库中,并返回话单信息非重复话单信息;
[0016]重单模块,适于记录并返回话单信息为重复话单信息。
[0017]根据本专利技术的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和
通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0018]所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述话单信息重复判断方法对应的操作。
[0019]根据本专利技术的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述话单信息重复判断方法对应的操作。
[0020]根据本专利技术的话单信息重复判断方法及装置,接收步骤,接收一条话单信息,提取话单信息的话单主键;第一判断步骤,判断话单主键是否存在布隆过滤器中;若否,将话单主键存储在布隆过滤器中,并执行存储步骤;若是,执行第二判断步骤;第二判断步骤,查询话单主键是否存储在指定数据库中;若否,执行存储步骤;若是,执行重单步骤;存储步骤,将话单信息的话单主键存储在指定数据库中,并返回话单信息非重复话单信息;重单步骤,记录并返回话单信息为重复话单信息。本专利技术采用布隆过滤器对话单信息进行快速地第一级剔重判断,提升剔重速度。当布隆过滤器在判断时发现有重复话单主键时,通过指定数据库再次进行验证是否为重复话单信息,保障重单判断的准确性。进一步,本专利技术可以利用低廉的X86服务器,有效地提高剔重效率,降低成本消耗,且扩展性好。
[0021]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0022]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0023]图1示出了根据本专利技术一个实施例的话单信息重复判断方法的流程图;
[0024]图2示出了根据本专利技术一个实施例的话单信息重复判断装置的功能框图;
[0025]图3示出了根据本专利技术一个实施例的一种电子设备的结构示意图。
具体实施方式
[0026]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0027]图1示出了根据本专利技术一个实施例的话单信息重复判断方法的流程图。如图1所示,话单信息重复判断方法具体包括如下步骤:
[0028]步骤S101,接收一条话单信息,提取话单信息的话单主键。
[0029]话单信息记录了用户的每次通话情况,若话单信息重复,会导致对用户多计费问题。因此,话单信息的剔重尤为重要。本实施例当接收到一条话单信息后,需要对该条话单信息进行重复判断。在进行重复判断时,基于提取到的话单信息的话单主键进行重复判断。话单主键包括如号码、开始时间等。号码可以为被叫号码等。话单主键可以根据实施情况设
置,此处不做限定。
[0030]步骤S102,判断话单主键是否存在布隆过滤器中。
[0031]布隆过滤器(BloomFilter)采用概率型数据结构,利用位数组表示一个集合,判断一个元素是否属于这个集合。一个空的布隆过滤器由长度为m的bit数组构成,且所有位都初始化0。一个元素可以通过k个不同的散列函数转换为随机散列到bit数组的k个位置上(也可以通过一个散列函数输出到k个位置),k小于m。
[0032]布隆过滤器的存储空间和插入/查询时间都是常数,可以高效地插入和查询。另外,散列函数相互之间没有关系,方便由硬件并行实现。布隆过滤器不需要存储元素本身,在某些对保密要求非常严格的场合有优势。布隆过滤器的特点是可以用来确认某样东西一定不存在或者可能存在。相比于传统的List、Set、Map等数据结构,更高效、占用空间更少。且使用布隆过滤器可以快速判断元素是否存在,避免很多不必要的磁盘IO操作。
[0033]具体将布隆过滤器应用于本实施例时,对于话单信息,需要设置布隆过滤器的长度、散列函数个数或散列函数进行计算得到的散列值等。布隆过滤器的长度m及散列函数计算得到的散列值k需要根据话单类型的处理量n和话单允许重复率p设置。具体设置如下公式所示:
[0034][0035本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种话单信息重复判断方法,其特征在于,方法包括:接收步骤,接收一条话单信息,提取所述话单信息的话单主键;第一判断步骤,判断所述话单主键是否存在布隆过滤器中;若否,将所述话单主键存储在布隆过滤器中,并执行存储步骤;若是,执行第二判断步骤;第二判断步骤,查询所述话单主键是否存储在指定数据库中;若否,执行存储步骤;若是,执行重单步骤;存储步骤,将所述话单信息的话单主键存储在指定数据库中,并返回所述话单信息非重复话单信息;重单步骤,记录并返回所述话单信息为重复话单信息。2.根据权利要求1所述的方法,其特征在于,所述第一判断步骤进一步包括:使用散列函数对所述话单主键进行计算,得到对应的散列值;判断所述布隆过滤器中所述散列值对应位置的数据是否均为1;若是,判断所述话单主键存在布隆过滤器中。3.根据权利要求2所述的方法,其特征在于,所述将所述话单主键存储在布隆过滤器中进一步包括:将布隆过滤器中所述散列值对应位置的数据设置为1。4.根据权利要求1-3中任一项所述的方法,其特征在于,所述指定数据库为基于X86架构的非关系型数据库或轻量级关系型数据库。5.根据权利要求1-3中任一项所述的方法,其特征在于,所述指定数据库为Hadoop数据库。6.根据权利要求1所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:姜文平许志恒郭畅李彩萍渠创
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1