一种线索数据分类的方法、装置、介质及电子设备制造方法及图纸

技术编号:37521614 阅读:19 留言:0更新日期:2023-05-12 15:44
本申请实施例提供一种线索数据分类的方法、装置、介质及电子设备,所述方法包括:获取目标标签配置规则表,其中,所述目标标签配置规则表用于定义划分待处理话单数据的规则;向至少一个流处理线程广播所述目标标签配置规则;通过所述目标标签配置规则所述至少一个流处理线程中的各流处理线程为待处理的话单数据分配标签。通过本申请的一些实施例保证了流处理的并行能力和数据一致性,提高了数据处理的时效性和吞吐量。的时效性和吞吐量。的时效性和吞吐量。

【技术实现步骤摘要】
一种线索数据分类的方法、装置、介质及电子设备


[0001]本申请涉及数据处理领域,具体而言本申请实施例涉及一种线索数据分类的方法、装置、介质及电子设备。

技术介绍

[0002]实时的流处理需要改变流向,由于规则的改变被化为高意向的用户还是低意向的用户,实时调整策略的实时生效,做了一个配置表即规则表,这个表与流处理框架结合实现动态的流向的改变。
[0003]例如,现有技术每间隔五秒或者三秒查一下库中的规则确定规则是否变化,变化了再去调整数据流,因此实时性处理较差。

技术实现思路

[0004]本申请实施例的目的在于提供一种线索数据分类的方法、装置、介质及电子设备,通过本申请的一些实施例保证了流处理的并行能力和数据一致性,提高了数据处理的时效性和吞吐量。
[0005]第一方面,本申请实施例提供一种线索数据分类的方法,所述方法包括:获取目标标签配置规则表,其中,所述目标标签配置规则表用于定义划分待处理话单数据的规则;向至少一个流处理线程广播所述目标标签配置规则;通过所述目标标签配置规则所述至少一个流处理线程中的各流处理线程为待处理的话单数据分配标签。
[0006]本申请的一些实施例通过主动识别目标标签配置规则表并向用于分类各话单数据的线程广播该目标标签配置规则表,进而可以实现根据最新的分类规则完成对话单数据的分类,提升分类结果的准确性。
[0007]在一些实施例中,所述获取目标标签配置规则表,包括:对数据库中的标签配置规则表进行实时监控,当确认所述标签配置规则表的内容发生变动则将变动后的所述标签配置规则表作为所述目标标签配置规则表。
[0008]本申请的一些实施例通过识别存储在数据库上标签配置规则表的变化情况来得到改变后的标签配置规则表(即目标标签配置规则表),可以实时获取最新的对话单分类的标签配置规则表并最终提升对话单数据分类的准确性。
[0009]在一些实施例中,通过flinkCDC监控所述数据库中的所述标签配置规则表。
[0010]本申请的一些实施例采用flinkCDC技术监控数据库上存储的标签配置规则表的内容是否发生变化,FlinkCDC这是一个可以直接从MySQL、PostgreSQL等数据库直接读取全量数据和增量变更数据的组件。。
[0011]在一些实施例中,所述数据库为mysql数据库。
[0012]本申请的一些实施例采用关系型数据库存储标签配置规则表。
[0013]在一些实施例中,所述向至少一个流处理线程广播所述目标标签配置规则,包括:利用广播流技术,将所述目标标签配置规则表发送到所述至少一个流处理线程中。
[0014]本申请的一些实施例通过广播流技术向各个流处理线程广播最新的标签配置规则表(即目标标签配置规则表)。
[0015]在一些实施例中,所述广播流技术为Flink广播流技术。
[0016]第二方面,本申请的一些实施例提供一种线索数据分类的装置,所述装置包括:目标标签配置规则表获取模块,被配置为获取目标标签配置规则表,其中,所述目标标签配置规则表用于定义划分待处理话单数据的规则;广播模块,被配置为向至少一个流处理线程广播所述目标标签配置规则;标签分配模块,被配置为通过所述目标标签配置规则所述至少一个流处理线程中的各流处理线程为待处理的话单数据分配标签。
[0017]第三方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面任意实施例所述的方法。
[0018]第四方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任意实施例所述的方法。
附图说明
[0019]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0020]图1为本申请实施例提供的线索数据分类的系统的架构图;
[0021]图2为本申请实施例提供的线索数据分类的方法的流程图之一;
[0022]图3为本申请实施例提供的线索数据分类的方法流程图之二;
[0023]图4为本申请实施例提供的线索数据分类的装置的组成框图;
[0024]图5为本申请实施例提供的电子设备组成示意图。
具体实施方式
[0025]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
[0026]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0027]至少为了解决
技术介绍
部分存在的技术问题,本申请的一些实施例通过增加标签配置规则表、广播该表的形式实现流处理数据中的数据动态分流。例如,在本申请的一些实施例使用flinkCDC实时同步各线程所用的标签配置规则表与数据库中的标签配置规则表,使用广播流将数据库中最新的标签配置规则表(即目标标签配置规则表)广播到不同的数据流中,根据配置实现动态分流的功能。
[0028]请参看图1,图1为本申请实施例提供的线索数据分类的系统,该系统包括多个客户端以及服务器100,其中,图1示例性提供了第一客户端101以及第二客户端102。
[0029]图1的客户端用于生成话单数据,这些话单数据需要经过服务器对话单进行分类并分配对应的类别标签。
[0030]例如,根据服务器上运行的多个线程分别判断各话单数据的类别并为对应话单分配类别标签。例如,第一客户端101生成的第一话单对应的通话时长为10s,服务器根据该话单的有效时长以及目标标签分配规则表判断该话单属于“"愿意了解活动”的类别标签。可以理解的是,由于标签分配规则表中的规则可能会实时变化更新,因此本申请的一些实施例会实时监控该表的变化并在确认该表发生变化时读取最新的表作为目标标签分配规则表,之后再依据该表中的话单分类规则对话单数据进行分类以及对应类别的标签。
[0031]需要说明的是,图1仅用于示例性阐述本申请的系统架构,本领域技术人员可以根据具体的应用场景构建对应的处理架构,本申请实施例不限定系统架构的具体构成。
[0032]下面结合图2示例性阐述由图1的服务器100执行的本申请一些实施例线索数据分类的方法。
[0033]如图2所示,本申请实施例提供一种线索数据分类的方法,该方法包括:S101,获取目标标签配置规则表,其中,所述目标标签配置规则表用于定义划分待处理话单数据的规则;S102,向至少一个流处理线程广播所述目标标签配置规则;S103,通过所述目标标签配置规则所述至少一个流处理线程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种线索数据分类的方法,其特征在于,所述方法包括:获取目标标签配置规则表,其中,所述目标标签配置规则表用于定义划分待处理话单数据的规则;向至少一个流处理线程广播所述目标标签配置规则;通过所述目标标签配置规则所述至少一个流处理线程中的各流处理线程为待处理的话单数据分配标签。2.如权利要求1所述的方法,其特征在于,所述获取目标标签配置规则表,包括:对数据库中的标签配置规则表进行实时监控,当确认所述标签配置规则表的内容发生变动则将变动后的所述标签配置规则表作为所述目标标签配置规则表。3.如权利要求2所述的方法,其特征在于,通过flinkCDC监控所述数据库中的所述标签配置规则表。4.如权利要求2所述的方法,其特征在于,所述数据库为mysql数据库。5.如权利要求2所述的方法,其特征在于,所述向至少一个流处理线程广播所述目标标签配置规则,包括:利用广播流技术,将所述目标标签配置规则表发送到所述至少一个流处理线...

【专利技术属性】
技术研发人员:李由梁鹏斌曾文佳
申请(专利权)人:零犀北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1