客服日志反馈回流数据库的方法及系统技术方案

技术编号:28465104 阅读:15 留言:0更新日期:2021-05-15 21:31
本发明专利技术公开一种客服日志反馈回流数据库的方法及系统,涉及人工智能技术领域,可以有效降低运维人员处理日志样本的工作量,提升处理效率。该方法包括:根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;针对客服日志预处理后得到待标注日志样本;将待标注日志样本进行聚合处理,分割成至少一个问句类簇;从每个问句类簇中筛选出一个待标注日志样本,分类标注后反馈回流至数据库中。该系统应用有上述方案所提的方法。用有上述方案所提的方法。用有上述方案所提的方法。

【技术实现步骤摘要】
客服日志反馈回流数据库的方法及系统


[0001]本专利技术涉及人工智能
,尤其涉及一种客服日志反馈回流数据库的方法及系统。

技术介绍

[0002]在金融科技领域,智能对话机器人产品的应用,如智能客服、催收机器人、智能营销机器人等是提升金融服务能力,降低人力成本的重要组成部分。这些机器人产品在投入运营以后所产生的日志,对提高产品模型质量、促进产品技术迭代、提升产品服务效果具有重要意义。
[0003]在实际应用中,如何收集、存储客服日志,并且经过处理以后回流到客服系统,现有技术存在诸多不足之处。首先,在对话日志收集环节中的日志缺失,缺乏统一的管理和存储。其次,客服系统需要不断添加样本日志对知识库进行维护,但是目前基于手工添加的方式效率低下。

技术实现思路

[0004]本专利技术的目的在于提供一种客服日志反馈回流数据库的方法及系统,可以有效降低运维人员处理日志样本的工作量,提升处理效率。
[0005]为了实现上述目的,本专利技术的第一方面提供一种客服日志反馈回流数据库方法,包括:
[0006]根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;
[0007]针对所述客服日志预处理后得到待标注日志样本;
[0008]将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇;
[0009]从每个所述问句类簇中筛选出一个待标注日志样本,分类标注后反馈回流至数据库。
[0010]优选地,在步骤根据预设的采集字段从客服系统中采集对应的咨询问句之前包括
[0011]针对用户在客服系统中提出的咨询问句,基于预设的打标规则分别对各所述咨询问句进行编码打标。
[0012]较佳地,根据采集字段从客服系统中采集对应的咨询问句,形成客服日志的方法包括:
[0013]将所述编码作为采集字段,定时从客服系统中采集与采集字段编码一致的咨询问句形成客服日志;
[0014]采用接口或者消息队列的形式将所述客服日志发送至日志存储系统中保存。
[0015]进一步地,针对所述客服日志预处理后得到待标注日志样本的方法包括:
[0016]定时和/或定量从日志存储系统中抽取所述客服日志,构建待处理数据集;
[0017]从待处理数据集中依次抽取所述客服日志,删除日志长度小于阈值长度的客服日
志;
[0018]从剩余的待处理数据集中依次抽取所述客服日志,删除数据库中已存在的客服日志;
[0019]从剩余的待处理数据集中依次抽取所述客服日志,采用纠错词典对所述客服日志做纠错处理;
[0020]从纠错后的待处理数据集中抽取所述客服日志,采用归一化文本编码的方式编码后得到与所述客服日志一一对应的待标注日志样本。
[0021]优选地,将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇的方法包括:
[0022]基于多个所述待标注日志样本的相似度,将其中互为相似的所述待标注日志样本聚合在一起形成问句类簇。
[0023]较佳地,从每个所述问句类簇中筛选出一个待标注日志样本的方法包括:
[0024]统计每个所述问句类簇中相同待标注日志样本的出现频率,筛选出频率最高的待标注日志样本。
[0025]优选地,聚合处理所采用的算法为单遍聚类算法。
[0026]优选地,分类标注后反馈回流至数据库中的方法包括:
[0027]所述数据库中包括多个标准日志样本以及对应的问题答案,或者同时包括与所述标准日志样本关联的相似日志样本;
[0028]若数据库中不存在与所述待标注日志样本相似的标准日志样本,则在编辑对应的问题答案后将所述待标注日志样本作为标准日志样本反馈回流至数据库中保存;
[0029]若数据库中存在与所述待标注日志样本相似的标准日志样本,则将所述待标注日志样本作为对应标准日志样本的相似日志样本反馈回流至数据库中保存。
[0030]与现有技术相比,本专利技术提供的客服日志反馈回流数据库方法具有以下有益效果:
[0031]本专利技术提供的客服日志反馈回流数据库方法中,首先根据采集字段设置埋点,从客服系统中采集所需要的咨询问句形成客服日志,然后针对这些客服日志预处理后得到待标注日志样本,接着将待标注日志样本进行聚合处理,基于待标注日志样本的相似度分割成多个问句类簇,从每个问句类簇中筛选出一个待标注日志样本,分类标注后反馈回流至数据库。
[0032]可见,本专利技术不仅能够对客服系统中用户的咨询问句进行自动采集,而且还可以将标注后的日志样本自动存入数据库,并反馈回流至客服系统训练再利用。相对于现有技术方案,不仅可以有效降低运维人员对日志样本处理的工作量,而且由于标注完成的日志样本可以直接反馈回流至客服系统,因此还提升了客服系统回答问题的时效性和准确性。
[0033]本专利技术的第二方面提供一种客服日志反馈回流数据库系统,应用于上述技术方案所述的客服日志反馈回流数据库方法中,所述系统包括:
[0034]采集单元,用于根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;
[0035]处理单元,用于针对所述客服日志预处理后得到待标注日志样本;
[0036]聚合单元,用于将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇;
[0037]标注单元,用于从每个所述问句类簇中筛选出一个待标注日志样本,分类标注后
反馈回流至数据库中。
[0038]与现有技术相比,本专利技术提供的客服日志反馈回流数据库系统的有益效果与上述技术方案提供的客服日志反馈回流数据库方法的有益效果相同,在此不做赘述。
[0039]本专利技术的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述客服日志反馈回流数据库方法的步骤。
[0040]与现有技术相比,本专利技术提供的计算机可读存储介质的有益效果与上述技术方案提供的客服日志反馈回流数据库方法的有益效果相同,在此不做赘述。
附图说明
[0041]此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0042]图1为本专利技术实施例中客服日志反馈回流数据库的方法的流程示意图;
[0043]图2为本专利技术实施例中客服日志反馈回流数据库系统的架构示意图。
具体实施方式
[0044]为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本专利技术保护的范围。
[0045]实施例一
[0046]请参阅图1和图2,本实施例提供一种客服日志反馈回流数据库方法,包括:
[0047]根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客服日志反馈回流数据库方法,其特征在于,包括:根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;针对所述客服日志预处理后得到待标注日志样本;将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇;从每个所述问句类簇中筛选出一个待标注日志样本,分类标注后反馈回流至数据库。2.根据权利要求1所述的方法,其特征在于,在步骤根据预设的采集字段从客服系统中采集对应的咨询问句之前包括:针对用户在客服系统中提出的咨询问句,基于预设的打标规则分别对各所述咨询问句进行编码打标。3.根据权利要求2所述的方法,其特征在于,根据采集字段从客服系统中采集对应的咨询问句,形成客服日志的方法包括:将所述编码作为采集字段,定时从客服系统中采集与采集字段编码一致的咨询问句形成客服日志;采用接口或者消息队列的形式将所述客服日志发送至日志存储系统中保存。4.根据权利要求3所述的方法,其特征在于,针对所述客服日志预处理后得到待标注日志样本的方法包括:定时和/或定量从日志存储系统中抽取所述客服日志,构建待处理数据集;从待处理数据集中依次抽取所述客服日志,删除日志长度小于阈值长度的客服日志;从剩余的待处理数据集中依次抽取所述客服日志,删除数据库中已存在的客服日志;从剩余的待处理数据集中依次抽取所述客服日志,采用纠错词典对所述客服日志做纠错处理;从纠错后的待处理数据集中抽取所述客服日志,采用归一化文本编码的方式编码后得到与所述客服日志一一对应的待标注日志样本。5.根据权利要求1或4所述的方法,其特征在于,将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇的方法包括...

【专利技术属性】
技术研发人员:陈超
申请(专利权)人:苏宁金融科技南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1