一种语料数据管理方法及相关设备技术

技术编号:39486986 阅读:9 留言:0更新日期:2023-11-24 11:07
本申请实施例提供了一种语料数据管理方法及相关设备,用于优化及管理语料模型数据,以管理回答数据的质量,从而提升服务质量和效率

【技术实现步骤摘要】
一种语料数据管理方法及相关设备


[0001]本申请实施例涉及数据处理领域,尤其涉及一种语料数据管理方法及相关设备


技术介绍

[0002]随着生成式人工智能
(AIGC

artificial intelligence generated content)
技术的快速发展,以及企业数字化理财需求的不断增加,因此,客服中心亟需完成智能化转型

但是,在实际的转型过程中,智能客服后台的语料库由于数据杂糅,或存在疏漏错误,容易导致
AIGC
产出的结果不可控,以此制约客服中心服务质量和效率提升

[0003]由此,亟需一种提升客服中心的服务质量和效率的方案


技术实现思路

[0004]本申请实施例提供了一种语料数据管理方法及相关设备,用于优化及管理语料模型数据,以管理回答数据的质量,从而提升服务质量和效率

[0005]本申请实施例第一方面提供了一种语料数据管理方法,包括:
[0006]获取初始语料数据;其中,所述初始语料数据与用户的查询语料存在关联;
[0007]将所述初始语料数据输入预先完成的目标语料模型,以根据所述目标语料模型对所述初始语料数据进行筛选,获取目标语料数据;其中,所述目标语料数据与回答语料存在关联;
[0008]审核所述目标语料数据,判断所述目标语料数据是否满足预设审核条件;
[0009]若所述目标语料数据满足所述预设审核条件,将审核后的目标语料数据存入语料库,以对所述语料库进行管理

[0010]可选地,所述获取初始语料数据,包括:
[0011]基于用户的查询操作,获取用户输入的查询语料数据;
[0012]对所述查询语料数据进行清洗,去除所述查询语料数据中冗余数据;其中,所述冗余数据包括所述查询语料数据中的语料类别数据

语料重复数据或语料标识数据;
[0013]确定经过清洗后的查询语料数据为所述初始语料数据

[0014]可选地,所述将所述初始语料数据输入预先完成的目标语料模型,以根据所述目标语料模型对所述初始语料数据进行筛选,获取目标语料数据,包括:
[0015]将所述初始语料数据进行润色,获取中间语料数据;
[0016]基于预设风险规则,提取所述中间语料数据中时间语料数据

关键词语料数据或观点语料数据中的至少一种;
[0017]根据所述时间语料数据

所述关键语料数据或所述观点语料数据中的至少一种生成所述目标语料数据

[0018]可选地,所述判断所述目标语料数据是否满足预设审核条件之后,所述方法还包括:
[0019]若所述目标语料数据未满足所述预设审核条件,确定待修正语料数据;
[0020]根据所述待修正语料数据对所述目标语料数据进行修正,并将修正后的目标语料数据存入所述语料库

[0021]可选地,所述方法还包括:
[0022]若获取错误报告数据,根据所述错误报告数据确定所述语料库中的所述目标语料数据;
[0023]根据所述目标语料数据确定所述目标语料模型的训练路径数据;其中,所述训练路径数据用于表示所述目标语料模型的训练过程;
[0024]对所述训练路径数据进行修正,获取经过修正后的训练路径数据;
[0025]根据所述经过修正后的训练路径数据对所述目标语料模型进行修正,将所述目标语料模型替换为经过修正后的目标语料模型,以使得所述经过修正后的目标语料模型对所述初始语料数据进行筛选

[0026]可选地,所述获取经过修正后的训练路径数据之后,所述方法还包括:
[0027]根据所述训练路径数据对所述语料库中的所有语料数据进行检查,获取异常语料数据;
[0028]对所述异常语料数据进行修正,并将修正后的异常语料数据存入所述语料库

[0029]可选地,所述方法还包括:
[0030]若获取定损请求数据,根据所述定损请求数据确定所述语料库中的所述目标语料数据;其中,所述目标语料数据包括时间语料数据

关键词语料数据或观点语料数据中的至少一种;
[0031]根据所述时间语料数据

所述关键词语料数据或所述观点语料数据中的至少一种对所述定损请求数据进行评估,获取评估结果数据;
[0032]若所述评估结果数据满足预设评估条件,根据所述定损请求数据及所述目标语料数据确定所述用户的损失结果数据,以使得客服人员对所述损失结果数据进行处理

[0033]本申请实施例第二方面提供了一种语料数据管理系统,包括:
[0034]获取单元,用于获取初始语料数据;其中,所述初始语料数据与用户的查询语料存在关联;
[0035]输入单元,用于将所述初始语料数据输入预先完成的目标语料模型,以根据所述目标语料模型对所述初始语料数据进行筛选,获取目标语料数据;其中,所述目标语料数据与回答语料存在关联;
[0036]判断单元,用于审核所述目标语料数据,判断所述目标语料数据是否满足预设审核条件;
[0037]存储单元,用于当所述目标语料数据满足所述预设审核条件时,将审核后的目标语料数据存入语料库,以对所述语料库进行管理

[0038]本申请实施例第二方面提供的用于执行第一方面所述的语料数据管理方法

[0039]本申请实施例第三方面提供了一种语料数据管理装置,包括:
[0040]中央处理器,存储器,输入输出接口,有线或无线网络接口以及电源;
[0041]所述存储器为短暂存储存储器或持久存储存储器;
[0042]所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行第一方面所述的语料数据管理方法

[0043]本申请实施例第四方面提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括指令,当所述指令在计算机上运行时,使得计算机执行第一方面所述的语料数据管理方法

[0044]从以上技术方案可以看出,本申请实施例具有以下优点:通过本申请实施例公开的一种语料数据管理方法,先获取初始语料数据;其中,初始语料数据与用户的查询语料存在关联;再将初始语料数据输入预先完成的目标语料模型,以根据目标语料模型对初始语料数据进行筛选,获取目标语料数据;其中,目标语料数据与回答语料存在关联;然后,审核目标语料数据,判断目标语料数据是否满足预设审核条件;最后,当目标语料数据满足预设审核条件时,将审核后的目标语料数据存入语料库,以对语料库进行管理

由此,由模型输出的答复语料满足相关的审核条件,同时,相关的客服中心能自动生成答复语料,能尽可能地提升客服中心的服务质量和效率

附图说明
...

【技术保护点】

【技术特征摘要】
1.
一种语料数据管理方法,其特征在于,所述方法包括:获取初始语料数据;其中,所述初始语料数据与用户的查询语料存在关联;将所述初始语料数据输入预先完成的目标语料模型,以根据所述目标语料模型对所述初始语料数据进行筛选,获取目标语料数据;其中,所述目标语料数据与回答语料存在关联;审核所述目标语料数据,判断所述目标语料数据是否满足预设审核条件;若所述目标语料数据满足所述预设审核条件,将审核后的目标语料数据存入语料库,以对所述语料库进行管理
。2.
根据权利要求1所述的语料数据管理方法,其特征在于,所述获取初始语料数据,包括:基于用户的查询操作,获取用户输入的查询语料数据;对所述查询语料数据进行清洗,去除所述查询语料数据中冗余数据;其中,所述冗余数据包括所述查询语料数据中的语料类别数据

语料重复数据或语料标识数据;确定经过清洗后的查询语料数据为所述初始语料数据
。3.
根据权利要求1所述的语料数据管理方法,其特征在于,所述将所述初始语料数据输入预先完成的目标语料模型,以根据所述目标语料模型对所述初始语料数据进行筛选,获取目标语料数据,包括:将所述初始语料数据进行润色,获取中间语料数据;基于预设风险规则,提取所述中间语料数据中时间语料数据

关键词语料数据或观点语料数据中的至少一种;根据所述时间语料数据

所述关键语料数据或所述观点语料数据中的至少一种生成所述目标语料数据
。4.
根据权利要求1所述的语料数据管理方法,其特征在于,所述判断所述目标语料数据是否满足预设审核条件之后,所述方法还包括:若所述目标语料数据未满足所述预设审核条件,确定待修正语料数据;根据所述待修正语料数据对所述目标语料数据进行修正,并将修正后的目标语料数据存入所述语料库
。5.
根据权利要求1所述的语料数据管理方法,其特征在于,所述方法还包括:若获取错误报告数据,根据所述错误报告数据确定所述语料库中的所述目标语料数据;根据所述目标语料数据确定所述目标语料模型的训练路径数据;其中,所述训练路径数据用于表示所述目标语料模型的训练过程;对所述训练路径数据进行修正,获取经过修正后的训练路径数据;根据所述经过修正后的训练路径数据对所述目标语料模型进行修正...

【专利技术属性】
技术研发人员:顾湛博
申请(专利权)人:招银云创信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1