【技术实现步骤摘要】
话务数据处理方法及装置
本申请涉及数据处理领域,具体涉及一种话务数据处理方法及装置。
技术介绍
随着移动通信技术的发展,目前各行各业呼叫业务中大量应用智能语音机器人,存有大量的用户交互的语音数据,通过对交互场景进行分析及策略制定可以得到大量标签,可根据行业及业务类型对群用户、个人用户构建对应的标签库。企业呼叫中心作为运营平台与用户之间的桥梁起着至关重要的作用。近年来,智能语音技术产业规模在全球用户需求拉动、国家战略指导和企业竞争等多重因素驱动下实现了快速和持续的增长,在移动互联网、运营商、智能家居、汽车电子、金融支付、在线教育及医疗等领域应用不断深入。在海量数据和深度学习的推动下,语音识别、语音合成、声纹识别等智能语音技术,日趋成熟,开始进入实用化的阶段。企业呼叫中心作为企业与用户之间的重要桥梁,通过采用目前国际主流的DNN(深度神经网络)和HMM(隐马尔可夫模型)的方法训练的中文语音识别技术,能够适用不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境,同时利用企业呼叫中心积累的海量语音语料和文 ...
【技术保护点】
1.一种话务数据处理方法,其特征在于,所述方法包括:/n基于预设语料库中的句子样本数据,进行标准化句向量模型训练;/n将接收到的录音数据文件转化为文本内容;/n将所述文本内容进行句子切分,并计算每个句子的句向量;/n基于所述标准化句向量模型对所述每个句子的句向量进行标准化训练,得到对应的标准化句子;/n将所述标准化句子进行关键词提取,并根据提取到的关键词生成话务数据分析报表。/n
【技术特征摘要】
1.一种话务数据处理方法,其特征在于,所述方法包括:
基于预设语料库中的句子样本数据,进行标准化句向量模型训练;
将接收到的录音数据文件转化为文本内容;
将所述文本内容进行句子切分,并计算每个句子的句向量;
基于所述标准化句向量模型对所述每个句子的句向量进行标准化训练,得到对应的标准化句子;
将所述标准化句子进行关键词提取,并根据提取到的关键词生成话务数据分析报表。
2.根据权利要求1所述的话务数据处理方法,其特征在于,所述基于预设语料库中的句子样本数据,进行标准化句向量模型训练,包括:
将预设语料库中的各句子样本数据进行句向量计算,得到句向量样本集合;
将所述句向量样本集合中的每个句向量样本进行相似性计算;
利用神经网络算法对符合相似性阈值的多个句向量进行标准化训练,建立标准化句向量模型。
3.根据权利要求2所述的话务数据处理方法,其特征在于,所述基于所述标准化句向量模型对所述每个句子的句向量进行标准化训练,得到对应的标准化句子,包括:
将所述每个句子的句向量与所述句向量样本集合中的各句向量样本进行相似性计算;
分别选择符合与该每个句子的句向量相似性阈值的句向量样本所对应的标准化句向量模型,对该每个句子的句向量进行标准化训练;
将训练生成的每个句子的标准句向量进行转化,输出对应的标准化句子。
4.根据权利要求1所述的话务数据处理方法,其特征在于,在所述将所述文本内容进行句子切分之前,还包括:
对所述文本内容进行无效词语或无效语句的过滤。
5.一种话务数据处理装置,其特征在于,包括:
模型训练模块,用于基于预设语料库中的句子样本数据,进行标准化句向量模型训练;
文本转化模块,用于将接收到的录音数据文件转化为文本内容;
句向量确定模...
【专利技术属性】
技术研发人员:崔晶晶,郝成建,
申请(专利权)人:集奥聚合北京人工智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。