语音数据意图确定方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：21952476 阅读：19 留言：0更新日期：2019-08-24 17:43

本申请涉及一种语音数据意图确定方法、系统、计算机设备和存储介质。方法包括：获取实时的语音数据，将语音数据转换成语音文本；当语音文本的长度大于预设第一长度阈值时，获取语音文本中与预设关键词库中匹配成功的文本关键词；获取文本关键词的置信度，将文本关键词对应的意图类型作为第一预测意图；将语音文本输入至训练好的文本分类模型中，获取文本分类模型输出的意图标签及对应的概率；将概率最高的意图标签对应的意图类型作为第二预测意图；将第一预测意图的置信度值与第二预测意图的概率值进行对比，选取数值最大对应的预测意图作为语音数据的意图类型。

Method, Device, Computer Equipment and Storage Media for Identifying the Intention of Speech Data

全部详细技术资料下载

【技术实现步骤摘要】
语音数据意图确定方法、装置、计算机设备和存储介质
本申请涉及计算机
，特别是涉及一种语音数据意图确定方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展，人工智能的应用领域也越来越广泛。比如兴起的电话机器人，也是人工智能的一部分，被越来越多涉及到电话销售相关的企业所青睐。随着人工智能技术的发展，企业愈发倾向于用电话机器人代替人工从事电话销售和电话客服，以减轻企业和员工的压力，且电话机器人可以做到24小时在线服务，并且无需顾虑恶劣对话对员工带来的影响。然而在使用电话机器人时，需要电话机器人实时快速的识别用户的意图。传统技术中，一般采用的机器学习对用户的意图直接进行识别。但是采用这种意图的识别方式时，采用的机器学习模型，模型对词向量、文本长度、文本质量以及数据集的大小均有一定的要求，当文本无法达到模型的要求时，意图的识别准确率则会降低。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够提高识别准确率的语音数据意图确定方法、装置、计算机设备和存储介质。一种语音数据意图确定方法，所述方法包括：获取实时的语音数据，将所述语音数据转换成语音文本；当所述语音文本的长度大于预设第一长度阈值时，获取所述语音文本中与预设关键词库中匹配成功的文本关键词；获取所述文本关键词的置信度，将所述文本关键词对应的意图类型作为第一预测意图；将所述语音文本输入至训练好的文本分类模型中，获取所述文本分类模型输出的意图标签及对应的概率；将概率最高的意图标签对应的意图类型作为第二预测意图；将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比，选取数值最大对应的预...

【技术保护点】
1.一种语音数据意图确定方法，所述方法包括：获取实时的语音数据，将所述语音数据转换成语音文本；当所述语音文本的长度大于预设第一长度阈值时，获取所述语音文本中与预设关键词库中匹配成功的文本关键词；获取所述文本关键词的置信度，将所述文本关键词对应的意图类型作为第一预测意图；将所述语音文本输入至训练好的文本分类模型中，获取所述文本分类模型输出的意图标签及对应的概率；将概率最高的意图标签对应的意图类型作为第二预测意图；将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比，选取数值最大对应的预测意图作为所述语音数据的意图类型。

【技术特征摘要】
1.一种语音数据意图确定方法，所述方法包括：获取实时的语音数据，将所述语音数据转换成语音文本；当所述语音文本的长度大于预设第一长度阈值时，获取所述语音文本中与预设关键词库中匹配成功的文本关键词；获取所述文本关键词的置信度，将所述文本关键词对应的意图类型作为第一预测意图；将所述语音文本输入至训练好的文本分类模型中，获取所述文本分类模型输出的意图标签及对应的概率；将概率最高的意图标签对应的意图类型作为第二预测意图；将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比，选取数值最大对应的预测意图作为所述语音数据的意图类型。2.根据权利要求1所述的方法，其特征在于，所述获取所述语音文本中与预设关键词库中匹配成功的文本关键词，包括：获取预设关键词库，所述预设关键词库中包含多个预设关键词；按照所述预设关键词的长度，从大到小依次将所述预设关键词与所述语音文本进行匹配；当存在有匹配成功的预设关键词时，将所述预设关键词作为所述语音文本的文本关键词。3.根据权利要求1所述的方法，其特征在于，所述预设关键词库包括：短文本关键词库和长文本关键词库；当所述语音文本的长度大于预设第一长度阈值时，获取所述语音文本中与预设关键词库中匹配成功的文本关键词，包括：当所述语音文本的长度大于预设第一长度阈值，且小于预设第二长度阈值时，获取所述语音文本中与所述短文本关键词库中匹配成功的文本关键词；当所述语音文本的长度大于所述预设第二长度阈值时，获取所述语音文本中与所述长文本关键词库中匹配成功的文本关键词。4.根据权利要求1所述的方法，其特征在于，获取所述文本关键词的置信度，包括：获取所述文本关键词对应的关键词等级的置信度；所述关键词等级的置信度通过如下方式计算得到：获取数据库中的历史语音数据，将所述历史语音数据转换为历史语音文本；对每个历史语音文本添加目标意图类型；获取所述历史语音文本与预设关键词库中匹配成功的历史文本关键词及所述历史文本关键词对应的关键词等级；获取所述历史关键词对应的意图类型作为比对意图类型；根据所述关键词等级，分别将所述比对意图类型与所述目标意图类型进行对比；获取与所述目标意图类型一致的比对意图类型的数量为第一数值；获取每一个关键词等级中与...

【专利技术属性】
技术研发人员：刘凯，黄佳恒，范成涛，刘利明，严为绒，贺国栋，张敏超，
申请(专利权)人：深圳市珍爱云信息技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人