语音数据意图确定方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21952476 阅读:19 留言:0更新日期:2019-08-24 17:43
本申请涉及一种语音数据意图确定方法、系统、计算机设备和存储介质。方法包括:获取实时的语音数据,将语音数据转换成语音文本;当语音文本的长度大于预设第一长度阈值时,获取语音文本中与预设关键词库中匹配成功的文本关键词;获取文本关键词的置信度,将文本关键词对应的意图类型作为第一预测意图;将语音文本输入至训练好的文本分类模型中,获取文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;将第一预测意图的置信度值与第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为语音数据的意图类型。

Method, Device, Computer Equipment and Storage Media for Identifying the Intention of Speech Data

【技术实现步骤摘要】
语音数据意图确定方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种语音数据意图确定方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展,人工智能的应用领域也越来越广泛。比如兴起的电话机器人,也是人工智能的一部分,被越来越多涉及到电话销售相关的企业所青睐。随着人工智能技术的发展,企业愈发倾向于用电话机器人代替人工从事电话销售和电话客服,以减轻企业和员工的压力,且电话机器人可以做到24小时在线服务,并且无需顾虑恶劣对话对员工带来的影响。然而在使用电话机器人时,需要电话机器人实时快速的识别用户的意图。传统技术中,一般采用的机器学习对用户的意图直接进行识别。但是采用这种意图的识别方式时,采用的机器学习模型,模型对词向量、文本长度、文本质量以及数据集的大小均有一定的要求,当文本无法达到模型的要求时,意图的识别准确率则会降低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高识别准确率的语音数据意图确定方法、装置、计算机设备和存储介质。一种语音数据意图确定方法,所述方法包括:获取实时的语音数据,将所述语音数据转换成语音文本;当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词;获取所述文本关键词的置信度,将所述文本关键词对应的意图类型作为第一预测意图;将所述语音文本输入至训练好的文本分类模型中,获取所述文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为所述语音数据的意图类型。一种语音数据意图确定装置,所述装置包括:语音数据获取模块,用于获取实时的语音数据,将所述语音数据转换成语音文本;第一意图匹配模块,用于当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词;获取所述文本关键词的置信度,将所述文本关键词对应的意图类型作为第一预测意图;第二意图匹配模块,用于将所述语音文本输入至训练好的文本分类模型中,获取所述文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;意图最终确定模块,用于将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为所述语音数据的意图类型。一种计算机设备,包括存储器、处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取实时的语音数据,将所述语音数据转换成语音文本;当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词;获取所述文本关键词的置信度,将所述文本关键词对应的意图类型作为第一预测意图;将所述语音文本输入至训练好的文本分类模型中,获取所述文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为所述语音数据的意图类型。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取实时的语音数据,将所述语音数据转换成语音文本;当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词;获取所述文本关键词的置信度,将所述文本关键词对应的意图类型作为第一预测意图;将所述语音文本输入至训练好的文本分类模型中,获取所述文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为所述语音数据的意图类型。上述语音数据意图确定方法、装置、计算机设备和存储介质,通过获取到实时的语音数据并将语音数据转换成语音文本,根据语音文本的长度确定预设关键词库,并确定匹配成功的文本关键词,同时可以将语音文本输入至训练好的文本分类模型中,获取文本分类模型对语音文本的意图预测类型,结合关键词匹配的结果和文本分类模型的预测结果,将数值最大的预测意图作为对该语音数据的最终意图类型。通过结合关键词匹配和机器学习模型的方式,使得具备自动抽取特征能力的机器学习模型弥补了关键词设计繁琐的问题,因此预设关键词库可以不要求非常完美,而是允许存在一定的误差,因此在结合这两个识别方式以最终确定对用户的实时语音数据的意图类型时,使得确定意图类型的效率非常高,同时还可以保证对实时的语音数据意图确定的准确度。附图说明图1为一个实施例中语音数据意图确定方法的应用环境图;图2为一个实施例中语音数据意图确定方法的流程示意图;图3为一个实施例中关键词等级的置信度计算步骤的流程示意图;图4为一个实施例中语音数据意图确定装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的语音数据意图确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102上可以安装电话机器人,可以主动发起电话呼叫,并对通话进行录音,作为历史语音数据存储至服务器104。终端102还可以将实时产生的语音数据转换为语音文本发送至服务器104进行意图识别,或者终端102将实时产生的语音数据发送至服务器104,服务器104将语音数据转换成语音文本,再进行意图识别。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种语音数据意图确定方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:步骤201,获取实时的语音数据,将语音数据转换成语音文本。实时的语音数据来源于电话机器人与用户的语音通话,电话机器人可自动发起语音呼叫,当用户接通后,即可自动与用户进行对话。实时的语音数据即指的是用户接通电话后与电话机器人的对话数据。服务器可以获取到终端上安装的电话机器人与用户通话时,实时产生的语音数据,并可以通过语音转换接口将语音数据转换成文本,即语音文本。步骤202,当语音文本的长度大于预设第一长度阈值时,获取语音文本中与预设关键词库中匹配成功的文本关键词。将语音格式的语音数据转换成语音文本后,可以确定该语音文本的长度。在计算语音文本的长度时,可以按照一个中文的长度为1的方式进行计算。当语音文本的长度大于预设第一长度阈值时,可以认为该语音文本为较长的文本,则可以通过关键词与模型结合的方式确定语音文本中的关键词。进一步的,若是确定语音文本为较短的文本,则直接通过关键词匹配的方式确定语音文本中的关键词。可以获取数据库中存储的预设关键词库,使用预设关键词库中包含的关键词与语音文本进行匹配。当预设关键词库中存在有关键词与语音文本匹配成功时,即语音文本中至少包含有一个预设关键本文档来自技高网...

【技术保护点】
1.一种语音数据意图确定方法,所述方法包括:获取实时的语音数据,将所述语音数据转换成语音文本;当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词;获取所述文本关键词的置信度,将所述文本关键词对应的意图类型作为第一预测意图;将所述语音文本输入至训练好的文本分类模型中,获取所述文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为所述语音数据的意图类型。

【技术特征摘要】
1.一种语音数据意图确定方法,所述方法包括:获取实时的语音数据,将所述语音数据转换成语音文本;当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词;获取所述文本关键词的置信度,将所述文本关键词对应的意图类型作为第一预测意图;将所述语音文本输入至训练好的文本分类模型中,获取所述文本分类模型输出的意图标签及对应的概率;将概率最高的意图标签对应的意图类型作为第二预测意图;将所述第一预测意图的置信度值与所述第二预测意图的概率值进行对比,选取数值最大对应的预测意图作为所述语音数据的意图类型。2.根据权利要求1所述的方法,其特征在于,所述获取所述语音文本中与预设关键词库中匹配成功的文本关键词,包括:获取预设关键词库,所述预设关键词库中包含多个预设关键词;按照所述预设关键词的长度,从大到小依次将所述预设关键词与所述语音文本进行匹配;当存在有匹配成功的预设关键词时,将所述预设关键词作为所述语音文本的文本关键词。3.根据权利要求1所述的方法,其特征在于,所述预设关键词库包括:短文本关键词库和长文本关键词库;当所述语音文本的长度大于预设第一长度阈值时,获取所述语音文本中与预设关键词库中匹配成功的文本关键词,包括:当所述语音文本的长度大于预设第一长度阈值,且小于预设第二长度阈值时,获取所述语音文本中与所述短文本关键词库中匹配成功的文本关键词;当所述语音文本的长度大于所述预设第二长度阈值时,获取所述语音文本中与所述长文本关键词库中匹配成功的文本关键词。4.根据权利要求1所述的方法,其特征在于,获取所述文本关键词的置信度,包括:获取所述文本关键词对应的关键词等级的置信度;所述关键词等级的置信度通过如下方式计算得到:获取数据库中的历史语音数据,将所述历史语音数据转换为历史语音文本;对每个历史语音文本添加目标意图类型;获取所述历史语音文本与预设关键词库中匹配成功的历史文本关键词及所述历史文本关键词对应的关键词等级;获取所述历史关键词对应的意图类型作为比对意图类型;根据所述关键词等级,分别将所述比对意图类型与所述目标意图类型进行对比;获取与所述目标意图类型一致的比对意图类型的数量为第一数值;获取每一个关键词等级中与...

【专利技术属性】
技术研发人员:刘凯黄佳恒范成涛刘利明严为绒贺国栋张敏超
申请(专利权)人:深圳市珍爱云信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1