语音处理方法及相关设备技术

技术编号:28424875 阅读:22 留言:0更新日期:2021-05-11 18:33
本发明专利技术涉及人工智能,提供一种语音处理方法及相关设备。该方法能够根据语音检测请求确定语音场次,并根据语音场次确定用户对象,在语音场次播放话术时获取用户对象所在环境的语音信息,将语音信息转换为文本信息,利用预先构建好的正则表达式识别文本信息,得到正则结果,当正则结果为预设结果时,将文本信息输入至预先训练好的意图识别模型中,得到意图结果,当配置库中存在意图结果时,控制语音检测请求的发出终端停止播放话术。本发明专利技术能够提高语音打断的精确度。此外,本发明专利技术还涉及区块链技术,所述意图结果可存储于区块链中。

【技术实现步骤摘要】
语音处理方法及相关设备
本专利技术涉及人工智能
,尤其涉及一种语音处理方法及相关设备。
技术介绍
随着人工智能的飞速发展,现有的聊天机器人支持语音识别功能,以实现电话客服或电话销售任务。然而,当聊天机器人在播放话术时,用户所在环境中存在噪音,例如,用户发出无意义的声音,会导致聊天机器人在播放话术时被错误打断,从而影响客户体验。因此,如何解决聊天机器人在播放话术时不被错误打断成了亟需解决的问题。
技术实现思路
鉴于以上内容,有必要提供一种语音处理方法及相关设备,能够提高语音处理的精确度。一方面,本专利技术提出一种语音处理方法,所述语音处理方法包括:当接收到语音检测请求时,根据所述语音检测请求确定语音场次,并根据所述语音场次确定用户对象;在所述语音场次播放话术时获取所述用户对象所在环境的语音信息;将所述语音信息转换为文本信息;利用预先构建好的正则表达式识别所述文本信息,得到正则结果;当所述正则结果为预设结果时,将所述文本信息输入至预先训练好的意图识别模型中,得到意图结果;检测配置库中是否存在所述意图结果;当所述配置库中存在所述意图结果时,控制所述语音检测请求的发出终端停止播放所述话术。根据本专利技术优选实施例,所述根据所述语音检测请求确定语音场次包括:解析所述语音检测请求的报文,得到所述报文携带的报文信息;从所述报文信息中获取用于指示场次的信息作为场次编码;根据所述场次编码确定所述语音场次。<br>根据本专利技术优选实施例,所述根据所述语音场次确定用户对象包括:从语音数据库中获取与所述语音场次对应的用户识别码;将与所述用户识别码对应的对象确定为所述用户对象。根据本专利技术优选实施例,所述在所述语音场次播放话术时获取所述用户对象所在环境的语音信息包括:检测所述语音场次是否播放所述话术;当检测到所述语音场次播放所述话术时,确定所述话术的播放对象;根据所述播放对象及所述用户对象确定连接通道;通过所述连接通道获取所述用户对象所在环境的所述语音信息。根据本专利技术优选实施例,所述将所述语音信息转换为文本信息包括:对所述语音信息进行预处理,得到波形信息;提取所述波形信息中的特征,得到语音特征;利用维特比算法对所述语音特征进行解码处理,得到语音最优路径;根据所述语音最优路径确定所述文本信息。根据本专利技术优选实施例,所述利用预先构建好的正则表达式识别所述文本信息,得到正则结果包括:根据预设词典对所述文本信息进行切分,得到多个切分路径;根据所述多个切分路径构建多个有向无环图;根据所述预设词典中的权值计算每个有向无环图的概率;将所述概率最大的有向无环图对应的切分路径确定为目标切分路径,并将与所述目标切分路径对应的切分方式确定为目标切分方式;根据所述目标切分方式确定多个分词;利用所述正则表达式识别所述多个分词;当所述正则表达式与所述多个分词中任意分词匹配时,将与所述正则表达式对应的意图确定为所述正则结果;当所述正则表达式与所述多个分词都不匹配时,将所述正则结果确定为空值。根据本专利技术优选实施例,所述将所述文本信息输入至预先训练好的意图识别模型中,得到意图结果包括:对所述文本信息进行分句处理,得到多个语句;获取映射向量表,并从所述映射向量表中获取所述多个语句的文本向量;从标准语句库中获取标准语句向量;计算所述标准语句向量与所述文本向量的相似度;将所述相似度最高的标准语句向量确定为目标向量,并将与所述目标向量对应的意图确定为所述意图结果。另一方面,本专利技术还提出一种语音处理装置,所述语音处理装置包括:确定单元,用于当接收到语音检测请求时,根据所述语音检测请求确定语音场次,并根据所述语音场次确定用户对象;获取单元,用于在所述语音场次播放话术时获取所述用户对象所在环境的语音信息;转换单元,用于将所述语音信息转换为文本信息;识别单元,用于利用预先构建好的正则表达式识别所述文本信息,得到正则结果;输入单元,用于当所述正则结果为预设结果时,将所述文本信息输入至预先训练好的意图识别模型中,得到意图结果;检测单元,用于检测配置库中是否存在所述意图结果;控制单元,用于当所述配置库中存在所述意图结果时,控制所述语音检测请求的发出终端停止播放所述话术。另一方面,本专利技术还提出一种电子设备,所述电子设备包括:存储器,存储计算机可读指令;及处理器,执行所述存储器中存储的计算机可读指令以实现所述语音处理方法。另一方面,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述语音处理方法。由以上技术方案可以看出,本专利技术能够当接收到语音检测请求时,根据所述语音检测请求确定语音场次,并根据所述语音场次确定用户对象,能够具体定位到需要进行语音检测的通话场次,在所述语音场次播放话术时获取所述用户对象所在环境的语音信息,通过获取在播放所述话术时产生的所述语音信息,由于无需对整个所述语音场次进行语音识别,因此,能够避免系统线程被占用,从而提高系统性能,将所述语音信息转换为文本信息,利用预先构建好的正则表达式识别所述文本信息,得到正则结果,当所述正则结果为预设结果时,将所述文本信息输入至预先训练好的意图识别模型中,得到意图结果,能够确保所述语音信息的意图能够被识别,从而提高意图识别率,检测配置库中是否存在所述意图结果,当所述配置库中存在所述意图结果时,控制所述语音检测请求的发出终端停止播放所述话术,根据所述意图结果能够准确确定出是否对所述话术进行中断,提高了中断检测的准确率。本专利技术通过所述语音检测请求能够准确确定出需要进行语音检测的语音场次,并根据所述语音场次获取所述用户对象所在环境的语音信息,进而对所述语音信息的意图进行识别,从而能够根据所述意图结果确定出是否对所述话术进行打断,避免所述用户对象所在环境中的背景音对所述语音场次的影响,提高语音打断的精确度。附图说明图1是本专利技术语音处理方法的较佳实施例的流程图。图2是本专利技术在语音场次播放话术时获取用户对象所在环境的语音信息的一实施例的流程图。图3是本专利技术语音处理装置的较佳实施例的功能模块图。图4是本专利技术实现语音处理方法的较佳实施例的电子设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。如图1所示,是本专利技术语音处理方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。所述语音处理方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述语音处理方法包括:/n当接收到语音检测请求时,根据所述语音检测请求确定语音场次,并根据所述语音场次确定用户对象;/n在所述语音场次播放话术时获取所述用户对象所在环境的语音信息;/n将所述语音信息转换为文本信息;/n利用预先构建好的正则表达式识别所述文本信息,得到正则结果;/n当所述正则结果为预设结果时,将所述文本信息输入至预先训练好的意图识别模型中,得到意图结果;/n检测配置库中是否存在所述意图结果;/n当所述配置库中存在所述意图结果时,控制所述语音检测请求的发出终端停止播放所述话术。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述语音处理方法包括:
当接收到语音检测请求时,根据所述语音检测请求确定语音场次,并根据所述语音场次确定用户对象;
在所述语音场次播放话术时获取所述用户对象所在环境的语音信息;
将所述语音信息转换为文本信息;
利用预先构建好的正则表达式识别所述文本信息,得到正则结果;
当所述正则结果为预设结果时,将所述文本信息输入至预先训练好的意图识别模型中,得到意图结果;
检测配置库中是否存在所述意图结果;
当所述配置库中存在所述意图结果时,控制所述语音检测请求的发出终端停止播放所述话术。


2.如权利要求1所述的语音处理方法,其特征在于,所述根据所述语音检测请求确定语音场次包括:
解析所述语音检测请求的报文,得到所述报文携带的报文信息;
从所述报文信息中获取用于指示场次的信息作为场次编码;
根据所述场次编码确定所述语音场次。


3.如权利要求1所述的语音处理方法,其特征在于,所述根据所述语音场次确定用户对象包括:
从语音数据库中获取与所述语音场次对应的用户识别码;
将与所述用户识别码对应的对象确定为所述用户对象。


4.如权利要求1所述的语音处理方法,其特征在于,所述在所述语音场次播放话术时获取所述用户对象所在环境的语音信息包括:
检测所述语音场次是否播放所述话术;
当检测到所述语音场次播放所述话术时,确定所述话术的播放对象;
根据所述播放对象及所述用户对象确定连接通道;
通过所述连接通道获取所述用户对象所在环境的所述语音信息。


5.如权利要求1所述的语音处理方法,其特征在于,所述将所述语音信息转换为文本信息包括:
对所述语音信息进行预处理,得到波形信息;
提取所述波形信息中的特征,得到语音特征;
利用维特比算法对所述语音特征进行解码处理,得到语音最优路径;
根据所述语音最优路径确定所述文本信息。


6.如权利要求1所述的语音处理方法,其特征在于,所述利用预先构建好的正则表达式识别所述文本信息,得到正则结果包括:
根据预设词典对所述文本信息进行切分,得到多个切分路径;
根据所述多个切分路径构建多个有向无环图;

【专利技术属性】
技术研发人员:沈佳
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1