一种适用于无侵入式旁路电话语音流获取方法及系统技术方案

技术编号:27692419 阅读:17 留言:0更新日期:2021-03-17 04:50
本发明专利技术公开了一种适用于无侵入式旁路电话语音流获取方法及系统,包括,在IP‑PBX软交换网络中配置交换机端口镜像策略,将基于SIP协议的IP电话的信令和语音流引流至通用服务器;服务器解析SIP信令流,根据解析的SDP协商数据,得到对应的语音流通道信息;依次解析对应的RTP语音流,将语音数据报文进行排序和重组;剥离RTP头,得到压缩过的PCM流,再次进行解压缩得到原始的无损PCM流,选择保存为标准WAV音频文件;利用无损PCM流或WAV文件,作为与标准的语音识别引擎、声纹识别引擎对接输入,以进行通话内容转写文本和通话双方身份识别。本发明专利技术支持各种通过标准SIP/RTP协议接入IP‑PBX软交换的终端,包括运行在通用平台上的软IP电话和运行在定制化软硬件平台上的IP电话设备。

【技术实现步骤摘要】
一种适用于无侵入式旁路电话语音流获取方法及系统
本专利技术涉及电力调度系统使用人识别、调度内容转写和监督的
,尤其涉及一种适用于无侵入式旁路电话语音流获取方法及系统。
技术介绍
现有技术实现基于SIP协议IP电话语音流获取通常使用以下方案,在客户端实施部署纯软件方案,监听软电话相关端口的出入信令报文和语音报文进行解析还原语音;这种方案存在如下的问题,需要在客户端逐个部署软件,无法集中实施,维护工作量巨大,可扩展性差,客户端扩容则需要同步部署;需要兼容各种客户端操作系统版本配置和基础库配置,软件开发工作量大。现有技术通常只能支持软IP电话,而不能支持硬件IP电话,因为软电话都是基于标准操作系统运行(主要是Windows/Linux/MacOS各版本)而硬件IP电话都是基于专用软硬件打造而成。
技术实现思路
本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。鉴于上述现有存在的问题,提出了本专利技术。因此,本专利技术提供了一种适用于无侵入式旁路电话语音流获取方法及系统,能够解决现有语音流获取不全面、不及时的问题。为解决上述技术问题,本专利技术提供如下技术方案:包括,在IP-PBX软交换网络中配置交换机端口镜像策略,将基于SIP协议的IP电话的信令和语音流引流至通用服务器;所述服务器解析SIP信令流,根据解析的SDP协商数据,得到对应的语音流通道信息;依次解析对应的RTP语音流,将语音数据报文进行排序和重组;剥离RTP头,得到压缩过的PCM流,再次进行解压缩得到原始的无损PCM流,选择保存为标准WAV音频文件;利用所述无损PCM流或WAV文件,作为与标准的语音识别引擎、声纹识别引擎对接输入,以进行通话内容转写文本和通话双方身份识别。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:包括,所述服务器与所述IP-PBX软交换网络接入同一个交换机,并在所述交换机上配置一个镜像端口,利用ACL策略将所有流入流出所述IP-PBX软交换网络的所述SIP信令流量和所述RTP语音流量镜像至所述镜像端口,且所述镜像端口和电话语音提取服务器直连。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:进行所述解析包括,利用最小二乘支持向量机选取径向基函数作为语音流提取解析模型的目标函数,如下式:其中,x={x1;x2;…;x14}:语音流数据的无损PCM流特性向量组成的声纹特性矩阵,y:无损PCM流的标准WAV音频特性向量,σ:核宽度,反应了分布、范围特性。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:还包括,初始化惩罚参数C和所述σ,利用所述语音流数据搭建的数据集对所述目标函数进行训练和测试;设定精度要求,若所述目标函数精度未达到要求,则根据误差对所述C和所述σ进行赋值优化,直到测试数据精度达到所述精度要求;设定阈值并输出训练完成的所述目标函数,将其作为所述解析模型。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:测试所述数据精度是否达到所述精度要求包括,基于贝叶斯概率策略构建测试模型,表达公式如下:其中,j:达到所述精度要求的数据数量,int{x%×365}:向上取整函数,x%:误差发生概率。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:包括,判断所述交换机端口流量镜像是否存在所述SIP协议,若是,则利用所述解析模型分析SIP交互报文,得到SDP信息的媒体信息;若否,则重新判断是否存在所述RTP协议,若是,则确认其是否能够关联所述SIP解析出的媒体信息;若否,则重新进行所述交换机端口流量镜像,直至能够找到所述SIP协议或所述RTP协议。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:还包括,若能够关联所述SIP解析出的媒体信息,则所述解析模型继续解析RTP报文进行保序去重队列;若所述队列超时或达到容量阈值,则所述报文出队列根据顺序剥离网络协议得到压缩PCM静荷;判断所述PCM压缩方式并解压得到原始无损PCM静荷;根据配置,将所述原始无损PCM静荷保存为所述WAV文件。作为本专利技术所述的适用于无侵入式旁路电话语音流获取方法的一种优选方案,其中:还包括,若所述队列未超时或未达到所述容量阈值,则重新进行所述交换机端口流量镜像。作为本专利技术所述的适用于无侵入式旁路电话语音流获取系统的一种优选方案,其中:包括,报文解析模块,用于解析SIP信令上下行报文,尤其是SDP媒体协商报文,记录RTP流协商结果,包括RTP流源/目的IP,源/目的端口,采样率,PCM压缩格式、通话双方用户名、电话号码、SIP地址,其还用于解析RTP报文,并关联上述预记录的协商结果,将携带信令信息的RTP报文解析结果发送给报文处理模块;所述报文处理模块连接设置于所述报文解析模块的下表面,其包括RTP报文缓存保序子模块、PCM流提取解压缩模块、WAV文件保存模块,所述RTP报文缓存保序子模块用于对RTP报文进行保序和去重,并缓存一段时间,所述PCM流提取解压缩模块用于处理一组已经经过保序和去重的RTP报文,将其网络头剥离(剥离至RTP层)得到一段压缩过的PCM数据流,并处理一段压缩过的PCM数据流,识别其压缩编码格式(G711.A律/G711.μ律/G722),并将其解压为未压缩的无损PCM数据流,WAV文件保存模块用于将未压缩的无损PCM数据流保存为标准的WAV格式文件;接口模块与所述报文处理模块相连接,其用于对经处理得到的未压缩的无损PCM数据流或者WAV文件,作为输入进行下一步的相关业务处理,即语音识别、声纹识别。本专利技术的有益效果:本专利技术通过将实施部署位置提升到IP-PBX软交换网络层次级别,无需在客户端逐个部署,而是在IP-PBX软交换网络里部署,通一处理经过IP-PBX的所有电话流量网络报文;同时,无需考虑各种客户端的操作系统版本配置和基础库配置,只集中处理经过交换机的标准SIP/RTP流量;本专利技术支持各种通过标准SIP/RTP协议接入IP-PBX软交换的终端,包括运行在通用平台上的软IP电话和运行在定制化软硬件平台上的IP电话设备。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:图1为本专利技术第一个实施例所述的适用于无侵入式旁路电话语音流获取方法的流程示意图;图2为本专利技术第一个实施例所述的适用于无侵入式旁路电话语音流获取方法的网络部署架构示意图;图3为本专利技术第一个实施例所述的适用于无侵入式旁路电话语音流本文档来自技高网...

【技术保护点】
1.一种适用于无侵入式旁路电话语音流获取方法,其特征在于:包括,/n在IP-PBX软交换网络中配置交换机端口镜像策略,将基于SIP协议的IP电话的信令和语音流引流至通用服务器;/n所述服务器解析SIP信令流,根据解析的SDP协商数据,得到对应的语音流通道信息;/n依次解析对应的RTP语音流,将语音数据报文进行排序和重组;/n剥离RTP头,得到压缩过的PCM流,再次进行解压缩得到原始的无损PCM流,选择保存为标准WAV音频文件;/n利用所述无损PCM流或WAV文件,作为与标准的语音识别引擎、声纹识别引擎对接输入,以进行通话内容转写文本和通话双方身份识别。/n

【技术特征摘要】
1.一种适用于无侵入式旁路电话语音流获取方法,其特征在于:包括,
在IP-PBX软交换网络中配置交换机端口镜像策略,将基于SIP协议的IP电话的信令和语音流引流至通用服务器;
所述服务器解析SIP信令流,根据解析的SDP协商数据,得到对应的语音流通道信息;
依次解析对应的RTP语音流,将语音数据报文进行排序和重组;
剥离RTP头,得到压缩过的PCM流,再次进行解压缩得到原始的无损PCM流,选择保存为标准WAV音频文件;
利用所述无损PCM流或WAV文件,作为与标准的语音识别引擎、声纹识别引擎对接输入,以进行通话内容转写文本和通话双方身份识别。


2.根据权利要求1所述的适用于无侵入式旁路电话语音流获取方法,其特征在于:包括,
所述服务器与所述IP-PBX软交换网络接入同一个交换机,并在所述交换机上配置一个镜像端口,利用ACL策略将所有流入流出所述IP-PBX软交换网络的所述SIP信令流量和所述RTP语音流量镜像至所述镜像端口,且所述镜像端口和电话语音提取服务器直连。


3.根据权利要求1或2所述的适用于无侵入式旁路电话语音流获取方法,其特征在于:进行所述解析包括,
利用最小二乘支持向量机选取径向基函数作为语音流提取解析模型的目标函数,如下式:



其中,x={x1;x2;…;x14}:语音流数据的无损PCM流特性向量组成的声纹特性矩阵,y:无损PCM流的标准WAV音频特性向量,σ:核宽度,反应了分布、范围特性。


4.根据权利要求3所述的适用于无侵入式旁路电话语音流获取方法,其特征在于:还包括,
初始化惩罚参数C和所述σ,利用所述语音流数据搭建的数据集对所述目标函数进行训练和测试;
设定精度要求,若所述目标函数精度未达到要求,则根据误差对所述C和所述σ进行赋值优化,直到测试数据精度达到所述精度要求;
设定阈值并输出训练完成的所述目标函数,将其作为所述解析模型。


5.根据权利要求4所述的适用于无侵入式旁路电话语音流获取方法,其特征在于:测试所述数据精度是否达到所述精度要求包括,
基于贝叶斯概率策略构建测试模型,表达公式如下:



其中,j:达到所述精度要求的数据数量,int{x%×365}:向上取整函数,x%:误差发生概率。


6.根据权利要求5所述的适用于无侵入式旁路电话语音流获取方法,其特征在于:包括...

【专利技术属性】
技术研发人员:冯义戴雯菊黄宇吴俊杰高浩王瑶罗宇林大智刘喜成
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:贵州;52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1