一种基于智能语音识别的高并发VOIP录音服务系统技术方案

技术编号:22333516 阅读:116 留言:0更新日期:2019-10-19 12:55
本发明专利技术涉及一种基于智能语音识别的高并发VOIP录音服务系统,包括录音服务模块,用于直接在设备和芯片层对左右声道的音频进行解码存储得到录音音频;缓冲寄存器,在软件层配置缓冲寄存器并做好时间同步,当出现高于当前容量的音频并发时,按需增加缓冲寄存器容量;录音文件管理模块,用于将解码存储模块解码存储的录音音频输入缓冲队列;语音识别引擎,对录音音频进行编解码,通过特征提取把语音媒体数据包组装为正确的语音媒体流数据;后台业务系统,所述语音媒体流数据通过MQ消息队列中间件传递至后台业务系统,本方案不仅能同时处理超200条以上的会话处理,同时还能提高录音质量。

A high concurrent VoIP recording service system based on intelligent speech recognition

【技术实现步骤摘要】
一种基于智能语音识别的高并发VOIP录音服务系统
本专利技术涉及录音服务领域,具体涉及一种基于智能语音识别的高并发VOIP录音服务系统。
技术介绍
随着IT技术的飞速发展,传统的PSTN电话网络已经不能满足通信的需求,尤其是VOIP出现之后,VoIP(VoiceoverInternetProtocol)简而言之就是将模拟信号(Voice)数字化,以数据封包(DataPacket)的形式在IP网络(IPNetwork)上做实时传递。企业采用VOIP技术逐渐替代基于PSTN线路的呼叫中心业务,来满足方便、统一、廉价的通信需求。然而随着移动互联网技术带来的需求和产业升级,传统的录音服务已经很难满足客户的对高并发、快速识别,用机器学习来替代呼叫中心人力的更低成本运营等急迫诉求。现有技术的缺点在于:在目前常规的解决方案中,通常由AI引擎负责音频输入的识别解码、特征提取从而进入到识别阶段,而解码过程本身对系统资源的消耗,时间的开销代价都较大,当同时出现多路语音输入时,系统资源消耗会非常巨大,从而造成录音质量差,以及通话不畅的问题,无法做到大批量的处理语音识别,其最高仅能实现200路并发的能力。专本文档来自技高网...

【技术保护点】
1.基于智能语音识别的高并发VOIP录音服务系统,其特征在于,该系统包括:录音服务模块,用于直接在设备和芯片层对左右声道的音频进行解码存储得到录音音频;缓冲寄存器,在软件层配置缓冲寄存器并做好时间同步,当出现高于当前容量的音频并发时,按需增加缓冲寄存器容量;录音文件管理模块,用于将解码存储模块解码存储的录音音频输入缓冲队列;语音识别引擎,对录音音频进行编解码,通过特征提取把语音媒体数据包组装为正确的语音媒体流数据;后台业务系统,所述语音媒体流数据通过MQ消息队列中间件传递至后台业务系统。

【技术特征摘要】
1.基于智能语音识别的高并发VOIP录音服务系统,其特征在于,该系统包括:录音服务模块,用于直接在设备和芯片层对左右声道的音频进行解码存储得到录音音频;缓冲寄存器,在软件层配置缓冲寄存器并做好时间同步,当出现高于当前容量的音频并发时,按需增加缓冲寄存器容量;录音文件管理模块,用于将解码存储模块解码存储的录音音频输入缓冲队列;语音识别引擎,对录音音频进行编解码,通过特征提取把语音媒体数据包组装为正确的语音媒体流数据;后台业务系统,所述语音媒体流数据通过MQ消息队列中间件传递至后台业务系统。2.根据权利要求1所述的基于智能语音识别的高并发VOIP录音服务系统,其特征在于,所述录音服务模块采用子进程集群模块引入多进程工作模式,每个进程都是单线程运行;将录音核心服务分为主进程和工作进程两种类型,子进程集群采用node.js的cluster机制实现,主要的技术点在于子进程状态监控、可靠的进程间通信机制和负载调度机制。3.根据权利要求2所述的基于智能语音识别的高并发VOIP录音服务系统,其特征在于,所述可靠的进程间通信机制采用cluster的进程间通信机制进行子进程间数据的传输,并辅助自定义RPC机制,所述进程间通信机制实现步骤为:1)父进程调研pipe函数创建管道,得到两个文件描述符,并指向管道的两端;2)父进程调研fork创建子进程,子进程则同一拥有两个文件描述符,并指向同一管道的两端;3)父进程关闭读,子进程关闭写,这样父进程向管道写入消息,子进程从管道读取。4.根据权利要求3所述的基于智能语音识别的高并发VOIP录音服务系统,其特征在于,所述自定义RPC机制定义了两种操作,即请求/响应和事件通知;请求响应:由RPC调用者发出,RPC框架层对调用参数进行编码后交由进程间通讯机制传递给RPC处理者进行处理,RPC处理者处理完成后,RPC框架层对处理结果进行编码后交由进程间通讯机制传递给RPC调用者进行后续处理;事件通知:事件通知由事件源调用RPC通知接口传递事件参数,RPC框架层对事件参数进行编码后交由进程间通讯机制传递给事件监听者进行处理。5.根据权利要求4所述的基于智能语音识别的高并发VOIP录音服务系统,其特征在于,所述负载调度机制使用最小负载模式实现工作进程的调度,负载计算采用了RPC的钩子机制,通过分析master向worker派发负载的执行情况,根据计算策略算出worker当前负载;子进程集群的负载调度机制计算每个工作进程的工作负载,把新增负载始终放到负载最小的工作进程中,录音会话由录音核心服务收到设备发起的请求后建立,每路会话由信令通道和媒体通道两种交互的状态组成,信令通道接受设备侧对该会话的控制指令,媒体通道则接受设备侧传输的媒体流数据,录音会话管理模块把信令会话和媒体会话分摊到不同的进程中。6.根据权利要求5所述的基于智能语音识别的高并发VOIP录音服务系统,其特征在于,所述录音服务模块配置有媒体流管理模块,设备端...

【专利技术属性】
技术研发人员:袁熹
申请(专利权)人:成都康胜思科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1