一种内外网隔离的语音转文字实时输入系统及其方法技术方案

技术编号:23471750 阅读:49 留言:0更新日期:2020-03-06 13:24
本发明专利技术公开了一种内外网隔离的语音转文字实时输入系统及其方法,属于音频处理技术领域,包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,通过语音采集模块实现了内外网的隔离,是内部网络与外部网络不发送任何的数据交互,并建立同步时钟和分段发送语音数据,解决了内网和外围隔离环境下的将语音转化成文字的技术问题,本发明专利技术采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒,使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑,实现了网络安全的文字输入。

A real-time input system and method of voice to text based on internal and external network isolation

【技术实现步骤摘要】
一种内外网隔离的语音转文字实时输入系统及其方法
本专利技术属于音频处理
,尤其涉及一种内外网隔离的语音转文字实时输入系统及其方法。
技术介绍
目前语音输入已经成熟,但是绝大多数是在线联网的方式进行处理,而很多场景下办公环境是内网,从安全性考虑上也不能通过多网卡的方式连接外网,那么对于内网想利用现有成熟的语音输入方案实现输入或记录就变得很困难,有企业提供了内网离线库的解决方案,但是费用巨大。目前普遍的方案是外网环境引用语音识别软件,或者采用内网离线包的方式进行内网语音识别。第一种的缺点是需要外网环境,不适用于内网;第二种就要数十万或者上百万的费用同部署内网离线包。
技术实现思路
本专利技术的目的是提供一种内外网隔离的语音转文字实时输入系统及其方法,解决了内网和外围隔离环境下的将语音转化成文字的技术问题。为实现上述目的,本专利技术采用如下技术方案:一种内外网隔离的语音转文字实时输入系统,包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;第三方语音处理服务器用于进行语音转文字的处理;语音采集模块用于采集音频信息并对音频信息进行数字编码。优选的,所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器,音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。优选的,所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路,音频放大器采用LM386放大器;所述主控制器的型号为S3C2410;所述音频解码器的型号为VS1063A;所述网络模块的型号为QCA64x8;所述USB控制器的型号为CH378;所述RAM存储器的型号为IDT70V09;所述FLASH存储器的型号为M25P16;所述蓝牙模块的型号为AC6919A。一种内外网隔离的语音转文字实时输入方法,包括如下步骤:步骤1:建立所述一种内外网隔离的语音转文字实时输入系统;步骤2:语音采集模块通过麦克风采集语音的音频模拟信息,并通过音频解码器将音频模拟信息转换为数字格式的音频数据;步骤3:主控制器获取音频数据,并根据预定的字节长度对音频数据进行分节,得到多组音频段数据;步骤4:在主控制器中建立一个同步时钟模块,同步时钟为每一组音频段数据均生成一个同步时钟,并同时产生该同步时钟的同步时钟标识编码;步骤5:主控制器对音频段数据进行打包,并把该音频段数据对应的同步时钟标识编码加入到数据包中,生成音频段数据包;步骤6:主控制器在音频段数据包中加入时间戳A,并缓存到RAM存储器中;步骤7:在RAM储存器中建立数据包列表,音频段数据包按照自身的时间戳A,顺序存储在数据包列表中;步骤8:主控制器按照时间先后,顺序从数据包列表中获取音频段数据包,并将音频段数据包通过WiFi网络发送到互联网上;步骤9:第三方语音处理服务器通过互联网获取到音频段数据包,并对音频段数据包中的音频段数据进行解析,生成文字数据;第三方语音处理服务器对文字数据进行打包,生成文字数据包,并将音频段数据包中的同步时钟标识编码添加到文字数据包中;第三方语音处理服务器生成时间戳B,并将时间戳B添加到文字数据包,同时将文字数据包发送给语音采集模块;步骤10:语音采集模块的主控制器获取文字数据包,根据文字数据包中的同步时钟标识编码,在RAM存储器中找出对应的音频数据;建立文字数据与音频段数据之间的映射列表;步骤11:对比文字数据包中的时间戳和音频段数据包的时间戳,获得延迟数据;步骤12:主控制器将文字数据转化成ASCII码的格式;步骤13:主控制器根据同步时钟标识编码,顺序通过USB总线向内网服务器以ASCII码的格式发送文字数据。本专利技术所述的一种内外网隔离的语音转文字实时输入系统及其方法,解决了内网和外围隔离环境下的将语音转化成文字的技术问题,本专利技术采用内外网隔离的联网输入方案打破了语音输入技术商在内网环境下设置的技术壁垒,使得任意内网计算机或者无任何网卡设备的计算机得到免费的在线语音识别技术的支撑,实现了网络安全的文字输入。附图说明图1是本专利技术的系统构架图;图2是本专利技术的语音采集模块的原理图方框图;图3是本专利技术的流程图。具体实时方式实时例1:如图1-图2所示的一种内外网隔离的语音转文字实时输入系统,包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;本专利技术中,企业路由器为连接外部互联网的路由器,无线路由器是通过该企业路由器连接互联网的。第三方语音处理服务器用于进行语音转文字的处理;语音采集模块用于采集音频信息并对音频信息进行数字编码。优选的,所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器,音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。优选的,所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路,音频放大器采用LM386放大器;所述主控制器的型号为S3C2410;所述音频解码器的型号为VS1063A;所述网络模块的型号为QCA64x8;所述USB控制器的型号为CH378;所述RAM存储器的型号为IDT70V09;所述FLASH存储器的型号为M25P16;所述蓝牙模块的型号为AC6919A。实时例2:如图1-图3所示,实时例2所述的一种内外网隔离的语音转文字实时输入方法是在实时例1所示的一种内外网隔离的语音转文字实时输入系统的基础上实现的,包括如下步骤:步骤1:建立所述一种内外网隔离的语音转文字实时输入系统;步骤2:语音采集模块通过麦克风采集语音的音频模拟信息,并通过音频解码器将音频模拟信息转换为数字格式的音频数据;步骤3:主控制器获取音频数据,并根据预定的字节长度对音频数据进行分节,得到多组音频段数据;本实时例中,预定的字节长度为30个字节。步骤4:在主控制器中建立一个同步时钟模块,同步时钟为每一组音频段数据均生成一个同步时钟,并同时产生该同步时钟的同步时钟标识编码;本实时例中,同步时钟由主控芯片单独产生:在主控芯片中单独利用一个定时器进行同步时钟的产生,同步时钟的最小时间为0.1ms;步骤5:主控制器对音频段数据进行打包,并把该音频段数据本文档来自技高网...

【技术保护点】
1.一种内外网隔离的语音转文字实时输入系统,其特征在于:包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;/n第三方语音处理服务器用于进行语音转文字的处理;/n语音采集模块用于采集音频信息并对音频信息进行数字编码。/n

【技术特征摘要】
1.一种内外网隔离的语音转文字实时输入系统,其特征在于:包括内网服务器、语音采集模块、无线路由器、企业路由器和第三方语音处理服务器,内网服务器通过USB总线与语音采集模块通信,语音采集模块通过WiFi无线网络与无线路由器通信,无线路由器通过企业路由器连接互联网,第三方语音处理服务器通过互联网与企业路由器通信;
第三方语音处理服务器用于进行语音转文字的处理;
语音采集模块用于采集音频信息并对音频信息进行数字编码。


2.如权利要求1所述的一种内外网隔离的语音转文字实时输入系统,其特征在于:所述语音采集模块包括麦克风及放大电路、音频解码器、主控制器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器,音频解码器、蓝牙模块、网络模块、FLASH存储器、USB控制器和RAM存储器均与主控制器电连接。


3.如权利要求2所述的一种内外网隔离的语音转文字实时输入系统,其特征在于:所述麦克风及放大电路包括一个麦克风和音频放大器及其外围电路,音频放大器采用LM386放大器;所述主控制器的型号为S3C2410;所述音频解码器的型号为VS1063A;所述网络模块的型号为QCA64x8;所述USB控制器的型号为CH378;所述RAM存储器的型号为IDT70V09;所述FLASH存储器的型号为M25P16;所述蓝牙模块的型号为AC6919A。


4.一种内外网隔离的语音转文字实时输入方法,其特征在于:包括如下步骤:
步骤1:建立所述一种内外网隔离的语音转文字实时输入系统;
步骤2:语音采集模块通过麦克风采集语音的音频模拟信息,并通过音频解码器将音频模拟信息转换...

【专利技术属性】
技术研发人员:吉济全
申请(专利权)人:江苏税软软件科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1