当前位置: 首页 > 专利查询>新华通讯社专利>正文

一种面向语音识别的抗噪音频传输的装置制造方法及图纸

技术编号:23606747 阅读:52 留言:0更新日期:2020-03-28 07:21
本发明专利技术公开了一种面向语音识别的抗噪音频传输的装置,将音源设备发生的扬声器信号S

An anti noise audio transmission device for speech recognition

【技术实现步骤摘要】
一种面向语音识别的抗噪音频传输的装置
本专利技术包含系统和装置两部分,首先涉及人工智能成熟技术的软件集成,尤其涉及语音实时转写、语音文件转写等分析引擎;其次涉及一种智能音频传输前置装置,尤其涉及一种面向语音识别的抗噪音频传输前置装置。本专利技术属于软件开发、人工智能、电器控制等

技术介绍
记者在新闻创作过程中离不开录音素材整理工作。面对采访过程中收集的大量宝贵录音素材,从中去粗取精,提炼新闻灵感与线索,需要进行反复回放录音、核查信息等整理工作。同时,部分单位每天都会开展大大小小的各类会议,在会议过程中,大多需要把会议的组织情况和具体内容记录下来,形成会议记录。部分重要会议需要记载、传达会议情况和议定事项,整理为会议纪要。为了降低采访素材或会议记录音频整理同事的工作强度和难度,提升工作效率和工作成果的准确性,研发一套支持多语种的录音转写调听工具迫在眉睫。该工具须实现对录音数据的整理功能,同时支持将录音识别结果与时间帧对齐与联动,并可以让用户自由编辑与下载识别结果。同时,在实际应用中,手机录音功能除了会将电视机的声音采集进去,还会把手机周围的杂声拾取进去,影响语音服务的识别转写服务,因此设计一种能够实现音频传输的前置装置非常必要。
技术实现思路
针对记者编辑用户日常处理新闻录音与会议记录等素材时重复劳动多等问题,本专利技术将人工智能成熟技术进行软件集成,在记者站报道指挥客户端研发嵌入了语音转文字功能的装置,该装置能够实现采访过程中实时转写,也能够实现数小时采访录音分钟级的高效转写,同时还支持转写出的文字逐帧修改与一键建稿等新闻创作功能。针对手机录音中普遍存在的环境噪声等问题,本专利技术提供了一种面向语音识别的抗噪音频传输前置装置,其实现方式结构简单、使用方便灵活,使原本只能通过手机放置在音箱旁边录音的方式具备抗噪传输的功能。本专利技术采用的技术方案是:针对HDMI数字电视,该装置包含三个组合模块,分别是HDMI一转二分配器模块、HDMI音视频分离模块和音频信号转接处理模块。使用HDMI一转二分配器模块对原始HDMI信号进行复制,一路信号传输到视频播放设备,如电视、显示等,进行正常的节目放映观看,另一路信号通过HDMI音视频分离模块中,分离出音频信号,接入音频信号转接处理模块,通过音频信号转接处理模块对输出到移动客户端的信号进行语音转写文字等后续处理。针对模拟电话或者IP数字电话,使用4P4C端口,将音讯盒子模块通过并联的方式接入电话手柄的4芯线中。电话手柄的4芯线分别定义为麦克风信号、地线a、扬声器信号和地线b,对模拟电话和扬声器信号中包含了对话机麦克风的信号回馈,所以直接通过音讯盒子模块获取双方音频信号。而对IP数字电话,需要通过两条电路线路分别对麦克风和扬声器信号进行截取,然后接入移动客户端进行后续处理。音讯盒子模块作用是将音源设备发生的扬声器信号Ss转变成能够被移动设备的TRRS接口识别的麦克风信号Sm。移动设备TRRS端接收驻极体麦克风产生的Sm信号需要使用其内置的放大电路对驻极体咪头进行驱动,因音讯盒子模块进行的工作是模拟麦克风信号,为了消除接收端的驱动电流对Ss的干扰,模块中使用2组有极电容C2、C1过滤掉来自驱动端的驱动电流。同时,移动设备TRRS端会对接入的设备进行检测,以判断设备为TRS型(耳机)或TRRS型(耳麦),并且部分移动设备会对接入设备进行阻抗匹配,因此模块中使用电阻R3使得模块可以被正确识别为麦克风。在模块的使用场景中,接入的扬声器声道信号通过第一级电阻R1对信号进行初步的衰减,并通过下拉电阻R2保持电位和输入端一致,信号通过电容,过滤掉来自接收端可能存在的直流量,然后通过下拉电阻R4保持电位一致,通过电阻R3与移动端TRRS接口进行阻抗匹配,并作为麦克风信号输入到移动端中进行处理。若是多声道信号,包括立体声信号输入、数字电话手柄端接入,则增加相应数目的电路通道,通过尾部R3电阻,接入移动端。对于单条信号线路,信号电流,设输出电压为Um,输入信号电压为Us信号电势差可为模块对于整体输入信号的功率衰减为与传统的录音装置相比较,本专利技术具有如下技术效果:1、与记者站报道指挥客户端有效集成,在语音转写技术与新闻采编业务间找到了结合点,可进一步提升新闻生产、日常办公流程的工作效率。2、在转写数字信号电视的音频时,可以在电视正常播放且不受现场说话声干扰的影响,将电视信号中的音频进行拾取。3、在截取电话话柄的麦克风和扬声器信号后滤波衰减,通过线缆连接手机的语音转写文字服务,直接将通话内容转写成文字。附图说明图1是本专利技术涉及的软硬件流程图。图2是报道指挥客户端音讯功能流程图。图3是电视版音讯盒子使用装配图。图4是座机版音讯盒子使用装配图。图5是电视版盒子电路。图6是座机版盒子电路。具体实施方式本专利技术主要由两部分组成:一是基于报道指挥客户端的语音转文字功能的装置,它基于国际领先的多语种语音识别技术,结合采编场景定制研发而成;二是利用3D打印技术,开发出的一款面向语音识别的音频传输硬件装置,可消除由外界杂音导致的噪声问题。音频传输硬件装置具体实现以下三种情景下的语音转写功能作为音频的传输装置:1.电视信号的音频采集识别转写。针对从HDMI信号源获取电视当前播放的频道,进行音频信号的拾取,通过“音讯”服务实时识别音频转为文字。2.手机、平板电脑等移动终端中视频、音频信号的采集识别转写。当一部手机在播放一个视频或一段音频的时候,能够做到拾取该手机中的音频信号,传入到装有报道指挥APP的“音讯”服务的手机中,实时识别该音频并转为文字。3.固定电话座机中麦克风、听筒的音频信号采集识别转写。当采编人员通过电话座机进行电话采访的时候,通过该硬件连接到一台装有报道指挥APP的“音讯”服务的手机中,同时捕捉通话双方的说话声音,识别转写。以上前两种场景中,为了使报道指挥客户端的“音讯”服务能够接收到高质量的音频信号,音讯盒子采用了电信号的方式进行信号传播,此方法一方面避免了模拟波形在自然介质中传播时的衰减,并大幅降低了环境音对信号的干扰;另一方面,也使得用户在操作的同时,可以与外界进行不间断的语音交流。盒子通过3.5毫米TRS耳机接口连接音源,对立体声音源进行左右声道的混音,并进行了直流隔离、信号降噪、信号衰变等处理工作,使得信号转换成能够被各种拥有音频收放功能的电子设备识别的输入信号,从而可以方便地进行后续的信号处理。针对大量标准不同的手持移动设备的音频输出、输入接口,音讯盒子自定义了输入端的TRRS插口,以适应更广泛的使用场景,而输出端,简化了插口的连线方式,从根源上切断了来自接收端输出的信号干扰。并且音讯盒子预留了双相监听功能接口,除了能满足目前的音频信号收录功能外,也可以扩展出对输入、输出信号的监听功能。对于固定电话版本的音讯盒子,由于普通模拟电话机和多功能网络电话机在手柄接口、结构上的定义不相同,音讯盒子开发出拥有高兼容本文档来自技高网...

【技术保护点】
1.一种面向语音识别的抗噪音频传输的装置,其特征在于:该装置是音讯盒子模块,作用是将音源设备发生的扬声器信号S

【技术特征摘要】
1.一种面向语音识别的抗噪音频传输的装置,其特征在于:该装置是音讯盒子模块,作用是将音源设备发生的扬声器信号Ss转变成能够被移动设备的TRRS接口识别的麦克风信号Sm;移动设备TRRS端接收驻极体麦克风产生的Sm信号需要使用其内置的放大电路对驻极体咪头进行驱动,因音讯盒子模块进行的工作是模拟麦克风信号,为了消除接收端的驱动电流对Ss的干扰,模块中使用2组有极电容C2、C1过滤掉来自驱动端的驱动电流;同时,移动设备TRRS端会对接入的设备进行检测,以判断设备为TRS型或TRRS型,并且部分移动设备会对接入设备进行阻抗匹配,因此模块中使用电阻R3使得模块被正确识别为麦克风。


2.根据权利要求1所述的一种面向语音识别的抗噪音频传输的装置,其特征在于:
针对HDMI数字电视,该装置包含三个组合模块,分别是HDMI一转二分配器模块、HDMI音视频分离模块和音频信号转接处理模块;使用HDMI一转二分配器模块对原始HDMI信号进行复制,一路信号传输到视频播放设备,如电视、显示,进行正常的节目放映观看,另一路信号通过HDMI音视频分离模块中,分离出音频信号,接入音频信号转接处理模块,通过音频信号转接处理模块对输出到移动客户端的信号进行语音转写文字后续处理;
针对模拟电话或者IP数字电话,使用4P4C端口,将音讯盒子模块通过并联的方式接入电话手柄的4芯线中;电话手柄的4芯线分别定义为麦克风信号、地线a、扬声器信号和地线b,对模拟电话和扬声器信号中包含了对话机麦克风的信号回馈,所以直接通过音讯盒子模块获取双方音频信号;而对IP数字电话,需要通过两条电路线路分别对麦克风和扬声器信号进行截取,然后接入移动客户端进行后续处理。


3.根据权利要求2所述的一种面向语音识别的抗噪音频传输的装置,其特征在于:
在模块的使用场景中,接入的扬声器声道信号通过第一级电阻R1对信号进行初步的衰减,并通过下拉电阻R2保持电位和输入端一致,信号通过电容,过滤掉来自接收端可能存在的直流量,然后通过下拉电阻R4保持电位一致,通过电阻R3与移动端TRRS接口进行阻抗匹配,并作为麦克风信号输入到移动端中进行处理。


4.根据权利要求3所述的一种面向语音识别的抗噪音频传输的装置,其特征在于:
若是多声道信号,包括立体声信号输入、数字电话手柄端接入,则增加相应数目的电路通道,通过尾部R3电阻,接入移动端。


5.根据权利要求3所述的一种面向语音识别的抗噪音频传输的装置,其特征在于:
对于单条信号线路,信号电流,设输出电压为Um,输入信号电压为Us信号电势差可为模块对于整体输入信号的功率衰减为。


6.根据权利要求1所述的一种面向语音识别的抗噪音频传输的装置,其特征在于:音频传输硬件装置具体实现以下三种情景下的语音转写功能作为音频的传输装置:
电视信号的音频采集识别转写;针对...

【专利技术属性】
技术研发人员:罗毅成鹏郭鸿飞卢珏李泽魁何凯
申请(专利权)人:新华通讯社
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1