用于提高音频质量的听写客户端反馈制造技术

技术编号：8327723 阅读：200 留言：0更新日期：2013-02-14 13:47

提供了一种音频质量反馈系统和方法。该系统经由诸如麦克风的通信装置从客户端接收音频。该音频质量反馈系统将接收到的音频与关于反馈质量的一个或多个参数进行比较。这些参数包括例如：限幅、静音时间、信噪比。基于该比较，生成反馈以允许对通信装置或通信装置的使用进行调整，以改善音频质量。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】根据35 U.S.C§§119和120要求优先权本申请要求提交于2010年3月30日的第61/319,078序列号，名称为“DICTATION CLIENT FEEDBACK TO FACILITATE AUDIO QUALITY”的美国临时专利申请的利益，在此结合其全文作为参考。对其他共同待审的专利申请的参考无。
本申请的技术一般涉及听写系统，更具体而言，涉及向听写用户提供关于所听写的音频的质量的反馈，以允许在进行听写的同时进行校正。
技术介绍
原本听写是一种由一个人口述同时另一个人将口述内容记录下来的练习。记录员收听并写下口述的内容。使用现代化技术，听写已经进步到这样一个阶段，其中话音辨识和语音到文本技术使得计算机和处理器能够起到记录员的作用。当前的技术已经产生基本上两种基于听写和转录的计算机风格。一种风格包括将软件加载到机器上，以接收和转录口述内容，其通常被称为客户侧听写。机器实时或接近实时地转录口述内容。另一种风格包括保存口述音频文件，并将口述音频文件发送到中央服务器，其通常被称为服务器侧批处理听写。中央服务器转录音频文件并返回转录脚本。这种转录经常是在几小时，或类似时间之后完成，此时服务器具有较少的处理需求。在客户端侧听写或服务器侧听写这两种情况中的任一种中，必须由系统来捕捉音频。将该音频文件提供给语音到文本引擎，其将该音频文件转录成文本数据文件。该文本数据文件的质量（即，...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.03.30 US 61/319,0781.一种装置，包括：
听写管理器，其被耦合到从客户站接收音频文件的第一网络，所述听写
管理器被配置成将从所述客户站接收的所述音频文件发送给听写服务器，该
听写服务器将所述音频文件转录成文本文件；
存储器，其被耦合到所述听写管理器，所述存储器被配置成存储通过所
述听写管理器接收的所述音频文件；以及
音频质量管理器，其被耦合到所述听写管理器，以提供关于所述音频文
件中的音频的质量的信息，所述音频质量管理器包括处理器，以比较来自所
述客户站的所述音频文件与至少一个参数，该参数影响被存储在耦合到所述
音频质量管理器的存储器中的音频质量，并发送将要被接收的配置调整，其
中，所述配置调整的实现起到改善接收到的音频文件的质量的作用，这将改
善转录的质量。
2.如权利要求1所述的装置，其中，所述第一和第二网络相同。
3.如权利要求2所述的装置，其中，所述第一和第二网络是总线协议。
4.如权利要求1所述的装置，其中，所述第一网络选自于以下网络构成
的组：互联网、本地网、广域网、无线局域网、wifi网络、蓝牙网络、wimax、
以太网、蜂窝式网络或者其组合。
5.如权利要求1所述的装置，其中，使用短消息服务、email或语音邮
件发送所述配置调整。
6.如权利要求1所述的装置，其中，所述至少一个参数包括确定所述音
频文件是否至少具有在首次话语之前的一个前端静音时间段，在最后的话语
之后的末端静音时间段或者它们的组合。
7.如权利要求1所述的装置，其中，所述配置调整包括要求所述客户在
具有足够的时间用于将被接收的话语的情况下激活或去激活所述记录。
8.如权利要求1所述的装置，其中，所述至少一个参数包括确定所述音
频文件是否被限幅。
9.如权利要求8所述的装置，其中，所述配置调整包括要求所述客户减
小说话音量。
10.如权利要求1所述的装置，其中，所述至少一个参数包括确定所述
音频文件的信噪比是否...

【专利技术属性】
技术研发人员：P福克斯，M克拉克，J福尔廷斯基，
申请(专利权)人：NVOQ股份有限公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人