用于移动装置的智能音频记录的系统和方法制造方法及图纸

技术编号：8292255 阅读：159 留言：0更新日期：2013-02-01 12:52

本发明专利技术呈现一种能够自动开始和结束通过至少一个麦克风俘获的音频信号的录入的移动装置。所述移动装置能够基于所述音频输入信号的上下文信息来调整与音频记录相关的多个参数。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术大体上涉及音频和语音信号俘获。更具体地说，本专利技术涉及能够基于音频上下文信息的分析来起始且/或终止音频和语音信号俘获操作或(可互换地说)记录操作的移动装置。
技术介绍
由于专用集成电路(ASIC)的功率控制技术进步以及例如数字信号处理器(DSP)等移动处理器或微处理器的计算能力增加，越来越多的移动装置现在能够实现复杂得多的特征，所述特征归因于缺少所需要的计算能力或硬件(HW)支持而直到现在才被视为切实可行的。举例来说，最初开发移动台(MS)或移动电话以使得能够经由传统的基于电路的无线蜂窝式网络进行话音或语音通信。因此，原先设计MS以解决基本的话音应用，如话音压缩、声学回声消除(AEC)、噪声抑制(NS)和话音录入。实施话音压缩算法的过程被称为声码，且实施设备被称为声码器或“语音译码器”。存在若干种标准化声码算法以支持需要语音通信的不同数字通信系统。第三代合作伙伴计划2(3GPP2)是实例标准化组织，其指定码分多址(CDMA)技术，例如IS_95、CDMA20001x无线电发射技术(IxRTT)和CDMA2000演进数据优化(EV-DO)通信系统。第三代合作伙伴计划(3GPP)是另一实例标准化组织，其指定全球移动通信系统(GSM)、通用移动电信系统(UMTS)、高速下行链路包接入(HSDPA)、高速上行链路包接入(HSUPA)、高速包接入演进(HSPA+)和长期演进(LTE)。因特网协议话音(VOIP)是在3GPP和3GPP2中所定义的通信系统以及其它系统中使用的实例协议。此类通信系统和协议中所采用的声码器的实例包括国际电信联盟(ITU)-T ...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.04.08 US 61/322,176;2011.03.30 US 13/076,2421.一种针对移动装置处理数字音频信号的方法，所述方法包含通过至少一个麦克风接收声学信号；将所述所接收的声学信号转换为所述数字音频信号；从所述数字音频信号提取至少一个听觉上下文信息；响应于自动检测到开始事件指示符，针对所述数字音频信号执行音频记录；以及响应于自动检测到结束事件指示符，结束所述音频记录。2.根据权利要求I所述的处理数字音频信号的方法，其中所述转换包含将所述所接收的声学信号变换为电信号；取样所述电信号以获得所述数字音频信号；以及将所述数字音频信号存储到缓冲器中，其中所述取样是基于取样频率和数据宽度。3.根据权利要求I所述的处理数字音频信号的方法，其中所述至少一个听觉上下文信息涉及以下各项中的至少一者音频分类、关键词识别或说话者识别。4.根据权利要求3所述的处理数字音频信号的方法，其中所述至少一个听觉上下文信息至少部分基于以下各项中的一者信号能量、信噪比、频谱倾斜或过零率。5.根据权利要求3所述的处理数字音频信号的方法，其中所述至少一个听觉上下文信息至少部分基于非听觉信息。6.根据权利要求5所述的处理数字音频信号的方法，其中所述非听觉信息包含日程安排或日历信息。7.根据权利要求I所述的处理数字音频信号的方法，其中所述检测所述开始事件指示符包含从所述至少一个听觉上下文信息选择至少一个上下文信息；以及响应于将所述选定上下文信息与至少一个预定阈值进行比较，确定是否已检测到所述开始事件指示符。8.根据权利要求I所述的处理数字音频信号的方法，其中所述检测所述开始事件指示符至少部分基于非听觉信息，且其中所述非听觉信息包含日程安排或日历信息。9.根据权利要求I所述的处理数字音频信号的方法，其中所述执行所述音频记录包含至少部分基于所述至少一个听觉上下文信息来更新与所述转换相关的至少一个参数；响应于至少部分基于所述至少一个听觉上下文信息来确定是否需要额外处理，将所述额外处理应用于所述数字音频信号以获得经处理的音频信号；以及将所述经处理的音频信号存储到存储器存储装置中。10.根据权利要求9所述的处理数字音频信号的方法，其中所述额外处理包括信号增强处理。11.根据权利要求10所述的处理数字音频信号的方法，其中所述信号增强处理包括以下各项中的至少一者声学回声消除AEC、接收话音增强RVE、主动噪声消除ANC、噪声抑制NS、声学增益控制AGC、声学音量控制AVC或声学动态范围控制ADRC。12.根据权利要求11所述的处理数字音频信号的方法，其中所述噪声抑制是基于多个麦克风。13.根据权利要求9所述的处理数字音频信号的方法，其中所述额外处理包括信号压缩处理。14.根据权利要求13所述的处理数字音频信号的方法，其中所述信号压缩处理包括语音压缩或音频压缩。15.根据权利要求13所述的处理数字音频信号的方法，其中基于所述听觉上下文信息来确定至少一个压缩参数。16.根据权利要求15所述的处理数字音频信号的方法，其中所述至少一个压缩参数包括压缩模式、位率或通道数目。17.根据权利要求9所述的处理数字音频信号的方法，其中所述存储器存储装置包含在所述移动装置内部的本地存储器或通过无线信道连接到所述移动装置的远程存储器。18.根据权利要求17所述的处理数字音频信号的方法，其中至少部分基于所述听觉上下文信息来选择所述存储器存储装置。19.根据权利要求I所述的处理数字音频信号的方法，其中所述检测所述结束事件指示符包含从所述至少一个听觉上下文信息选择至少一个上下文信息；以及响应于将所述选定上下文信息与至少一个预定阈值进行比较，确定是否已检测到所述结束事件指示符。20.根据权利要求I所述的处理数字音频信号的方法，其中所述检测所述结束事件指示符至少部分基于在预定时间周期期间不出现听觉事件。21.根据权利要求I所述的处理数字音频信号的方法，其中所述检测所述结束事件指示符至少部分基于非听觉信息，且其中所述非听觉信息包含日程安排或日历信息。22.一种用于针对移动装置处理数字音频信号的设备，所述设备包含至少一个麦克风，其经配置以接收声学信号；转换器，其经配置以将所述所接收的声学信号转换为所述数字音频信号；上下文识别器，其经配置以从所述数字音频信号提取至少一个听觉上下文信息；开始事件管理器，其经配置以自动检测开始事件指示符；结束事件管理器，其经配置以自动检测结束事件指示符；以及音频记录处理器，其经配置以响应于所述检测到所述开始事件指示符而针对所述数字音频信号执行音频记录；以及响应于所述检测到所述结束事件指示符而结束所述音频记录。23.根据权利要求22所述的用于处理数字音频信号的设备，其中所述转换器经配置以将所述所接收的声学信号变换为电信号；取样所述电信号以获得所述数字音频信号；以及将所述数字音频信号存储到缓冲器中，其中所述取样是基于取样频率和数据宽度。24.根据权利要求22所述的用于处理数字音频信号的设备，其中所述至少一个听觉上下文信息涉及以下各项中的至少一者音频分类、关键词识别或说话者识别。25.根据权利要求24所述的用于处理数字音频信号的设备，其中所述至少一个听觉上下文信息至少部分基于以下各项中的一者信号能量、信噪比、频谱倾斜或过零率。26.根据权利要求24所述的用于处理数字音频信号的设备，其中所述至少一个听觉上下文信息至少部分基于非听觉信息。27.根据权利要求26所述的用于处理数字音频信号的设备，其中所述非听觉信息包含日程安排或日历信息。28.根据权利要求22所述的用于处理数字音频信号的设备，其中所述开始事件管理器经配置以从所述至少一个听觉上下文信息选择至少一个上下文信息；将所述选定上下文信息与至少一个预定阈值进行比较；以及响应于所述比较而确定是否已检测到所述开始事件指示符。29.根据权利要求22所述的用于处理数字音频信号的设备，其中所述检测所述开始事件指示符至少部分基于非听觉信息，且其中所述非听觉信息包含日程安排或日历信息。30.根据权利要求22所述的用于处理数字音频信号的设备，其中所述音频记录处理器经配置以至少部分基于所述至少一个听觉上下文信息来更新与所述转换器相关的至少一个参数；至少部分基于所述至少一个听觉上下文信息来确定是否需要额外处理；响应于所述确定而将所述额外处理应用于所述数字音频信号以获得经处理的音频信号；以及将所述经处理的音频信号存储到存储器存储装置中。31.根据权利要求30所述的用于处理数字音频信号的设备，其中所述额外处理包括信号增强处理。32.根据权利要求31所述的用于处理数字音频信号的设备，其中所述信号增强处理包括以下各项中的至少一者声学回声消除AEC、接收话音增强RVE、主动噪声消除ANC、噪声抑制NS、声学增益控制AGC、声学音量控制AVC或声学动态范围控制ADRC。33.根据权利要求32所述的用于处理数字音频信号的设备，其中所述噪声抑制是基于多个麦克风。34.根据权利要求30所述的用于处理数字音频信号的设备，其中所述额外处理包括信号压缩处理。35.根据权利要求34所述的用于处理数字音频信号的设备，其中所述信号压缩处理包括语音压缩或音频压缩。36.根据权利要求34所述的用于处理数字音频信号的设备，其中至少一个压缩参数是基于所述听觉上下文信息来确定。37.根据权利要求36所述的用于处理数字音频信号的设备，其中所述至少一个压缩参数包括压缩模式、位率或通道数目。38.根据权利要求30所述的用于处理数字音频信号的设备，其中所述存储器存储装置包含在所述移动装置内部的本地存储器或通过无线信道连接到所述移动装置的远程存储器。39.根据权利要求38所述的用于处理数字音频信号的设备，其中所述存储器存储装置是至少部分基于所述听觉上下文信息来选择。40.根据权利要求22所述的用于处理数字音频信号的设备，其中所述结束事件管理器经配置以从所述至少一个听觉上下文信息选择至少一个上下文信息；将所述选定上下文信息与至少一个预定阈值进行比较；以及响应于所述比较而确定是否已检测到所述结束事件指示符。41.根据权利要求22所述的用于处理数字音频信号的设备，其中所述检测所述结束事件指示符至少部分基于在预定时间周期期间不出现听觉事件。42.根据权利要求22所述的用于处理数字音频信号的设备，其中所述检测所述结束事件指示符至少部分基于非听觉信息，且其中所述非听觉信息包含日程安排或日历信息。43.一种用于针对移动装置处理数字音频信号的设备，所述设备包含用于通过至少一个麦克风接收声学信号的装置；用于将所述所接收的声学信号转换为所述数字音频信号的装置；用于从所述数字音频信号提取至少一个听觉上下文信息的装置；用于自动检测开始事件指示符的装置；用于响应于所述检测到所述开始事件指示符而针对所述数字音频信号执行音频记录的装置；用于自动检测结束事件指示符的装置；以及用于响应于所述检测到所述结束事件指示符而针对所述数字音频信号结束音频记录的装置。44.根据权利要求43所述的用于处理数字音频信号的设备，其中所述用于转换的装置包含用于将所述所接收的声学信号变换为电信号的装置；用于取样所述电信号以获得所述数字音频信号的装置；以及用于将所述数字音频信号存储到缓冲器中的装置，其中所述取样是基于取样频率和数据宽度。45.根据权利要求43所述的用于处理数字音频信号的设备，其中所述至少一个听觉上下文信息涉及以下各项中的至少一者音频分类、关键词识别或说话者识别。46.根据权利要求45所述的用于处理数字音频信号的设备，其中所述至少一个听觉上下文信息至少部分基于以下各项中的一者信号能量、信噪比、频谱倾斜或过零率。47.根据权利要求45所述的用于处理数字音频信号的设备，其中所述至少一个听觉上下文信息至少部分基于非听觉信息。48.根据权利要求47所述的用于处理数字音频信号的设备，其中所述非听觉信息包含日程安排或日历信息。49.根据权利要求43所述的用于处理数字音频信号的设备，其中所述用于检测所述开始事件指示符的装置包含用于从所述至少一个听觉上下文信息选择至少一个上下文信息的装置；用于将所述选定上下文信息与至少一个预定阈值进行比较的装置；以及用于响应于所述比较而确定是否已检测到所述开始事件指示符的装置。50.根据权利要求43所述的用于处理数字音频信号的设备，其中所述检测所述开始事件指示符至少部分基于非听觉信息，且其中所述非听觉信息包含日程安排或日历信息。51.根据权利要求43所述的用于处理数字音频信号的设备，其中所述用于执行所述音频记录的装置包含用于至少部分基于所述至少一个听觉上下文信息来更新与所述用于转换的装置相关的至少一个参数的装置；用于至少部分基于所述至少一个听觉上下文信息来确定是否需要额外处理的装置；用于响应于所述确定而将所述额外处理应用于所述数字音频信号以获得经处理的音频信号的装置；以及用于将所述经处理的音频信号存储到存储器存储装置中的装置。52.根据权利要求51所述的用于处理数字音频信号的设备，其中所述额外处理包括信号增强处理。53.根据权利要求52所述的用于处理数字音频信号的设备，其中所述信号增强处理包括以下各项中的至少一者声学回声消除AEC、接收话音增强RVE、主动噪声消除ANC、噪声抑制NS、声学增益控制AGC、声学音量控制AVC或声学动态范围控制ADRC。54.根据权利要求53所述的用于处理数字音频信号的设备，其中所述噪声抑制是基于多个麦克风。55.根据权利要求51所述的用于处理数字音频信号的设备，其中所述额外处理包括信号压缩处理。56.根据权利要求55所述的用于处理数字音频信号的设备，其中所述信号压缩处理包括语音压缩或音频压缩。57.根据权利要求55所述的用于处理数字音频信号的设备，其中至少一个压缩参数是基于所述听觉上下文信息来确定。58.根据权利要求57所述的用于处理数字音频信号的设备，其中所述至少一个压缩参数包括压缩模式、位率或通道数目。59.根据权利要求51所述的用于处理数字音频信号的设备，其中所述存储器存储装置包含在所述移动装置内部的本地存储器或通过无线信道连接到所述移动装置的远程存储器。60.根据权利要求59所述的用于处理数字音频信号的设备，其中所述存储器存储装置是至少部分基于所述听觉上下文信息来选择。61.根据权利要求43所述的用于处理数字音频信号的设备，其中所述用于检测所述结束事件指示符的装置包含用于从所述至少一个听觉上下文信息选择至少一个上下文信息的装置；用于将所述选定上下文信息与至少一个预定阈值进行比较的装置；以及用于响应于所述比较而确定是否已检测到所述结束事件指示符的装置。62.根据权利要求43所述的用于处理数字音频信号的设备，其中所述用于检测所述结束事件指示符的装置至少部分基于在预定时间周期期间不出现听觉事件。63.根据权利要求43所述的用于处理数字音频信号的设备，其中所述用于检测所述结束事件指示符的装置至少部分基于非听觉信息，且其中所述非听觉信息包含日程安排或日历信息。64.一种非暂时计算机可读媒体，其包含用于针对移动装置处理数字音频信号的指令，所述指令在由处理器执行时致使所述处理器通过至少一个麦克风接收声学信号；将所述所接收的声学信号转换为所述数字音频信号；从所述数字音频信号提取至少一个听觉上下文信息；自动检测开始事件指示符；响应于所述检测到所述开始事件指示符而针对所述数字音频信号执行音频记录；自动检测结束事件指示符；以及响应于所述检测到所述结束事件指示符而结束所述音频记录。65.根据权利要求64所述的计算机可读媒体，其中所述在由处理器执行时致使所述处理器转换所述所接收的声学信号的指令经配置以致使所述处理器将所述所接收的声学信号变换为电信号；取样所述电信号以获得所述数字音频信号；以及将所述数字音频信号存储到缓冲器中，其中所述取样是基于取样频率和数据宽度。66.根据权利要求64所述的计算机可读媒体，其中所述至少一个听觉上下文信息涉及以下各...

【专利技术属性】
技术研发人员：太元·李，哈立德·埃尔马勒，柳熙钟，辛钟元，
申请(专利权)人：高通股份有限公司，
类型：
国别省市：

全部详细技术资料下载我是这个专利的主人