【技术实现步骤摘要】
1、本专利技术的领域本专利技术涉及语音处理。具体地说,本专利技术涉及到和设备。2、对相关技术的说明正常的人类语音包含多种频率成份通常从约100Hz(赫兹)到几KHz(千赫)。例如,人类语音具有低频基频,但人类语音的谐音则具有相当广的范围。由于人类语音中有多种频率,故一个人在与另一个人讲话时可确定声源的位置。换句话说,一个人通常能个性化地确定声源的位置并识别该声源。为了确定语音的可理解性或信息,收听者并不需要包含在语音中的较高频率的成份。所以,诸如蜂窝式电话、视频电话以及使用语音压缩算法的电话系统之类的多种通讯系统均摒弃了声源中的高频信息。因此,摒弃了大部分4千赫(KHz)以上的高频内容。在不需要确定语音的位置时,这一方案是适用的。但是,对要确定语言的位置的应用(例如虚拟现实)来说,业已证明,缺少语音的高频成份是不利的。这是因为,为了进行语音定位,收听者需要较高的频率。语音中高频内容有助于收听者在精神上感觉出声音位于什么地方。例如,高频内容有助于收听者确定声音位于自己的上方还是下方、或者是位于右方还是左方、或位于前方还是后方。因此,所需要的是一种对业已通过摒弃了高频内 ...
【技术保护点】
一种由计算机实现的用来增强对语音源进行3-D定位的方法,该方法包括: 接收一业已按预定取样率进行取样的语音信号; 确定上述语音信号的最大频率; 提高对上述语音信号的取样率;以及 给上述语音信号增加一低电平、宽带噪音以形成一具有较高频率成份的新语音信号。
【技术特征摘要】
US 1997-3-26 08/8260161.一种由计算机实现的用来增强对语音源进行3-D定位的方法,该方法包括接收一业已按预定取样率进行取样的语音信号;确定上述语音信号的最大频率;提高对上述语音信号的取样率;以及给上述语音信号增加一低电平、宽带噪音以形成一具有较高频率成份的新语音信号。2.如权利要求1的方法,其特征在于,该方法还包括下列步骤传送上述新语音信号。3.如权利要求1的方法,其特征在于,提高后的取样率至少是前述最大频率的两倍。4.如权利要求3的方法,其特征在于,将所述取样率增加到二至六倍。5.如权利要求1的方法,其特征在于,所述低电平、宽带噪音具有约为提高后的取样率一半的频率。6.如权利要求1的方法,其特征在于,所述低电平、宽带噪音比前述语音信号低约20至30分贝。7.如权利要求1的方法,其特征在于,所述低电平、宽带噪音具有约8KHz至约24KHz范围内的频率。8.一种计算机可读介质,其上存储有指令序列,该指令序列包括在被处理器执行时可使该处理器执行下列步骤的指令接收一数字语音信号;确定上述数字语音信号中出现的最大频率;确定上述数字语音信号的取样率;将上述数字语音信号的取样率提高至一提高后的取样率;给上述语音信号增加一低电平、宽带噪音以形成一具有较高频率的宽带数字语音信号;以及传送上述宽带数字语音信号。9.如权利要求8的计算机可读介质,其特征在于,还包括下列步骤提供用于所述宽带语音信号的位置信息。10.如权利要求8的计算机可读介质,其特征在于,所述最大频率约为4千赫兹(KHZ)。11.如权利要求10的计算机可读介质,其特征在于,所述提高后的取样率约在16至...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。