富士通株式会社专利技术

富士通株式会社共有9667项专利

  • 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语...
  • 本发明为一种基于决策树的语音时长预测装置及方法。包括:输入部,用于输入语言、语音学标注序列;决策树生成部,生成用于预测语音单位时长的决策树;语音单位时长预测部,根据所述的决策树对每个语音单位设定固定时长;并以与所述语音单位相邻的音素上下...
  • 本发明提供一种噪声抑制装置,该噪声抑制装置具有将输入信号分割为多个频带,输出频带信号的频率分割单元;求出频带信号的振幅分量的振幅计算单元;估计输入信号所含的噪声的振幅分量来按照每个频带求出估计噪声振幅分量的噪声估计单元;按照每个频带产生...
  • 一种用于对语言模型组进行群集的群集系统,包括:并集语言模型建立单元,其为每一个语言模型建立并集语言模型,以将词汇的并集作为条目包括在语言模型组中;以及群集单元,其对并集语言模型组进行群集,以将并集语言模型组分类成多个群集。当并集语言模型...
  • 提供了语音识别设备、语音识别方法以及记录有计算机程序的记录介质,其中,即使在独立地或另选地采用语音识别语法时,也改进了语音识别响应。接收话音数据。然后,保持语音识别结果的输出延缓状态,直到发声部分之后的无声区间的持续时间达到基准时间为止...
  • 语音识别装置、语音识别方法及存储语音识别程序的记录介质。一种语音识别装置,用于识别包含在语音中的多个连续关联的单词,该装置包括:声学模型读取部分,用于读取声学模型;字典管理部分,用于从字典数据中读取所需数据;和识别部分,用于利用所述声学...
  • 本发明涉及一种语音识别装置及存储语音识别程序的记录介质。这种语 音识别装置包括:词汇词典存储单元,预先存储多个词;词汇词典管理单元, 提取识别目标词;匹配单元,基于接受的语音计算与识别目标词的匹配度; 结果输出单元,根据匹配度结果输出具...
  • 本发明提供了定向集音装置、定向集音方法以及存储器产品。接受从存在于多个方向上的声源输入的声音并将其转换为频率轴上的信号。计算用于抑制频率轴上的经转换信号的抑制函数,将频率轴上的信号的振幅分量与所计算的抑制函数相乘,并对频率轴上的经转换信...
  • 本发明提供基音转换方法和设备,其可以在尽可能地抑制由于进行基音转换而导致的声音质量的劣化的同时减小数据吞吐量。在该基音转换方法和装置中,输入按预定处理单位的输入信号基音模式和目标基音模式,并对表示从输入信号基音模式到目标基音模式的基音转...
  • 本发明提供了一种信号处理方法和装置,该信号处理方法和装置在噪声电平的急剧上升分段中提高了所估算的噪声的跟踪速度,并且在语音分段中很少产生由于语音的影响而导致的噪声频谱的估算误差,在该信号处理方法和装置中,提取作为输入信号的抽样数据的时域...
  • 一种语音认证系统,是语音输入关键词来进行认证的文本依存性的语音认证系统,具有:输入部(11),其将以可发声的单位为最小单位而分割为多个部分的关键词的语音输入,对每个所述部分隔开时间间隔经多次接收;语音模型存储部(20),预先存储使用者的...
  • 本发明提供一种声音到达方向的估测方法以及声音到达方向的估测设备。作为多通道输入接受来自多个方向所在的声源的声音信号,以及将每一通道的信号转换为频率轴上的信号。对于每一相同频率,计算所转换的信号的相位分量,以及计算多通道之间的相位差。计算...
  • 一种信号处理方法,该信号处理方法包括以下步骤:    第一步骤,其对预定长度的被执行了预定窗口函数的第一帧信号的频谱执行预定处理,以将所述频谱转换到时域中以生成第二帧信号;和    第二步骤,其对具有与所述第二帧信号相同的帧长度的预定校...
  • 一种语音增强设备,该语音增强设备对输入的语音数据的不清楚部分进行校正并输出,该语音增强设备包括:    波形特征量计算单元,该波形特征量计算单元对于各音素计算所述语音数据的波形特征量,所述语音数据连同将该语音数据划分为音素的音素边界数据...
  • 本发明涉及一种语音识别方法、语音识别装置及计算机程序。其中,语音识别装置基于周期性发生的脉冲噪声的发生周期和持续时间,预测脉冲噪声发生的段,基于除与所预测的段相对应的帧的特征分量之外的剩余帧的特征分量,或者基于从其中删除了与所预测的段相...
  • 本发明公开了一种音频信号插补方法以及装置。该音频信号插补装置包括频谱改变计算单元,用于确定频谱改变,该频谱改变表示输入音频信号的当前帧的频谱和存储在频谱存储单元中的输入音频信号的前一帧的频谱的各频谱成分之间的差值。插补频带确定单元,采用...
  • 本发明涉及一种声音信号处理方法、声音信号处理设备及计算机程序。其中,声音信号处理设备(1)根据所获取的声音数据产生帧(S3),并按照逐帧基础将声音信号转换为频谱(S4)。然后,声音信号处理设备(1)基于该频谱计算频谱包络(S5)、从该频...
  • 本发明提供一种声音信号纠正方法、声音信号纠正设备以及计算机程序,声音信号纠正设备(1)通过如下步骤纠正基于获取的声音的声音信号:进行FFT处理将获取的声音信号转换为相位频谱和振幅频谱(步骤S4);将获取的声音信号的振幅频谱与噪声模型进行...
  • 本发明提供了语音识别装置、方法和记录有语音识别软件程序的记录介质。当识别候选项的相似度大于第二阈值时,语音验证单元输出识别候选项作为识别结果,并且当识别候选项的相似度小于第二阈值时,如果该识别候选项的相似度大于第一阈值并且同时该识别候选...
  • 本发明提供了解码装置和解码方法。所述解码装置将第一编码数据和第二编码数据解码成音频信号,所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围,所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间...