富士通株式会社专利技术

富士通株式会社共有10016项专利

  • 本发明提供一种声音到达方向的估测方法以及声音到达方向的估测设备。作为多通道输入接受来自多个方向所在的声源的声音信号,以及将每一通道的信号转换为频率轴上的信号。对于每一相同频率,计算所转换的信号的相位分量,以及计算多通道之间的相位差。计算...
  • 一种信号处理方法,该信号处理方法包括以下步骤:    第一步骤,其对预定长度的被执行了预定窗口函数的第一帧信号的频谱执行预定处理,以将所述频谱转换到时域中以生成第二帧信号;和    第二步骤,其对具有与所述第二帧信号相同的帧长度的预定校...
  • 一种语音增强设备,该语音增强设备对输入的语音数据的不清楚部分进行校正并输出,该语音增强设备包括:    波形特征量计算单元,该波形特征量计算单元对于各音素计算所述语音数据的波形特征量,所述语音数据连同将该语音数据划分为音素的音素边界数据...
  • 本发明涉及一种语音识别方法、语音识别装置及计算机程序。其中,语音识别装置基于周期性发生的脉冲噪声的发生周期和持续时间,预测脉冲噪声发生的段,基于除与所预测的段相对应的帧的特征分量之外的剩余帧的特征分量,或者基于从其中删除了与所预测的段相...
  • 本发明公开了一种音频信号插补方法以及装置。该音频信号插补装置包括频谱改变计算单元,用于确定频谱改变,该频谱改变表示输入音频信号的当前帧的频谱和存储在频谱存储单元中的输入音频信号的前一帧的频谱的各频谱成分之间的差值。插补频带确定单元,采用...
  • 本发明涉及一种声音信号处理方法、声音信号处理设备及计算机程序。其中,声音信号处理设备(1)根据所获取的声音数据产生帧(S3),并按照逐帧基础将声音信号转换为频谱(S4)。然后,声音信号处理设备(1)基于该频谱计算频谱包络(S5)、从该频...
  • 本发明提供一种声音信号纠正方法、声音信号纠正设备以及计算机程序,声音信号纠正设备(1)通过如下步骤纠正基于获取的声音的声音信号:进行FFT处理将获取的声音信号转换为相位频谱和振幅频谱(步骤S4);将获取的声音信号的振幅频谱与噪声模型进行...
  • 本发明提供了语音识别装置、方法和记录有语音识别软件程序的记录介质。当识别候选项的相似度大于第二阈值时,语音验证单元输出识别候选项作为识别结果,并且当识别候选项的相似度小于第二阈值时,如果该识别候选项的相似度大于第一阈值并且同时该识别候选...
  • 本发明提供了解码装置和解码方法。所述解码装置将第一编码数据和第二编码数据解码成音频信号,所述第一编码数据根据所述音频信号的低频分量被编码到第一时间范围,所述第二编码数据在根据所述低频分量生成所述音频信号的高频分量时使用并被编码到第二时间...
  • 本发明公开了解码装置和解码方法。该解码装置将从音频信号的低频分量编码的第一编码数据和当根据低频分量产生音频信号的高频分量时使用的且根据特定的带宽编码的第二编码数据解码成音频信号。在该解码装置中,高频分量检测单元将高频分量分成具有与所述特...
  • 本发明为一种汉语韵律词组词方法及装置,所述方法包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注隔...
  • 本发明提供一种声音判定方法和声音判定装置。该声音判定装置通过多个声音接收单元接收声信号,并产生具有预定时间长度的帧。该声音判定装置在帧单元中对所述声信号执行FFT,并将所述声信号转换成为频率轴上的信号的相位谱和振幅谱,然后将各个声信号之...
  • 本发明提供语音识别系统和语音识别方法。提供了识别结果提取单元和一致确定单元。所述识别结果提取单元从识别结果存储单元中提取N个最佳解A和通过话语B获得的N个最佳解B。所述话语B跟随在与N个最佳解A相对应的话语A之后,并且由与所述话语A的讲...
  • 本发明涉及韵律修改装置和方法及存储有韵律修改程序的记录介质。该韵律修改装置包括:真实话音韵律输入部,用于接收从人类发声中提取的真实话音韵律信息;规则韵律生成部,用于针对真实话音韵律信息中的至少包括要修改的音素或音素串的部分,利用表示人类...
  • 本发明提供对于语音代码进行数据嵌入/抽取方法、装置以及系统。在将任意的数据嵌入到语音代码时,使用构成语音代码的元素代码中的第1元素代码和临界值来判断是否满足数据嵌入条件;如果满足,就通过以任意的数据来替换第2元素代码将数据嵌入到语音代码...
  • 本发明涉及文本到语音设备。根据本发明实施例的一个方面提供一种用于将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据以及与多个停顿相对应的停顿数据,其中所述多个停顿被插入到将被转换为声音信号的所述文本数据...
  • 本发明涉及文本到语音转换设备及其转换方法。根据本发明实施例的一个方面,提供一种用于将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据以及与多个停顿相对应的停顿数据,其中所述停顿被插入到将被转换为声音信号...
  • 本发明涉及一种文本到语音设备。根据本发明实施例的一个方面,提供一种将文本数据转换为声音信号的设备,该设备包括:音素确定器,用于确定与多个音素相对应的音素数据和与多个停顿相对应停顿数据,其中所述多个停顿待被插入到将被转换为语音信号的文本数...
  • 本发明提供一种回音抑制器、回音抑制方法。一种用于抑制回音信号的设备(回音抑制器),所述回音信号包括在对应于测量声音的测量信号中。在该设备中,测量信号和参考信号从时域变换到频率域(频域)中,并计算以获得频域中测量信号和参考信号之间的比率和...
  • 从显示屏幕上显示的图像中提取出提取图像。确定所述图像的提取图像的强调显示部分的位置。并且在所述强调显示部分的位置处放大显示所述提取图像,从而存在所述提取图像的区域可相对于所述图像透明并被放大。