使用听觉注意力线索的语音音节/元音/音素边界检测制造技术

技术编号:9548241 阅读:176 留言:0更新日期:2014-01-09 05:59
在讲话期间的音节或元音或音素边界检测中,可以针对声音输入窗口确定听觉频谱并且可以从所述听觉频谱中提取一个或多个多尺度特征。可以使用单独的二维频谱时间接收滤波器来提取每个多尺度特征。可以生成对应于所述一个或多个多尺度特征的一个或多个特征图,并且可以从所述一个或多个特征图中的每个提取听觉要点矢量。可以通过放大从所述一个或多个特征图所提取的每个听觉要点矢量来获得累积要点矢量。可以通过使用机器学习算法将所述累积要点矢量映射到一个或多个音节或元音或音素边界特性来检测所述声音输入窗口中的一个或多个音节或元音或音素边界。

【技术实现步骤摘要】
【国外来华专利技术】
使用听觉注意力线索的语音音节/元音/音素边界检测

【技术保护点】
一种用于在语音中进行音节/元音/音素边界检测的方法,其包括:a)针对声音输入窗口确定听觉频谱;b)从所述听觉频谱中提取一个或多个多尺度特征,其中每个多尺度特征是使用单独的二维频谱时间接收滤波器进行提取的;c)生成对应于所述一个或多个多尺度特征的一个或多个特征图;d)从所述一个或多个特征图中的每个提取听觉要点矢量;e)通过放大从所述一个或多个特征图所提取的每个听觉要点矢量来获得累积要点矢量;以及f)通过使用机器学习算法将所述累积要点矢量映射到一个或多个音节或元音边界特性来检测所述声音输入窗口中的一个或多个音节或元音或音素边界。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:O卡琳里陈如新
申请(专利权)人:索尼电脑娱乐公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1