用于声学变换的系统和方法技术方案

技术编号：10488935 阅读：100 留言：0更新日期：2014-10-03 17:17

本发明专利技术公开了声学变换的系统和方法。一个具体的实施例是：变换由具有语音障碍的说话者产生的声学言语信号以使得他们的话语更易于普通听众理解。这些改变包括：语速或节奏的修正、响音中的共振峰频率的调整、异常发声的去除或调整、音素插入错误的删除、以及错误丢弃音素的替换。这些方法还可以被应用于音乐序列或声学序列的一般修正。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】交叉引用本申请要求于2011年7月25日提交的美国专利申请第61/511，275号的优先权，其全部内容通过引用合并于此。
本专利技术一般涉及声学变换，更具体地，本专利技术涉及用于改善说话者或声音的可理解性的声学变换。
技术介绍
目前存在一些声音被不准确地产生的例子，结果是所听到的声音不是想要的声音。具有构音障碍的说话者通常不准确地发出言语声。构音障碍是损害物理产生语音的一组神经运动失调。这些损害降低了对主要发声器官的正常控制，但是不影响对有意义的、语法正确的语言的常规理解或产生。例如，对喉返神经的损伤降低了对声壁振动(即，发声)的控制，这会引起异常地发声。由迷走神经的损伤引起的对软腭移动的控制不足可能导致在说话期间不成比例的空气量通过鼻子被释放(gp，鼻音重)。还已观察到的是，发音控制的不足还导致各种不自主的非言语声，包括腭咽或声门杂音。更普遍地，已表明的是，舌头和嘴唇灵活性的不足常常产生严重的口齿不清以及更加啰嗦以及更不可区分的元音目标空间。导致构音障碍的神经损伤通常也影响其它的身体活动，这会对运动性或者计算机交互产生极大的不良影响。例如，已经表明的是，在键盘交互中，严重的构音障碍的说话者比普通的用户慢150至300倍。然而，因为构音障碍性言语被观察到通常仅比普通说话者的语音慢10至17倍，所以言语被认定是用于计算机辅助互动的一种可行的输入模式。例如，必须使用公共交通前往城市的构音障碍的个人可能要购买车票、问路、或者向同行的乘客表明意图，所有这些都发生在嘈杂和拥挤的环境中。因此，一些提出的方案已涉及个人便携式通信装置(...

【技术保护点】
一种用于变换声学信号的系统，包括：声学变换引擎，其用于根据一个或多个变换规则对所述声学信号施加一个或多个变换，所述一个或多个变换规则被配置为确定所述声学信号的一个或多个时间片段中的各时间片段的正确性。

【技术特征摘要】
【国外来华专利技术】2011.07.25 US 61/511,2751.一种用于变换声学信号的系统，包括:声学变换引擎，其用于根据一个或多个变换规则对所述声学信号施加一个或多个变换，所述一个或多个变换规则被配置为确定所述声学信号的一个或多个时间片段中的各时间片段的正确性。2.根据权利要求1所述的系统，其中所述声学变换引擎用于对被确定为不正确的片段进行变形或变换。3.根据权利要求1所述的系统，其中所述声学变换引擎用于将被确定为不正确的片段替换为样本声音。4.根据权利要求1所述的系统，其中所述声学变换引擎用于删除被确定为不正确的片段。5.根据权利要求1所述的系统，其中所述声学变换引擎用于在被确定为不正确地相邻的两个片段之间插入样本声音或合成声音。6.根据权利要求1所述的系统，其中所述变换包括滤波、拼接、时间变换和频率变换中的一个或多个。7.根据权利要求1所述的系统，其中所述变换规则与不当声学信号的实验发现相关。8.根据权利要求1所述的系统，其中所述变换规则应用所述声学信号的自动或半自动的注释以识别所述片段。9.根据权利要求 1所述的系统，其中施加所述变换包括从声学样本数据库获取基准信号或基准参数。10.根据权利要求1所述的系统，其中所述声学变换引擎并...

【专利技术属性】
技术研发人员：弗兰克·鲁德奇兹，格雷姆·约翰·赫斯特，帕斯卡尔·胡贝特·亨利·玛丽·范利斯豪特，杰拉尔德·布拉德利·佩恩，格雷厄姆·弗雷泽·沙因，
申请(专利权)人：索拉公司，
类型：发明
国别省市：加拿大;CA

全部详细技术资料下载我是这个专利的主人