当前位置: 首页 > 专利查询>索拉公司专利>正文

用于声学变换的系统和方法技术方案

技术编号:10488935 阅读:100 留言:0更新日期:2014-10-03 17:17
本发明专利技术公开了声学变换的系统和方法。一个具体的实施例是:变换由具有语音障碍的说话者产生的声学言语信号以使得他们的话语更易于普通听众理解。这些改变包括:语速或节奏的修正、响音中的共振峰频率的调整、异常发声的去除或调整、音素插入错误的删除、以及错误丢弃音素的替换。这些方法还可以被应用于音乐序列或声学序列的一般修正。

【技术实现步骤摘要】
【国外来华专利技术】交叉引用本申请要求于2011年7月25日提交的美国专利申请第61/511,275号的优先权,其全部内容通过引用合并于此。
本专利技术一般涉及声学变换,更具体地,本专利技术涉及用于改善说话者或声音的可理解性的声学变换。
技术介绍
目前存在一些声音被不准确地产生的例子,结果是所听到的声音不是想要的声音。具有构音障碍的说话者通常不准确地发出言语声。 构音障碍是损害物理产生语音的一组神经运动失调。这些损害降低了对主要发声器官的正常控制,但是不影响对有意义的、语法正确的语言的常规理解或产生。例如,对喉返神经的损伤降低了对声壁振动(即,发声)的控制,这会引起异常地发声。由迷走神经的损伤引起的对软腭移动的控制不足可能导致在说话期间不成比例的空气量通过鼻子被释放(gp,鼻音重)。还已观察到的是,发音控制的不足还导致各种不自主的非言语声,包括腭咽或声门杂音。更普遍地,已表明的是,舌头和嘴唇灵活性的不足常常产生严重的口齿不清以及更加啰嗦以及更不可区分的元音目标空间。 导致构音障碍的神经损伤通常也影响其它的身体活动,这会对运动性或者计算机交互产生极大的不良影响。例如,已经表明的是,在键盘交互中,严重的构音障碍的说话者比普通的用户慢150至300倍。然而,因为构音障碍性言语被观察到通常仅比普通说话者的语音慢10至17倍,所以言语被认定是用于计算机辅助互动的一种可行的输入模式。 例如,必须使用公共交通前往城市的构音障碍的个人可能要购买车票、问路、或者向同行的乘客表明意图,所有这些都发生在嘈杂和拥挤的环境中。因此,一些提出的方案已涉及个人便携式通信装置(手持式的或连接到轮椅上的),该通信装置在通过一组扬声器进行播放之前对讲入麦克风的相对难以理解的语音进行变换以使其更易于理解。这些提出的装置中的一些导致说话者包括个人做作的或者自然的表达的任意个人方面的损失,这是由于这些装置输出的是机器人的发声语音。使用韵律来表达诸如个人的情绪状态之类的个人信息通常不被这类系统支持,尽管如此,使用韵律仍被认为对一般的交际能力来说是很重要的。 此外,自然语言处理软件的使用日益增长,特别是在面向消费者的应用。随着对这类软件的使用和依赖的增加,对于受言语状况折磨的人的限制变得更加显著。 本专利技术的目标是克服或消除上述缺点中的至少一个。
技术实现思路
本专利技术提供了。 在一方面,提供了一种用于变换声学信号的系统,该系统包括声学变换引擎,其用于根据一个或多个变换规则将一个或多个变换施加至所述声学信号,所述一个或多个变换规则被配置为确定所述声学信号的一个或多个时间片段中的各时间片段的正确性。 在另一方面,提供了一种用于变换声学信号的方法,该方法包括:(a)配置一个或多个变换规则以确定所述声学信号的一个或多个时间片段中的各时间片段的正确性;(b)由声学变换引擎根据所述一个或多个变换规则将一个或多个变换施加至所述声学信号。 【附图说明】 在以下结合附图所给出的详细说明中,本专利技术的特征将变得更加明显,其中: 图1是提供有声学变换引擎的系统的示例的框图; 图2是示出了声学变换方法的示例的流程图; 图3是获取的构音障碍的说话者和对照说话者的声学信号的图形化表示;和 图4是示出获取的声学信号(a)和相应的变换后的信号(b)的声谱图。 【具体实施方式】 本专利技术提供了声学变换的系统和方法。本专利技术包括声学变换引擎,其用于通过根据一个或多个变换规则对声学信号施加一个或多个变换来变换该声学信号。所述变换规则被配置为使所述声学变换引擎能够确定所述声学信号的一个或多个时间片段中的各时间片段的正确性。 确定为不正确的片段可以被变形、变换、替换或删除。可以将一个片段插入到具有确定为不正确地相邻的片段的声学信号中。不正确可定义为感知与期望的不同。 参考图1,示出了提供有声学变换引擎(2)的系统。声学变换引擎(2)包括输入装置(4)、滤波工具(8)、拼接工具(10)、时间变换工具(12)、频率变换工具(14)和输出装置 (16)。该声学变换引擎进一步包括声学规则引擎(18)和声学样本数据库(20)。该声学变换引擎可进一步包括降噪工具(6)、声学样本合成器(22)和合并工具(46)。 输入装置可操作用于获取将要进行变换的声学信号。该输入装置可以是麦克风 (24)或其它声音源(26),或者可以是与麦克风(28)或其它声音源(30)以可通信方式链接的输入装置。例如,声音源可以是存储在存储器中的声音文件或者是发声装置的输出。 例如,降噪工具可以通过应用诸如谱减法之类的降噪算法对声学信号施加降噪。之后,滤波工具、拼接工具、时间变换工具和频率变换工具对该声学信号施加变换。之后变换后的信号可以通过输出装置输出。该输出装置可以是扬声器(32)或配置为存储变换后的信号的存储器(34),或者可以是与扬声器(36)、配置为存储变换后的信号的存储器(38)或将变换后的信号作为输入接收的另一装置(40)以可通信方式链接的输出装置。 声学变换引擎可以通过计算机化装置实现,这些装置例如为桌面型计算机、膝上型计算机、平板电脑、移动装置或具有存储器(42)和一个或多个计算机处理器(44)的其它装置。存储器具有已存储于其上的计算机指令,当这些指令被一个或多个处理器执行时,其提供了在本文中描述的功能。 声学变换引擎可包括在声学变换装置。声学变换装置可以是,例如手持式计算机化装置,其包括:作为输入装置的麦克风、作为输出装置的扬声器、以及一个或多个处理器、控制器和/或实现滤波工具、拼接工具、时间变换工具以及频率变换工具的电路。 这种声学变换装置的一个特定的示例是可嵌入到轮椅中的移动装置。这种声学变换装置的另一个示例是可植入式或可佩戴式的装置(优选的是基于芯片或其他的小型化)。这种声学变换装置的又一个示例是可由声学信号的收听者佩戴的头戴式耳机。 声学变换引擎可以应用于任何由声学信号表不的声音以变换、标准化或调整该声音。在一个示例中,声音可以是个人的言语。例如,声学变换引擎可以应用于具有语音障碍的个人的言语以纠正他们的发音、语速和语调。 在另一个示例中,声音可能来自乐器。在该示例中,声音变换引擎可操作用于纠正未调谐的乐器的音高或者修改不正确的音符与和弦,此外其还可以分别插入漏掉的声音或者去除意外的声音,并且及时校正那些声音的长度。 在又一个不例中,声音可以是被合成为类似自然声音的预先录制的声音。例如,车载计算机可以被编程以输出类似引擎声音的特殊声音。适时地,输出的声音会受外部因素影响。声学变换引擎可以应用于纠正车载计算机的输出声音。 声学变换引擎还可以应用于特定人声的合成模仿。例如,通过改变配音演员的语音特征以更类似另一个人,能够使前者听起来更像后者。 尽管存在大量的针对声学变换引擎的应用的其它示例,但为了简化起见,本公开描述言语的变换。本公开更具体地描述构音障碍性言语的变换。应当理解,可以使用基本上类似于本文所描述的技术来提供其它语音和其它声音的变换。 声学变换引擎可以保留个人言语的自然韵律(包括音高和强音),以保留诸如情绪之类的词汇外(extra-lexical)信息。 声学样本数据库可以填入由声学样本合成器产生的一组合成样本声音。声学样本本文档来自技高网
...

【技术保护点】
一种用于变换声学信号的系统,包括:声学变换引擎,其用于根据一个或多个变换规则对所述声学信号施加一个或多个变换,所述一个或多个变换规则被配置为确定所述声学信号的一个或多个时间片段中的各时间片段的正确性。

【技术特征摘要】
【国外来华专利技术】2011.07.25 US 61/511,2751.一种用于变换声学信号的系统,包括:声学变换引擎,其用于根据一个或多个变换规则对所述声学信号施加一个或多个变换,所述一个或多个变换规则被配置为确定所述声学信号的一个或多个时间片段中的各时间片段的正确性。2.根据权利要求1所述的系统,其中所述声学变换引擎用于对被确定为不正确的片段进行变形或变换。3.根据权利要求1所述的系统,其中所述声学变换引擎用于将被确定为不正确的片段替换为样本声音。4.根据权利要求1所述的系统,其中所述声学变换引擎用于删除被确定为不正确的片段。5.根据权利要求1所述的系统,其中所述声学变换引擎用于在被确定为不正确地相邻的两个片段之间插入样本声音或合成声音。6.根据权利要求1所述的系统,其中所述变换包括滤波、拼接、时间变换和频率变换中的一个或多个。7.根据权利要求1所述的系统,其中所述变换规则与不当声学信号的实验发现相关。8.根据权利要求1所述的系统,其中所述变换规则应用所述声学信号的自动或半自动的注释以识别所述片段。9.根据权利要求 1所述的系统,其中施加所述变换包括从声学样本数据库获取基准信号或基准参数。10.根据权利要求1所述的系统,其中所述声学变换引擎并...

【专利技术属性】
技术研发人员:弗兰克·鲁德奇兹格雷姆·约翰·赫斯特帕斯卡尔·胡贝特·亨利·玛丽·范利斯豪特杰拉尔德·布拉德利·佩恩格雷厄姆·弗雷泽·沙因
申请(专利权)人:索拉公司
类型:发明
国别省市:加拿大;CA

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1