用于文本至语音递送的设备及用于文本至语音递送的方法技术

技术编号:5516264 阅读:204 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述一种用于确定具处理器能力的装置应从数据中产生声音的方式的方法及设备。所述装置理想地包括:用于以数字方式合成声音且重现预先记录的声音的构件,以及用于所述声音的可听递送的构件;存储器,其中存储有多个数据的数据库及一个或一个以上预先记录的声音,所述多个数据中的至少一些数据是呈基于文本的指示符形式;数据传送构件,数据通过所述数据传送构件在所述装置的所述处理器与所述存储器之间传送;及操作系统软件,其控制处理器与存储器之间的数据处理及流动以及所述声音是否以可听方式重现。根据本发明专利技术,所述装置进一步能够反复确定一个或一个以上物理条件(例如,当前GPS位置),所述物理条件与存储器中提供的一个或一个以上参考值进行比较,以使得所述比较的肯定结果引起需要由所述装置产生声音的事件。实质上,一旦所述装置确定必须以可听方式识别事件,所述方法包含以下步骤:a)向用户提供对需要以可听方式递送的声音类型的选择,且依据所述用户选择,或者b)使得TTS软件组件能够与所述操作系统或其上执行的程序交互,以便针对至少一个事件,从自所述数据库检索的一个或一个以上基于文本的指示符中以数字方式合成声音,或c)针对所述至少一个事件重现存储于所述装置上的一个或一个以上预先记录的声音,或b)与c)的组合。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术关乎到一种用于文本至语音(TTS)递送的设备及方法。
技术介绍
TTS软件众所周知。通常,TTS引擎能够解码或解释简单的源自文本或字处理器 的文档(例如,".txt"、 ".doc"等等)并将实质上是所述本文的二进制表示的内容转换成呈 到达声音处理器的指令形式的替代二进制表示,所述声音处理器最终将适当的电信号 递送至常规扬声器。对原始文本文档的解释(不管其是否因其仅含有短的短语或名称 而离散,或其是否更庞大且含有一个或一个以上本文段落)通常可涉及粒度层级的分 析(例如,辅音、元音及音节),且还可包含语法及标点符号分析以使得借助正确词 形变化及语调所产生的所得合成语音且因此声音尽可能的逼真。一般而言,存在两种使用电子硬件及软件合成语音的方法。在并置合成中,通过 并置存储于数据库中的预先记录的语音片来形成所合成的语音。系统在所存储的语音 单位的大小上不同;仅存储较小单音或双音的系统将提供最大输出范围,但可能缺乏 清晰度,然而存储整个字或句子允许高质量输出。另一选择为,在共振峰合成中,合 成器并入声道模型及其它人类话音特性来形成完全"合成的"话音输出。参数(例如, 基频、发声及噪声级)随时间变化以形成人工语音的波形。所述方法有时称为基于规 则的合成;然而,许多并置系统中也具有基于规则的组件。语音合成的一种最普通用法从其一开始一直是允许盲人或弱视人群理解书面语。 新近,过多现代装置(实际上,具有相对适度的处理能力及存储器的任一装置(例如, 个人数字助理(PDA))、更高级的移动电话(例如,所谓的智能电话)、游戏控制台 及车内卫星导航系统(SNS)允许某一设施播放预先记录的人类话音片段或执行TTS软 件以解释即时存储于所述装置上的任一经文本或字处理的文档。本专利技术特别适用于车内SNS装置,且虽然以下描述几乎排他地针对车内SNS装 置,但有技能的读者将容易了解,本专利技术的应用可具有更宽广的范围,且不应被认为 受具体描述的限制。车内SNS装置在约先前5年中己变得普遍,且大多数装置包含针对特定国家的一 个或一个以上地图数据库及可能以多种不同的话音(例如,男性、女性)且以不同音 调或以不同庄严或欢乐程度存储许多预先记录的短语的能力两者。此外,许多装置还 准许用户按其自己的话音记录所述短语记录,且在所述装置的操作软件中可存在简单5例程来教示所述用户连续地记录为所述装置的正确操作所需的每个短语。例如,可要 求用户记录多种不同短语或口语片段(例如"向左转"、"向右转"、"400米后" 等等),且一旦所述记录完成,所述装置的操作软件即保证在适当时间选择所述用户 的话音片段以用于重放,如与默认或先前选择的预先记录的片段相反。虽然基础较简 单,但所述技术已用于移动电话方面一段时间,其中用户可记录其自己的话音且在特 定人或实际上任一人向行动电话发出呼叫时用所述记录替代所述装置的默认铃声。以上预先记录的系统通常不只是适用于大多数路线导航操作,但因其不提供用于 对非标准或国家特有信息的可听识别的设施而受限。因此,本专利技术的目标是克服所述缺点,且尤其为车内SNS提供更全面的音频解决方案。
技术实现思路
根据本专利技术,提供一种用于从数据产生声音的具处理器能力的装置,所述装置具有用于以数字方式处理声音的构件及用于所述声音的可听递送的构件存储器,其中存储有多个数据的数据库及一个或一个以上预先记录的声音,所述多个数据中的至少一些数据是呈以基于文本的指示符形式,数据传送构件,所述数据通过所述数据传送构件在所述装置的所述处理器与所述 存储器之间传送,及操作系统软件,其控制处理器与存储器之间的数据处理及流动以及所述声音是否 以可听方式重现所述装置进一步能够反复确定一个或一个以上物理条件,所述物理条件与存储器 中提供的一个或一个以上参考值进行比较,以使得所述比较的肯定结果引起需要由所 述装置产生声音的事件,其特征在于所述装置进一步包含与所述操作系统或其上执行的程序交互的TTS软件组件,所 述操作系统或程序根据用户输入做出是否应借助以下各项以可听方式识别所述事件的 确定存储于所述装置上的一个或一个以上预先记录的声音,由所述TTS组件从自所述数据库检索且适于所述事件的基于文本的指示符以数 字方式再现的声音,或 以上各项的组合。在优选实施例中,所述操作系统或其上执行的程序具有进一步更特定的用户输入 以准许选择将以可听方式向所述用户识别的事件类型。特定地说,所述操作系统或其 上执行的程序优选地呈现一组不同事件类型的选项,所述选项可依据用户偏好选择或取消选择。最优选地,所述装置具有包含时间信号检索构件的全球定位系统(GPS)构件,所述装置因此能够确定其物理全球位置、速度及加速度(通过随时间执行对计算求平均),且理想地以可听方式向用户识别的所述事件是所述装置(且因此携载所述装置或在其中安装所述装置的交通工具中移动的用户)沿预定或经预先编程的路线移动时的方向指令。最优选地,所述数据表示干道网络的一个或一个以上地图,例如,特定国家或区域的道路网络。优选地,所述数据具有得自所述地图的在旅行期间所述用户可希望或可不希望以可听方式被告知的多种不同的额外数据,例如,街道名称、道路号码、建筑物号码、关注点(POI)、路标。在街道名称的情况中,所述街道名称可仅借助于TTS组件以可听方式向用户识别。在优选实施例中,所述装置进一步具有用于确定周围环境条件(例如,温度及压力(关于哪个可存在于GPS信号中的信息)的构件,且另外,所述装置可具有二级无线电电信构件,所述二级无线电电信构件允许所述装置确定沿着由所述数据表示的干道网络的特定区段的交通条件且通过先存在的网络(例如,移动电信网络或无线电网络)接收消息及其它信息。在所要实施例中,本专利技术还准许用户做出经由所述网络检索的警告(例如,传入SMS或例如天气或交通信息等其它消息)是否可听的选择。在再进一步优选实施例中,所述装置还准许用户选择是否以可听方式识别基于装置的操作事件,例如,装置操作提示及装置指南指令文本。最优选地,所述装置包含用户接口构件,优选为图形用户接口构件,且所述操作系统或其上执行的程序导致显示一个或一个以上选项选择页面,所述装置可借助于所述选项选择页面被告知是否借助于所述TTS组件针对需要以可听方式通知用户的一个或一个以上不同事件类型以数字方式再现声音,是否调用一个或一个以上预先记录的声音来通知所述事件,或是否需要这些操作实施例的组合。在本专利技术的第二方面中,提供一种确定具处理器能力的装置应从数据中产生声音的方式的方法,所述装置具有用于以数字方式合成声音且重现预先记录的声音的构件,以及用于所述声音的可听递送的构件存储器,其中存储有多个数据的数据库及一个或一个以上预先记录的声音,所述多个数据中的至少一些数据呈基于文本的指示符形式,数据传送构件,所述数据通过所述数据传送构件在所述装置的所述处理器与所述存储器之间传送,及操作系统软件,其控制处理器与存储器之间的数据处理及流动以及是否以可听方式重现所述声音7所述装置所述装置进一步能够反复确定一个或一个以上物理条件,所述物理条件与存储器中提供的一个或一个以上参考值进行比较,以使得所述比较的肯定结果引起需要由所述装置产生声音的事件,其特征在于所述方法包括以下步骤向用户提供需要以可本文档来自技高网
...

【技术保护点】
一种用于从数据中产生声音的具处理器能力的装置,所述装置具有:    用于以数字方式处理声音的构件及用于所述声音的可听递送的构件    存储器,其中存储有多个数据的数据库及一个或一个以上预先记录的声音,所述多个数据中的至少一些数据呈基于文本的指示符形式,    数据传送构件,所述数据通过所述数据传送构件在所述装置的所述处理器与所述存储器之间传送,及    操作系统软件,其控制处理器与存储器之间的数据处理及流动以及所述声音是否以可听方式重现    所述装置进一步能够反复确定一个或一个以上物理条件,所述物理条件与存储器中提供的一个或一个以上参考值进行比较,以使得满足所述条件引起需要由所述装置产生声音的事件,    其特征在于    所述装置进一步包含与所述操作系统或其上执行的程序交互的TTS软件组件,所述操作系统或程序根据用户输入做出是否应借助以下各项以可听方式识别所述事件的确定    存储于所述装置上的一个或一个以上预先记录的声音,    由所述TTS组件从自所述数据库检索且适合于所述事件的基于文本的指示符中以数字方式再现的声音,或    以上各项的组合。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:罗里琼斯斯文尤尔根斯
申请(专利权)人:通腾科技股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利