用于车辆的交互式音频娱乐系统技术方案

技术编号:39502522 阅读:8 留言:0更新日期:2023-11-24 11:33
一种用于与音频流交互以获得歌词信息

【技术实现步骤摘要】
【国外来华专利技术】用于车辆的交互式音频娱乐系统
[0001]相关申请的交叉引用
[0002]本申请要求
2021
年2月
18
日提交的美国临时申请序列号
63/151005
的权益,其公开内容通过引用全文结合于此



[0003]本公开的各方面总体涉及用于车辆的交互式音频娱乐应用


技术介绍

[0004]本专利技术涉及应用,尤其涉及娱乐应用,其中车辆的处理系统是主动参与者

乘客通常不愿意乘坐汽车进行长途旅行

虽然有些不情愿是因为旅行的风险和长时间坐着的身体不适,但一个重要的原因是预见到的无聊

[0005]乘客已经使用了各种方式来缓解长时间旅行或一般旅行的厌倦

阅读书籍以及近来更多的看电影都被证明是缓解无聊的方法

另一种方法是玩游戏,诸如卡拉
OK。
[0006]基于音频的娱乐长期以来一直是娱乐汽车司机及其乘客的一种形式

司机听歌,有时跟着唱

当司机不知道某一首歌的歌词时,他们会感到沮丧

虽然乘客可以查找歌词并跟着唱,但是司机这样做不安全

[0007]此外,基于车辆的音频游戏和娱乐通常要求所有玩家都可以访问歌词,并能够控制音频的回放和浏览音频

一种这样的游戏即卡拉
OK
不仅需要听到歌词的能力,还需要随音频播放具有或没有歌词的能力


技术实现思路

[0008]本文描述了用于与音频流交互的系统和方法,其中该系统包括以第一回放模式播放音频流的音频回放模块

辨别模块从车辆的头部单元接收包括请求与音频流相关的歌词信息的至少一个命令的一个或多个话语

音频回放模块通过识别歌词信息来响应话语中的命令

系统内的娱乐界面从音频回放模块接收歌词信息,并将歌词信息输出给终端用户

[0009]音频播放模块通过车辆的扬声器播放音频流

[0010]音频回放模块识别音频流的时限部分,并搜索或识别该时限部分内的歌词信息

时限部分的特征在于开始时间和停止时间

在一些情况下,音频回放模块通过辨别在时限部分期间音频流内发出的语音来识别歌词信息

在其他情况下,音频回放模块通过找到对应于音频流的时限部分的歌词来识别歌词信息

[0011]该系统可以包括从歌词信息生成合成语音的文本到语音模块

娱乐界面可以获得合成语音,并将其输出给终端用户,以可听见地将歌词信息传递给终端用户

[0012]本文描述了用于与音频流交互的系统和方法,其中该系统包括以第一回放模式播放音频流的音频回放模块和辨别模块

辨别模块从车辆的头部单元接收包括以第二回放模式播放音频流的命令的一个或多个话语

第一回放模式可以包括播放音频流的乐器音轨和主唱音轨,第二回放模式可以包括仅播放音频流的乐器音轨

[0013]本文描述了一种用于交互式音频娱乐的系统,该系统可以包括:至少一个扬声器,其配置成以一种或多种模式将音频流回放到环境中;至少一个麦克风,其配置成接收指示环境中的声音的麦克风信号;以及处理器,其被编程为:指示扬声器以第一回放模式回放音频流,从至少一个麦克风接收第一麦克风信号,第一麦克风信号包括包含以第二回放模式回放音频流的命令的用户话语,指示扬声器以第二回放模式回放音频流

[0014]第一回放模式可以包括播放包括乐器和主唱音轨的音频流

第二回放模式可以包括播放包括乐器音轨的音频流

[0015]该处理器还可被编程为接收包含请求与音频流相关的歌词信息并指示向用户输出歌词信息的命令的至少一个其他话语

指示扬声器输出歌词信息和
/
或识别音频流的时限部分并识别音频流的时限部分内的歌词信息

[0016]音频流的时限部分具有开始时间和停止时间,其中识别音频流的时限部分内的歌词信息包括辨别在开始时间和停止时间之间发出的语音,和
/
或其中识别音频流的时限部分内的歌词信息包括在数据库中搜索在音频流的时限部分的开始时间和停止时间之间的时间点发出的歌词信息

附图说明
[0017]图1示出了具有与各种外围设备通信的汽车处理单元的车辆

[0018]图2示出了图1的汽车处理单元中的头部单元的部件

[0019]图3示出了图1所示的汽车处理单元中的头部单元的架构,其独立于到远程服务器的任何连接
(
例如经由云
)
而运行

[0020]图4示出了图1中示出的汽车处理单元中的头部单元的替代实施例的架构,与图3中示出的实施例不同,其独立于到远程服务器的任何连接
(
例如经由云
)
而运行,不独立于任何远程服务器而运行,并且事实上在其操作期间例如经由云维持到远程服务器的连接

具体实施方式
[0021]本文公开了一种音频处理系统,其允许用户参与车辆内的语音控制,这允许基于对话的体验

在一示例中,车辆的乘客可以导航歌曲库

控制音频流
(
即开始

停止

倒带和快进流
)、
发出话语和其他上下文信息来指示其意图和命令

接收如何向用户使用该应用的基于对话的教程,等其他特征和功能

具体地,乘客可能够请求和接收音频流的特定片段的歌词

[0022]此外,在回放所请求的音频流期间,音频处理系统可以继续提供语音辨别

自然语言理解

文本到语音

唤醒词
(WuW)
检测

娱乐界面

智能助理和交互式娱乐应用

因此,即使是音频流,也可以处理和执行额外的请求

意图和命令

[0023]例如,乘客可以说出“滚石乐在其中”。
车辆内的音频处理系统可以响应命令并回放适当的音频流

用户然后可以说出“获取歌词”。
音频处理系统然后可以实现各种过程和模块来获取音频流的歌曲的歌词

歌词可以通过由文本到语音引擎生成的合成语音来呈现,并由娱乐界面输出

[0024]乘客也可以选择欣赏音频流的模式

第一回放模式可以包括播放包括乐器和主唱音轨的音频流,第二回放模式可以包括播放仅具有乐器音轨的音本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种用于与音频流交互的系统,所述系统包括:音频回放模块,其以第一回放模式播放音频流;辨别模块,其从车辆的头部单元接收一个或多个话语,所述一个或多个话语包括请求与所述音频流相关联的歌词信息的至少一个命令,其中所述音频回放模块识别所述歌词信息;以及娱乐界面,其从所述音频回放模块接收所述歌词信息,并将所述歌词信息输出给终端用户
。2.
根据权利要求1所述的系统,其中,所述音频回放模块通过所述车辆的扬声器播放所述音频流
。3.
根据权利要求1所述的系统,其中,所述音频回放模块通过识别所述音频流的时限部分以及识别所述音频流的所述时限部分内的歌词信息来识别所述歌词信息
。4.
根据权利要求3所述的系统,其中,所述音频流的所述时限部分具有开始时间和停止时间
。5.
根据权利要求4所述的系统,其中,识别所述音频流的所述时限部分内的所述歌词信息包括辨别在所述开始时间和所述停止时间之间发出的语音
。6.
根据权利要求4所述的系统,其中,识别所述音频流的所述时限部分内的所述歌词信息包括在数据库中搜索在所述音频流的所述时限部分的所述开始时间和所述停止时间之间的时间点发出的所述歌词信息
。7.
根据权利要求1所述的系统,其中,所述系统还包括文本到语音模块,所述文本到语音模块从所述歌词信息生成合成语音
。8.
根据权利要求7所述的系统,其中,所述娱乐界面通过播放由所述文本到语音模块生成的所述合成语音来输出所述歌词信息
。9.
一种用于与音频流交互的系统,该系统包括:音频回放模块,其以第一回放模式播放音频流;以及辨别模块,其从车辆的头部单元接收一个或多个话语,所述一个或多个话语包括请求所述音频回放模块以第二回放模式播放所述音频流的至少一个命令,其中,所述音频回放模块响应性地以所述第二回放模式播放所述音频流
。10.
根据权利要求9所述的系统,其中,所述第一回放模式包括播放所述音频流的乐器音轨和主唱音轨
。11.
根据权利要求9所述的系统,其中,所述第二回放模式包括播放所述音频流的乐器音轨,但不播放主唱音轨

【专利技术属性】
技术研发人员:Y
申请(专利权)人:塞伦妮经营公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1