忽略流式媒体内容中的触发词制造技术

技术编号：22503356 阅读：21 留言：0更新日期：2019-11-09 02:58

本公开涉及忽略流式媒体内容中的触发词。本公开的各个方面涉及忽略缓冲媒体流的触发词。在播放媒体流之前，访问媒体内容的缓冲媒体流。识别缓冲媒体流的媒体内容中的一个或多个触发词。相对于缓冲媒体流的媒体内容的播放时间，为一个或多个识别的触发词中的每一个生成时间戳。指示语音命令设备在缓冲媒体流被播放时，根据一个或多个识别的触发词中的每一个的时间戳忽略缓冲媒体流的音频内容。

Ignore triggers in streaming media content

The present disclosure relates to ignoring triggers in streaming media content. Various aspects of the present disclosure relate to ignoring triggers for buffered media streams. Access the buffered media stream of media content before playing the media stream. Identify one or more triggers in the media content of the buffered media stream. Generates a timestamp for each of one or more recognized triggers, relative to the playback time of the media content buffering the media stream. Instructs the voice command device to ignore the audio content of the buffered media stream according to the time stamp of each of one or more recognized triggers when the buffered media stream is played.

全部详细技术资料下载

【技术实现步骤摘要】
忽略流式媒体内容中的触发词
本公开涉及语音命令设备，更具体地，涉及语音命令过滤。
技术介绍
语音命令设备(VCD)由人类语音命令控制。设备由人类语音命令控制，从而不需要利用诸如按钮、拨盘、开关、用户界面之类的手动控件来操作设备。这使用户可以在双手忙于其他任务时，或者在用户离设备不够近从而无法接触设备的情况下操作设备。VCD可以采取各种形式，包括诸如家用电器之类的专用设备、用于其他设备的控制器、或者用作个人助手。虚拟个人助手形式的VCD可以与诸如智能电话机之类的计算设备一体化。虚拟个人助手可包括用于响应于语音命令和输入而执行任务或服务的语音激活指令。VCD可以由呈一个或多个触发词形式的语音命令激活。VCD可以使用语音识别，被编程为只对注册的个人的语音或者一组注册的个人的语音作出响应。这可以防止非注册用户发出命令。其他类型的VCD未针对注册用户进行调整，从而允许任何用户以指定的命令词和指令的形式发出命令。
技术实现思路
本公开的实施例包括用于忽略缓冲媒体流中的触发词的方法、计算机程序产品和系统。可在播放媒体流之前访问媒体内容的缓冲媒体流。可以识别缓冲媒体流的媒体内容中的一个或多个触发词。可相对于缓冲媒体流的媒体内容的播放时间，为一个或多个识别的触发词中的每一个生成时间戳。可以指示语音命令设备在缓冲媒体流被播放时，根据所述一个或多个识别的触发词中的每一个的时间戳忽略缓冲媒体流的音频内容。上述
技术实现思路
并不意图说明本公开的各个例示实施例或每种实现。附图说明包含在本公开中的附图并入说明书中，并构成说明书的一部分。附图图解说明本公开的实施例，并且连同具体实施方式一起，用...

【技术保护点】
1.一种计算机实现的用于忽略流式媒体内容中的触发词的方法，所述方法包括：在播放媒体流之前，访问媒体内容的缓冲媒体流；识别缓冲媒体流的媒体内容中的一个或多个触发词；相对于缓冲媒体流的媒体内容的播放时间，为一个或多个识别的触发词中的每一个生成时间戳；和指示语音命令设备在缓冲媒体流被播放时，根据所述一个或多个识别的触发词中的每一个的时间戳忽略缓冲媒体流的音频内容。

【技术特征摘要】
2018.05.01 US 15/968,3491.一种计算机实现的用于忽略流式媒体内容中的触发词的方法，所述方法包括：在播放媒体流之前，访问媒体内容的缓冲媒体流；识别缓冲媒体流的媒体内容中的一个或多个触发词；相对于缓冲媒体流的媒体内容的播放时间，为一个或多个识别的触发词中的每一个生成时间戳；和指示语音命令设备在缓冲媒体流被播放时，根据所述一个或多个识别的触发词中的每一个的时间戳忽略缓冲媒体流的音频内容。2.按照权利要求1所述的方法，其中确定媒体流中的所述一个或多个触发词中的每一个的持续时间；和其中根据所述一个或多个触发词中的每一个的持续时间，忽略音频内容。3.按照权利要求1所述的方法，其中识别所述一个或多个触发词包括：把缓冲媒体流的音频内容从音频转换成文本；和比较缓冲媒体流的文本和已知触发词的文本。4.按照权利要求1所述的方法，其中识别所述一个或多个触发词包括：接收带有元数据的缓冲媒体流，所述元数据识别媒体流的音频内容中的语音命令触发词。5.按照权利要求1所述的方法，其中所述方法由媒体流式传输设备执行，并且还包括：在输出媒体流之前，接收并缓冲媒体流；和从语音命令设备访问语音命令触发词的细节，其中所述媒体流式传输设备指示语音命令设备在缓冲媒体流被播放时，根据一个或多个识别的触发词中的每一个的时间戳忽略缓冲媒体流的音频内容。6.按照权利要求5所述的方法，其中在播放媒体内容之前的预定时间完成所述指示。7.按照权利要求5所述的方法，其中在媒体内容正在播放时实时完成所述指示。8.按照权利要求1所述的方法，其中所述方法由语音命令设备执行。9.按照权利要求8所述的方法，其中指示语音命令设备忽略缓冲媒体流的音频内容还包括：通过利用安装在语音命令设备中的两个或更多个麦克风的到达时间差，确定正从中接收缓冲媒体流的音频内容的方向；把所述方向保存为媒体流式传输设备的方向；和在缓冲媒体流被播放时，根据一个或多个识别的触发词中的每一个的时间戳，忽略来自媒体流式传输设备的方向的缓冲媒体流的音频内容。10.按照权利要求8所述的方法，其中指示语音命令设备忽略缓冲媒体流的音频内容包括忽略所有接收的音频输入。11.一种用于忽略流式媒体内容中的触发词的系统，包括：处理器，和被配置成向所述处理器提供计算机程序指令以执行各个组件的功能的存储器；被配置成在播放媒体流之前访问媒体内容的缓冲媒体流的媒体流访问组件；被配置成识别缓冲媒体流中的一个或多个触发词的触发词识别组件；被配置成相对于缓冲媒体流的媒体内容的播放时间，为一个或多个识别的触发词中的每一...

【专利技术属性】
技术研发人员：E·李，J·杜宁，J·J·伍德，G·G·彻瑞拉，D·T·古宁顿，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人