通过媒体内容的语音搜索元数据制造技术

技术编号:34813012 阅读:22 留言:0更新日期:2022-09-03 20:22
本发明专利技术涉及通过媒体内容的语音搜索元数据,提供了基于元数据或副标题用于语音搜索媒体内容的系统和方法。能够在媒体服务器处预处理与媒体内容关联的元数据。在接收表示搜索媒体内容方面的语音命令后,媒体服务器执行与正被搜索的媒体内容方面相关的媒体内容的一个或更多个部分的搜索。媒体通过使正被搜索的媒体内容方面与预处理元数据匹配来执行搜索。体内容方面与预处理元数据匹配来执行搜索。

【技术实现步骤摘要】
通过媒体内容的语音搜索元数据
[0001]本申请是于2015年9月30日提交的题为“通过媒体内容的语音搜索元数据”的中国专利申请2015106400318的分案申请。
[0002]相关申请的交叉引用
[0003]本申请要求提交于2014年10月3日的美国临时专利申请No.62/059,703的利益,其通过引用全部并入本文。


[0004]本公开一般涉及媒体内容回放和交互。

技术介绍

[0005]经由数字化视频光盘(DVD)或录像机(VCR)与媒体内容交互的传统方法一般依赖于致动回放按钮或控件。例如,用户可快进或倒放媒体内容的部分,例如,电影的场景,以实现用户希望查看或体验的特定部分的媒体内容的回放。诸如智能手机、膝上型个人计算机(PC)等等的设备上的媒体交互在被流传送到或下载到设备的媒体内容的回放期间模仿该类控制。

技术实现思路

[0006]根据一个实施例,一种计算机实施的方法包括经由用户设备从用户接收语音输入。计算机实施的方法进一步包括基于语音用户输入搜索媒体内容的至少一部分。此外,计算机实施的方法包括经由用户设备提供对媒体内容的至少一部分的访问。
[0007]根据另一个实施例,一种装置包括内容数据库,其包含一个或更多个媒体内容文件。装置进一步包括声音识别单元,其经配置识别表示搜索一个或更多个媒体内容文件的至少一部分的语音命令。此外,装置包括搜索引擎,其经配置基于识别的语音命令搜索一个或更多个媒体内容文件的至少一部分。
[0008]根据另一个实施例,一种设备包括处理器,以及包括计算机程序代码的存储器。存储器和所述计算机程序代码经配置利用处理器使设备执行至少以下内容:显示用户界面,其适于接收请求搜索媒体内容的一个或更多个部分的语音输入;将语音输入传送到媒体内容服务器,其经配置执行搜索媒体内容的一个或更多个部分;以及从媒体内容服务器接收搜索结果,以用于呈现在设备上,其中搜索结果以与语音输入的相关性水平相当的方式呈现。
附图说明
[0009]根据一个或更多个不同实施例,参考以下附图详细描述了本公开。附图被提供用于仅说明的目的,并且仅仅示出典型或示例实施例。
[0010]图1示出其中可实施各种实施例的示例环境。
[0011]图2为根据各种实施例示出用于通过视频文件进行语音搜索的示例过程的操作流
程图。
[0012]图3根据各种实施例示出用于执行语音搜索的示例用户界面。
[0013]图4A根据实施例示出用于执行语音搜索并显示搜索结果的示例简单用户界面。
[0014]图4B根据另一个实施例示出用于执行语音搜索并显示搜索结果的示例高级用户界面。
[0015]图5根据一个实施例示出用于呈现搜索结果的示例用户界面。
[0016]图6为可用于实施本公开中描述的实施例的各种特征的示例计算模块。
[0017]附图不是详尽的并且不将本公开局限于所公开的精确形式。
具体实施方式
[0018]如先前所描述,与媒体交互的传统方法可包括用户快进或倒放媒体内容,以实现特定部分的媒体内容的回放。在DVD的情况下,希望查看电影中的特定场景的用户通常在回放期间快进和倒放电影,直到达到所需的场景。可替代地,用户可跳到电影的特定“章节”。然而,通过传统交互方法能够实现的间隔尺寸(granularity)水平通常为粗略或不精确的。
[0019]使用具有小显示器(相对于传统TV或监视器)的智能手机或平板PC能够通常使传统媒体交互的不精确性质恶化。这是因为该类设备上的回放控件或机制也是相当小的。
[0020]此外,搜索媒体内容的传统方法依赖于仅文本搜索,并且通常仅检索完整版本的媒体内容,或者在基于诸如副标题信息的仅文本元数据的电影媒体背景下检索具体




[0021]因此,本公开中描述的各种实施例提供系统和方法,其允许用户使用语音命令或输入来搜索用户所感兴趣的媒体内容(例如,一个或更多个电影)的一个或更多个部分(例如,一个或更多个场景)。本公开背景下的媒体内容能够为任何类型的媒体内容,诸如电影、音乐、音频书籍等等。用户不局限于经由语音命令或输入在回放期间搜索单个媒体内容的特定部分。例如,用户可搜索一个或更多个内容存储库、数字图书馆或数据库中的内容。此外,并且基于由用户发出的特定语音命令,能够访问、生成和/或呈现截短版本的媒体,例如,拼接在一起的故事情节、相关场景等等。
[0022]图1为示出其中能够实施各种实施例的示例环境的图示。图1示出用于提供媒体内容的语音搜索的系统100。如图1中所示,系统100能够包括用户设备102。用户设备102可包括处理器104和存储器单元106,并且能够经配置接收呈现在显示器108上的数字媒体内容。用户设备102可进一步经配置访问在内容数据库或存储库(诸如电子程序向导、在线媒体存储等等)上存储的媒体内容列表。如先前所提到的,设备102可为平板PC、智能手机、膝上型PC等等。
[0023]系统100可进一步包括媒体服务器112,其可以由内容提供商操作,诸如电缆提供商(例如,)、数字媒体内容分发商,诸如或其他第三方分发商。媒体服务器112可包括其上能够存储数字媒体内容的内容数据库114。媒体服务器112还进一步包括搜索引擎116,以用于基于用户的语音命令或输入执行媒体内容的或媒体内容的部分的搜索。搜索引擎116可包括语音识别/声音到文本引擎(或其他转换引擎),以用于接收和分析用户的语音命令或输入或将用户的语音命令或输入转换为搜索引擎116能够理解和跟随的搜索指令。进一步地,系统100可包括第三方内容提供商120,其可包括和/或控制其自己的内容数据库122。在某些情况下,第三方内容提供商120可
从媒体服务器112提供内容(例如,通过访问内容数据库114以及将媒体传送到用户设备102)。应指出的是,系统100可包括更多或更少的媒体服务器、内容提供商和/或用户设备。
[0024]能够经由网络110完成媒体服务器112、第三方内容提供商120和/或用户设备102中的一个或更多个之间的通信。网络110可以是任何通信网络,诸如蜂窝式或数据网络、卫星网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、个人区域网(PAN)、一部分互联网、一部分公用交换电话网(PSTN),或它们的任何组合。因此,网络110可采用各种通信介质,诸如同轴电缆、光纤电缆系统、以太网、无线电波等等。
[0025]根据各种实施例,能够使用元数据完成搜索或搜遍媒体内容。也就是说,元数据能够1)包括在诸如生产者或编辑者等发起者的媒体内容中,2)在媒体内容文件(场景描述、时间、位置、字符)的制作或编辑期间,由计算机自动地生成,以及/或者3)由一个或更多个用户生成。在媒体内容的情况下,例如,元数据能够包括用户插入的关键字、标签、标题、注释等等。在播音室制作的媒体内容的情况下,元数据可包括帧信息、索引信息、到增强本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机实施的方法,包括:从用户设备接收语音输入;基于语音用户输入搜索媒体内容的至少一部分;以及经由所述用户设备提供对所述媒体内容的所述至少一部分的访问。2.根据权利要求1所述的计算机实施的方法,其中所述语音输入包括搜索命令,其包含表示所述媒体内容的所述至少一部分的至少一个方面的一个或更多个标记。3.根据权利要求2所述的计算机实施的方法,其中所述搜索所述媒体内容的所述至少一部分包括使所述一个或更多个标记和与所述媒体内容关联的一块或更多块元数据匹配。4.根据权利要求3所述的计算机实施的方法,其中通过所述媒体内容的至少一个发起者以及所述媒体内容的至少一个消费者生成所述一块或更多块元数据。5.根据权利要求1所述的计算机实施的方法,其中所述搜索所述媒体内容的所述至少一部分包括分层搜索。6.根据权利要求1所述的计算机实施的方法,其中所述媒体内容包括电影,并且其中所述媒体内容的所述至少一部分包括来自所述电影的...

【专利技术属性】
技术研发人员:J
申请(专利权)人:迪斯尼企业公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1