利用语音识别访问和检索媒体文件的系统和方法技术方案

技术编号：3048442 阅读：270 留言：0更新日期：2012-04-11 18:40

一种用于播放媒体文件的嵌入式设备，可以基于用户的输入语音生成媒体文件播放列表。该嵌入式设备包括生成多个语音识别语法的索引器。根据本发明专利技术的一方面，索引器基于媒体文件的媒体文件头的内容生成语音识别语法。根据本发明专利技术的另一方面，索引器基于用于从用户位置检索媒体文件的文件路径中的种类生成语音识别语法。当语音识别器在选择模式中从用户接收输入语音（４０４）时，媒体文件选择器将在选择模式中接收到的输入语音与多个语音识别语法进行比较（４１０），从而选择媒体文件（４１８）。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术主要涉及索引与检索的方法和系统，更具体地，涉及基于文件的文本描述利用语音识别来选择媒体文件。
技术介绍
诸如MP3播放器等用于播放媒体文件的嵌入式设备的显示和手动输入能力有限。例如，由于空间有限，显示空间因此不会很大，所以不能显示大量的信息。而且，由于空间有限，因此不能提供很多的功能键，所以完整的正文输入很困难和经常不可能有完整的正文输入。结果，查找、存储和检索MP3文件等任务的工作量就很大，并且经常使得用户执行起来很费劲。由于这些原因以及一些类似的原因，已经开发出使用语音识别来访问各种数据库的嵌入式设备。遗憾的是，语音识别应用于嵌入式设备并没有使得语音识别不再仅仅作为一个人机交互中的输入，其中人机交互的范例主要有按键、微调度盘和触摸屏等。因此，在先前的应用中，只是将输入语音作为同使用微调度盘或某项功能的工作方式相类似的另一个操纵菜单的命令。因此，对于嵌入式设备来说，仍然需要围绕着语音识别和语音设别技术来获取信息。本专利技术提供了这样的设备。
技术实现思路
根据本专利技术，播放媒体文件的嵌入式设备可以基于用户的输入语音生成媒体文件播放列表。该嵌入式设备包括用于产生多个语音识别语法的索引器(indexer)。根据本专利技术的一个方面，索引器基于媒体文件的媒体文件头内容生成语音识别语法。根据本专利技术的另一方面，索引器基于用于从用户位置(user location)检索媒体文件的文件路径中的种类生成语音识别语法。当语音识别器在选择模式中从用户接收输入语音时，媒体文件选择器将在选择模式中接收到的输入语音与多个语音识别语法进行比较，从而选择媒体文件。由于...

【技术保护点】
一种播放媒体文件并基于用户的输入语音生成媒体文件播放列表的嵌入式设备，包括：索引器，用于生成多个语音识别语法，包括至少下列中的一个：（ａ）第一索引器，基于媒体文件的媒体文件头的内容生成第一语音识别语法；和（ｂ）第二索引器，基于用于从用户位置检索媒体文件的文件路径中的种类生成第二语音识别语法；语音识别器，用于在选择模式中时从用户接收输入语音；和媒体文件选择器，用于将从选择模式接收到的输入语音与多个语音识别语法进行比较，从而选择媒体文件。

【技术特征摘要】
US 2002-9-16 10/245,7271.一种播放媒体文件并基于用户的输入语音生成媒体文件播放列表的嵌入式设备，包括索引器，用于生成多个语音识别语法，包括至少下列中的一个(a)第一索引器，基于媒体文件的媒体文件头的内容生成第一语音识别语法；和(b)第二索引器，基于用于从用户位置检索媒体文件的文件路径中的种类生成第二语音识别语法；语音识别器，用于在选择模式中时从用户接收输入语音；和媒体文件选择器，用于将从选择模式接收到的输入语音与多个语音识别语法进行比较，从而选择媒体文件。2.根据权利要求1所述的设备，其中所述用于生成多个语音识别语法的索引器包括基于媒体文件的媒体文件头的内容生成第一语音识别语法的第一索引器。3.根据权利要求2所述的设备，其中所述用于生成多个语音识别语法的索引器包括基于用于从用户位置检索媒体文件的文件路径中的种类生成第二语音识别语法的第二索引器。4.根据权利要求1所述的设备，其中所述用于生成多个语音识别语法的索引器包括基于用于从用户位置检索媒体文件的文件路径中的种类生成第二语音识别语法的第二索引器。5.根据权利要求1所述的设备，其中媒体文件包含语音，并且所述生成多个语音识别语法的索引器包括第三索引器，所述第三索引器识别媒体文件中的语音，并基于在媒体文件中所识别的语音生成第三语音识别语法。6.根据权利要求1所述的设备，其中所述语音识别器在非选择模式中从用户接收输入语音，其中所述索引器基于在非选择模式中接收到的输入语音生成分类，并且其中所述索引器包括第四索引器，所述第四索引器基于生成的分类生成第四语音识别语法。7.根据权利要求1所述的设备，其中所述的索引器包括第五索引器，所述第五索引器基于与媒体文件相关联的补充描述文本生成第五语音识别语法，所述补充描述文本由计算机网络的数据存储器提供。8.根据权利要求1所述的设备，包括数据链接，用于接收计算机网络上的媒体文件；和数据存储器，用于存储接收到的与多个语音识别语法相关联的媒体文件。9.根据权利要求1所述的设备，包括播放列表生成器，用于在插入模式中选择...

【专利技术属性】
技术研发人员：大卫克瑞兹，卢卡里加兹，帕特里克恩伽元，让克劳德容科，
申请(专利权)人：松下电器产业株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人