音频数据的处理制造技术

技术编号：12961651 阅读：87 留言：0更新日期：2016-03-03 04:05

描述了处理音频数据的示例。在某些示例中，抄本语言模型基于表示与音频数据相关联的抄本的文本数据。处理音频数据以至少确定针对该处理的文本输出中的语言元素的置信度值的集合，其中该处理使用抄本语言模型。置信度值的集合使得能够做出确定。该确定涉及基于所述置信度值的集合，文本数据是否与所述音频数据相关联。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】
技术介绍
全世界的广播媒体内容量日益增加。例如，越来越多的数字化广播变得可用于公用和私用方。这些广播包括电视和无线电节目、演讲和语音。在某些情况下，经常存在以隐藏字幕(closed-capt1n)准确标记这样的广播的需要。例如，为了满足可访问性需要，隐藏字幕文本需要伴随广播，例如与音频和/或视频内容同时显示。这在某些管辖范围中正成为法律要件。在研究和产品开发团队中，也期望将文本数据与相关联的音频数据对准，使得可以在信息检索和机器智能应用中使用这两种媒体。【附图说明】本专利技术的各种特征和优点根据以下结合附图所采取的【具体实施方式】将是明显的，所述【具体实施方式】和附图仅以示例的方式一起说明了本公开的特征，并且其中: 图1是根据示例的系统的示意图；图2A是示出了根据示例的音频数据的至少部分的示意图；图2B是示出了根据示例的文本数据的至少部分的示意图；图3是示出了根据示例的处理音频数据的方法的流程图；图4A是根据示例的用于对准音频和文本数据的系统的示意图；图4B是示出了根据示例的具有附加的定时信息的文本数据的至少部分的示意图；图4C是根据示例的用于对准音频和文本数据的系统的示意图；图5是示出了根据示例的音频处理的方法的流程图；图6是示出了根据示例的确定音频数据的至少部分的关联的方法的流程图；图7是示出了根据示例的用于处理音频数据的至少部分的系统的示意图；图8是示出了根据示例的确定音频数据的至少部分的关联的方法的流程图；以及图9是根据示例的计算设备的示意图。【具体实施方式】本文描述的某些示例涉及处理音频数据。...

【技术保护点】
一种用于处理音频数据的方法，其包括：基于表示与所述音频数据相关联的抄本的文本数据来生成抄本语言模型；利用抄本引擎处理所述音频数据以至少确定针对抄本引擎的文本输出中的多个语言元素的置信度值的集合，抄本引擎使用所述抄本语言模型；以及基于所述置信度值的集合来确定文本数据是否与所述音频数据相关联。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：M卡迪卡曼内森，D普耶，TB罗斯彻尔，
申请(专利权)人：朗桑有限公司，
类型：发明
国别省市：英国;GB

全部详细技术资料下载我是这个专利的主人