对应媒体内容部分的对齐制造技术

技术编号：11520200 阅读：105 留言：0更新日期：2015-05-29 11:36

本发明专利技术公开了一种内容对齐服务，其可以产生内容同步信息以促进音频内容和文本内容的同步呈现。在一些实施方案中，与所述音频内容的对应不确定的所述文本内容的区域可以被分析来确定文本内容的所述区域是否对应于所述音频内容中以声音呈现的一个或多个单词，或所述文本内容的所述区域是否对所述音频内容是错误匹配。在一些实施方案中，所述对应于所述音频内容中的单词的文本内容中的单词被同步呈现，而所述文本内容中的错误匹配单词可以被跳过来维持同步呈现。因此，在一个示例性应用程序中，有声书与电子书同步，使得随着所述电子书被显示，可以声音呈现所述有声书的对应单词。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】对应媒体内容部分的对齐
大体来讲，用户计算装置可以促进内容项(诸如有声书、电子书、歌曲、视频、电视节目、计算机和视频游戏、多媒体内容等等)的播放或显示。例如，电子书阅读器计算装置(“e-reader”)可以在屏幕上显示电子书和/或通过扬声器或耳机播放有声书。在一些实例中，用户可能对同时消费多个内容项感兴趣。例如，用户可能希望阅读电子书，同时收听相同标题的有声书，诸如TheAdventuresofTomSawyer。电子书和有声书(或更一般地，与相同内容标题有关的两个或更多个内容项的任何组)可以称作内容“伴随”项。然而，在许多目前的方法中，用户必须手动对齐两个内容伴随项使得有声书中叙说的单词对应于用户在电子书中阅读的单词。例如，用户可能发现在有声书中没有副本的电子书部分期间需要手动暂停有声书。同样地，用户可能发现在在电子书中没有副本的有声书部分期间需要手动快进有声书。这个方案可证实使用户失望且不方便用户使用。附图简述当在结合附图通过参考以下详述更好地理解前文方面和许多附属优点时，将更加轻易地明白前文方面和许多附属优点，其中：图1是描绘其中可以操作内容对齐服务的描...
对应媒体内容部分的对齐

【技术保护点】
一种系统，其包括：电子数据存储区，其被配置来存储：音频内容项；和文本内容项，其是所述音频内容项的伴随项；与所述电子数据存储区通信的计算装置，所述计算装置被配置来：产生所述音频内容项的文本转录；对所述文本转录识别所述文本内容项中的不确定区域；识别初步对齐所述不确定区域的所述音频内容项的区域；应用语言模型于所述音频内容项的所述区域以产生更新的文本转录；确定所述更新的文本转录的一部分实质上对应于包括所述不确定区域的所述文本内容项的一部分；和产生内容同步信息，其中所述内容同步信息促进包括所述不确定区域的所述文本内容项的所述部分和产生所述更新文本转录的所述实质上对应部分的所述音频内容项的部分的所述同步呈...

【技术特征摘要】
【国外来华专利技术】2012.08.02 US 61/679,015;2012.09.05 US 13/604,482;1.一种用于将音频内容项的呈现与文本内容项进行同步的系统，所述系统包括：电子数据存储器，其被配置来存储：所述音频内容项；和所述文本内容项，其是所述音频内容项的伴随项；与所述电子数据存储器通信的计算装置，所述计算装置被配置来：产生所述音频内容项的文本转录；对所述文本转录识别所述文本内容项中的不确定区域，其中所述不确定区域包括没有在所述音频内容项中识别到相应音频的所述文本内容项的文本；识别所述音频内容项中的区域，所述音频内容项中的区域初步对齐所述不确定区域；应用语言模型于所述音频内容项的区域以产生更新的文本转录；确定所述更新的文本转录的一部分对应于包括所述不确定区域的所述文本内容项的一部分；和产生内容同步信息，其中所述内容同步信息促进包括所述不确定区域的所述文本内容项的所述部分和所述更新文本转录的所述对应部分产生所基于的所述音频内容项的一部分的同步呈现。2.根据权利要求1所述的系统，其中所述计算装置还被配置来将所述内容同步信息提供给单独计算装置。3.根据权利要求1所述的系统，其中所述计算装置还被配置来同步呈现包括所述不确定区域的所述文本内容项的所述部分和所述更新文本转录的所述对应部分产生所基于的所述音频内容项的所述部分。4.根据权利要求1所述的系统，其中所述语言模型是至少部分基于所述不确定区域的一个或多个单词。5.一种用于将音频内容项同步呈现到文本内容的伴随项的系统，所述系统包括：电子数据存储器，其被配置来存储内容同步信息；和与所述电子数据存储器通信的计算装置，所述计算装置被配置来：对所述音频内容项的文本转录识别文本内容的所述伴随项中的不确定区域，所述不确定区域包括没有在所述音频内容项中识别到相应音频的一个或多个单词；识别所述文本转录中的区域，所述文本转录中的区域初步对齐所述不确定区域，所述文本转录中的区域包括一个或多个单词；将所述不确定区域的所述一个或多个单词转换成第一音素字符串；将所述文本转录中的区域的所述一个或多个单词转换成第二音素字符串；和如果所述第一音素字符串对应于所述第二音素字符串，那么产生内容同步信息，所述内容同步信息促进文本内容的所述伴随项中的所述不确定区域的所述一个或多个单词和所述文本转录中的区域产生所基于的所述音频内容项的所述一个或多个单词的同步呈现。6.根据权利要求5所述的系统，其中如果所述第一音素字符串是在相距所述第二音素字符串的阈值Levenshtein距离内，那么所述第一音素字符串对应于所述第二音素字符串。7.根据权利要求5所述的系统，其中：所述计算装置...

【专利技术属性】
技术研发人员：史蒂文·C·齐克，居伊·A·小斯托里，
申请(专利权)人：奥德伯公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人