【技术实现步骤摘要】
【国外来华专利技术】媒体数据中的低复杂度重复检测相关的美国申请本申请要求于2011年12月12日提交的美国临时专利申请第61/569,591号的优先权,其全部内容通过引用合并到本文中。本申请涉及于2010年12月30日提交的美国临时专利申请第61/428,578号、于2010年12月30日提交的美国临时专利申请第61/428,588号以及于2010年12月30日提交的美国临时专利申请第61/428,554号,其每个的全部内容通过引用合并到本文中。
本专利技术总体上涉及媒体。更具体地,本专利技术的实施方式涉及媒体数据中的代表性片段的时间位置的低复杂度检测。
技术介绍
媒体数据可以包括能够给收听者或观看者留下持久印象的代表性片段。例如,最流行的歌曲遵循在主歌部与副歌部之间交替的特定结构。通常,副歌部是歌曲中的最重复的部,也是歌曲中“吸引人的”部分。副歌部的位置通常与基本的歌曲结构有关,并且可以用于方便终端用户浏览歌曲收藏。从而,在编码侧,代表性片段比如副歌部的位置可以在媒体数据比如歌曲中被标识,并且可以作为元数据与歌曲的编码比特流相关联。在解码侧,元数据使得终端用户能够在副歌部的 ...
【技术保护点】
一种用于媒体数据中的重复检测的方法,包括:使用能够从所述媒体数据提取的一种或更多种特征类型中的第一类型来选择所述媒体数据中的偏移值集合中的偏移值子集,所述偏移值子集包括基于一个或更多个选择准则从所述偏移值集合中选择的值;以及基于所述一种或更多种特征类型中的第二类型在所述偏移值子集处的相似度/距离分析来标识候选种子时间点集合;其中,所述方法由一个或更多个计算装置执行。
【技术特征摘要】
【国外来华专利技术】2011.12.12 US 61/569,5911.一种用于媒体数据中的重复检测的方法,包括: 使用能够从所述媒体数据提取的一种或更多种特征类型中的第一类型来选择所述媒体数据中的偏移值集合中的偏移值子集,所述偏移值子集包括基于一个或更多个选择准则从所述偏移值集合中选择的值;以及 基于所述一种或更多种特征类型中的第二类型在所述偏移值子集处的相似度/距离分析来标识候选种子时间点集合; 其中,所述方法由一个或更多个计算装置执行。2.根据权利要求1所述的方法,还包括: 从所述媒体数据提取所述第一特征类型的一个或更多个第一特征; 基于所述一个或更多个第一特征来计算第一重复检测度量的第一距离值;以及 应用所述第一重复检测度量的所述第一距离值以选择所述偏移值子集。3.根据权利要求2所述的方法,其中,当基于所述第一特征选择所述偏移值子集时,所述方法还包括: 从所述媒体数据提取所述第二特征类型的一个或更多个第二特征; 其中,所述第 二特征类型和所述第一特征类型关于时间分辨率或频率分辨率的一种或更多种不同; 基于所述一个或更多个第二特征计算第二重复检测度量的第二距离值;以及 应用所述第二重复检测度量的所述第二距离值以标识所述候选种子时间点集合。4.根据权利要求2所述的方法,其中,当基于所述第一特征选择所述偏移值子集时,所述方法还包括: 从所述媒体数据提取所述第二特征类型的一个或更多个第二特征; 基于所述一个或更多个第二特征来计算第二重复检测度量的第二距离值;以及 应用所述第二重复检测度量的所述第二距离值以标识所述候选种子时间点集合。5.根据权利要求2所述的方法,其中,使用变换大小、变换类型、窗口大小、窗口形状、频率分辨率或时间分辨率中的一项或更多项来从与所述媒体数据有关的信号的表示获得或提取所述第二特征类型。6.根据权利要求1所述的方法,其中,所述第一特征类型还包括从所述媒体数据得到的指纹集合,其中,所述方法还包括: 基于所述指纹集合来选择指纹查询序列集合,所述查询序列集合中的每个单独的指纹查询序列包括所述媒体数据针对开始于查询时间的时间间隔的简化表示; 针对所述指纹查询序列集合确定指纹匹配序列集合,所述查询序列集合中的每个单独的查询序列与所述指纹匹配序列集合中的零个或更多个指纹匹配序列对应;以及基于所述查询序列集合和所述匹配序列集合来标识偏移值集合; 其中,所述方法由一个或更多个计算装置执行。7.根据权利要求6所述的方法,还包括基于将所述媒体数据的数字表示简化成所述媒体数据的简化维数二进制表示来生成所述指纹集合,其中,所述数字表示与以下项中的一项或更多项有关:快速傅里叶变换(FFT)、数字傅里叶变换(DFT)、短时傅里叶变换(STFT)、修正离散余弦变换(MDCT)、修正离散正弦变换(MDST)、正交镜像滤波器(QMF)、复杂正交镜像滤波器(CQMF)、离散小波变换(DWT)、色度特征或小波系数。8.根据权利要求6所述的方法,其中,相对于对于检测恶意攻击鲁棒的指纹,所述指纹集合中的指纹提取简便。9.根据权利要求6所述的方法,其中,针对所述指纹查询序列集合确定指纹匹配序列集合包括在动态构造的指纹数据库中搜索与指纹查询序列匹配的指纹匹配序列。10.根据权利要求9所述的方法,其中,所述指纹查询序列开始于特定查询时间,以及其中,所述动态构造的指纹数据库排除在相对于所述特定查询时间的一个或更多个可配置的时间窗内的一部分或更多部分指纹。11.根据权利要求6所述的方法,其中,基于所述查询序列集合和所述匹配序列集合来标识偏移值集合包括使用根据所述查询序列集合和所述匹配序列集合构造的一个或更多个直方图来确定显著偏移值集合。12.根据权利要求1所述的方法,还包括: 使用能够从所述媒体数据提取的一种或更多种特征类型中的第一类型来标识所述媒体数据中的偏移值集合中的偏移值子集,所述偏移值子集基于一个或更多个选择准则被从所述偏移值集合中选择;以及 使用所述一种或更多种特征类型中的第二类型基于所述偏移值子集来标识候选种子时间点集合, 其中,所述方法由一个或更多个计算装置执行。13.根据权利要求12所述的方法,还包括: 从所述媒体数据提取所述第一特征类型的一个或更多个第一特征; 基于所述一个或更多个第一特征来计算第一重复检测度量的第一距离值; 应用所述第一重复检测度量的所述第一距离值以标识所述偏移值子集; 从所述媒体数据提取所述第二特征类型的一个或更多个第二特征; 基于所述一个或更多个第二特征来计算第二重复检测度量的第二距离值;以及 应用所述第二重复检测度量的所述第二距离值以标识所述候选种子时间点集合。14.根据权利要求13所述的方法,其中,所述第一重复检测度量和所述第二重复检测度量中至少一个与以下项中的一项或更多项有关:向量的欧几里得距离、向量范数、均方差、误比特率、基于自相关的度量、汉明距离、相似度或相异度。15.根据权利要求13所述的方法,其中,所述第一值和所述第二值包括一个或更多个归一化值。16.根据权利要求13所述的方法,其中,使用所述一种或更多种特征类型中至少之一来部分地形成所述媒体数据的数字表示。17.根据权利要求16所述的方法,其中,所述媒体数据的所述数字表示包括所述媒体数据的基于指纹的简化维数二进制表示。18.根据权利要求13所述的方法,其中,所述一种或更多种特征类型中至少之一包括捕获结构...
【专利技术属性】
技术研发人员:巴尔巴拉·雷施,雷古纳森·拉达克里希南,阿里希特·比斯瓦斯,约纳什·恩德加德,
申请(专利权)人:杜比实验室特许公司,杜比国际公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。