测量内容一致性的方法和设备、测量相似度的方法和设备技术

技术编号：8387593 阅读：212 留言：0更新日期：2013-03-07 08:16

描述了用于测量内容一致性的实施例和用于测量内容相似度的实施例。测量第一音频部分与第二音频部分之间的内容一致性。针对第一音频部分中的每个音频分段，确定第二音频部分中预定数目的音频分段。第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度高于该音频分段与第二音频部分中的所有其它音频分段之间的内容相似度。计算第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度的平均值。将内容一致性计算为，针对第一音频部分中的各音频分段而计算的各平均值的平均值、最大值或最小值。可以基于狄里克雷分布计算内容相似度。

全部详细技术资料下载

【技术实现步骤摘要】
测量内容一致性的方法和设备
本专利技术一般涉及音频信号处理。更具体地，本专利技术的实施例涉及用于测量音频部分之间的内容一致性的方法和设备，以及用于测量音频分段之间的内容相似度的方法和设备。
技术介绍
内容一致性度量用于测量音频信号内或音频信号间的内容一致性。该度量涉及计算两个音频分段之间的内容一致性(contentcoherence)(内容相似度(contentsimilarity)或内容一致性(contentconsistence))，并用作判断这些分段是否属于相同的语义聚类或这两个分段之间是否存在真实的边界的基础。已经提出了测量两个长窗口之间的内容一致性的方法。根据这种方法，将每个长窗口划分为多个短音频分段(音频元素)，并且基于交叠相似度链接的整体思路，通过计算从左窗口和右窗口获得的所有分段对之间的语义相似性而获得内容一致性度量。可通过测量音频分段之间的内容相似度或通过其对应的音频元素类来计算语义相似性(例如，参见L.Lu及A.Hanjalic.“Text-LikeSegmentationofGeneralAudioforContent-BasedRetrieval，”IEEETrans.onMultimedia，vol.11，no.4，658-669，2009，其通过引用合并于此以用于全部目的)。可以基于两个音频分段之间的特征比较来计算内容相似度。已经提出了诸如K-L散度(Kullback-Leiblerdivergence，KLD)的各种度量，以测量两个音频分段之间的内容相似度。这一部分描述的方案是可能请求保护的方案，而不一定是先前已构思或已请求保...
<a href="http://www.xjishu.com/zhuanli/21/201110243107.html" title="测量内容一致性的方法和设备、测量相似度的方法和设备原文来自X技术">测量内容一致性的方法和设备、测量相似度的方法和设备</a>

【技术保护点】
一种测量第一音频部分与第二音频部分之间的内容一致性的方法，包括：针对所述第一音频部分中的每个音频分段，确定所述第二音频部分中预定数目的音频分段，其中所述第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度高于所述第一音频部分中的该音频分段与所述第二音频部分中的所有其它音频分段之间的内容相似度；以及计算所述第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度的平均值；以及将第一内容一致性计算为，针对所述第一音频部分中的各音频分段而计算的各平均值的平均值、最小值或最大值。

【技术特征摘要】
1.一种测量第一音频部分与第二音频部分之间的内容一致性的方法，包括：针对所述第一音频部分中的每个音频分段，确定所述第二音频部分中预定数目的音频分段，其中所述第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度高于所述第一音频部分中的该音频分段与所述第二音频部分中的所有其它音频分段之间的内容相似度；以及计算所述第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度的平均值；以及将第一内容一致性计算为，针对所述第一音频部分中的各音频分段而计算的各平均值的平均值、最小值或最大值。2.根据权利要求1所述的方法，进一步包括：针对所述第二音频部分中的每个音频分段，确定所述第一音频部分中预定数目的音频分段，其中所述第二音频部分中的该音频分段与所确定的音频分段之间的内容相似度高于所述第二音频部分中的该音频分段与所述第一音频部分中的所有其它音频分段之间的内容相似度；以及计算所述第二音频部分中的该音频分段与所确定的音频分段之间的内容相似度的平均值；将第二内容一致性计算为针对所述第二音频部分中的各音频分段而计算的各平均值的平均值、最小值或最大值；基于所述第一内容一致性和所述第二内容一致性计算对称内容一致性。3.根据权利要求1或2所述的方法，其中，将所述第一音频部分中的音频分段si,l与所确定的音频分段sj,r之间的内容相似度S(si,l,sj,r)中的每一个计算为所述第一音频部分中的序列[si,l,…,si+L-1,l]与所述第二音频部分中的序列[sj,r,…,sj+L-1,r]之间的内容相似度，L>1。4.根据权利要求3所述的方法，其中，通过应用动态时间规整方案或动态规划方案来计算所述序列之间的内容相似度。5.根据权利要求1或2所述的方法，其中，通过以下步骤来计算两个音频分段之间的内容相似度：从所述音频分段中提取第一特征向量；根据所述特征向量生成用于计算所述内容相似度的统计模型；以及基于所生成的统计模型计算所述内容相似度，其中所述第一特征向量中的每一个中的所有特征值都是非负的且所述特征值的和为1，并且所述统计模型基于狄里克雷分布。6.根据权利要求5所述的方法，其中，所述提取包括：从所述音频分段中提取第二特征向量；以及针对所述第二特征向量中的每一个，计算用于测量该第二特征向量与参考向量中的每一个之间的关系的量，其中与所述第二特征向量相对应的所有量形成所述第一特征向量中的一个。7.根据权利要求6所述的方法，其中，通过以下方法之一确定所述参考向量：随机产生法，其中随机生成所述参考向量；无监督聚类法，其中提取自训练样本的训练向量被分组为聚类，并计算所述参考向量以分别代表所述聚类；监督建模法，其中根据提取自训练样本的训练向量来人工定义和学习所述参考向量；以及特征分解法，其中将所述参考向量计算为以提取自训练样本的训练向量作为行的矩阵的特征向量。8.根据权利要求6所述的方法，其中，通过以下各量之一测量所述第二特征向量与所述参考向量中的每一个之间的关系：所述第二特征向量与该参考向量之间的距离；所述第二特征向量与该参考向量之间的相关；所述第二特征向量与该参考向量之间的内积；以及该参考向量的以所述第二特征向量作为相关证据的后验概率。9.一种用于测量第一音频部分与第二音频部分之间的内容一致性的设备，包括：相似度计算器，其针对所述第一音频...

【专利技术属性】
技术研发人员：芦烈，胡明清，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人