当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于相似度的音频拷贝检测的方法技术

技术编号:7315105 阅读:330 留言:0更新日期:2012-05-03 23:07
本发明专利技术属于音频信息处理技术领域,具体为一种基于相似度的音频拷贝检测方法。本发明专利技术首先建立一个关于参考音频信号的数据库,在入库之前对这些信号做分割处理,使之等长;所述数据库中的参考音频信号为非法或不良信息;对于音频信号,根据已建好的参考音频数据库,进行拷贝检测,即依次进行特征提取、直方图生成、相似度计算;再用并行算法判断输入音频信号是否有包含数据库中参考音频的拷贝,从而得出输出结果,即该音频是否包含非法或不良信息;本发明专利技术方法可用于互联网不健康、暴力、反动语音的检测与过滤以及各种音频拷贝检测应用系统,阻止各种不良内容的蔓延。

【技术实现步骤摘要】

本专利技术属于音频信息处理
,具体涉及一种音频拷贝检测的方法。
技术介绍
音频压缩技术的进步以及大容量存储器的出现使得互联网上出现了海量的音频信息,这些音频信息被广泛应用于教育、娱乐、新闻、广告等多个领域,成为人们日常生活的重要组成部分。但随之而来的是一系列的问题由于互联网音频在制作、发布、播放、传输等环节非常灵活和开放,导致互联网非法音频、盗版音频内容日益增多,严重损害了内容提供商和有关各方的利益,阻碍了网络音频产业的健康有序发展。同时,互联网音频也已经成为国内外各种敌对势力非法音频、反动音频渗透的重要渠道,严重危机了国家文化甚至社会安全。由于互联网音频数据量巨大,使得快速检测非法音频和盗版音频非常困难,加之互联网音频可能经过各种编辑处理产生多个版本的变种,使得其检测问题更加复杂。目前针对音频信息检索的许多研究中,大部分是基于内容的音频检索,主要采用对音频信息建立索引和分类。比如,在一个音频检索任务中,大多数的工作是基于音频的高层信息比如音频内容分类(例如语音片断和非语音片断的索引)、经过验证的语音、或者转录的音乐片断。在这种检索中,需要经过特征提取、音频分割、音频识别分类和索引检索这些步骤。另外除了声学特征级,还需要关注语义级的音频处理。需要处理的特征和检索的方法步骤比较复杂。我们关注基于相似度的搜索,它是关于对未标注的音频片断的仅仅基于信号相似度的搜索。对于基于相似度的音频搜索的一个传统的方法是基于数据本身的相关性或者基于从数据中抽取出的特征向量的信号检测技术。但是,使用这个技术,由于考虑到长时间(比如长达几天)的待检音频信号或者许多参考音频信号的计算量,搜索将会变得不切实际。当然,人们可以通过粗糙的匹配来改进速度,但这样同时也会不可避免地减少搜索的正确性与稳定性。参考文献K. Kashino et al. , "A Quick Search Method for Audio and Video Signals Based on Histogram Pruning,,,In IEEE Trans, on Multimedia, Vol. 5, No. 3, pp. 348-357, Sep. 2003J. K. ffu, A. D. Narasimhalu, B. M. Mehtre, C. P. Lam, and Y. J. Gao,"CORE: A content-based retrieval engine for multimedia informationsystems," ACM Multimedia Syst. , vol. 3, no. 1, pp. 25 - 41, 1995.M. Flickner, H. Sawhney, W. Niblack, J. Ashley, Q. Huang, B. Dom, M. Yonkani, J. Hafner, D. Lee, D. Petkovic , D. Stede, and P. Yanker,"Queryby image and video content: The QBIC system, " IEEE Computer, vol. 28, no. 9, pp. 23 - 32, 1995.H. D. ffactlar, “ Informedia—Search and summarization in thevideomedium,,,pre sen ted at the Imagina 2000, 2000.R. Brunelli and 0. Mich, “Image retrieval by examples, ”IEEE Trans. Multimedia, vol. 2,pp. 164-171,Sept. 2000.S. Pfeifferj S. Fischer, andW. Effelsbergj “Automatic audio content anal-ysis, “ in Proc. ACM Multimedia, 1996, pp. 21 - 30.E. Wold, T. Blum, D. Keislarj and J. Wheat on,“Content-based classifi-cation, search, and retrieval of audio,,,IEEE Multimedia, vol. 3, no. 3, pp. 27 - 36,1996.S. J. Young, M. G. Brown, J. T. Footej G. J. F. Jones, and K. S. Jones, “Acoustic indexing for multimedia retrieval and browsing, ” in Proc. ICASSP' 97, vol. 1,1997,pp. 199 - 202.J. Foote, “An overviewof audio information retrieval, yyMultimediaSyst.,vol. 7, no. 1, pp. 2 - 11, 1999.T. Zhang and J. C. Kuoj "Hierarchical system for content-based audioclassification and retrieval, ” Proc. SPIEy vol. 3527,pp. 398 - 409,1998.J. C. Hancock and P. A. Wintzj Signal Detection Theory. NewYork: McGraw-Hi11, 1966.B. Kedem, “Spectral analysis and discrimination by zero-crossings, ”Proc. IEEE,vol. 74,pp. 1477 - 1493,Nov. 1986.J. Saunders, “Real-time discrimination of broadcast speech/music, ” inProc. ICASSP,96, vol. 2,1996,pp. 993 - 996.B. S. Atal and M. R. Schroederj "Predictive coding of speech signals, ”Proc. IEEE Conf. Communication and Processing, pp. 360 - 361,1967.L R. Rabiner and B. H. Juangj Fundamentals of Speech Recogni-tion. Englewood Cliffs, NJ: Prentice-Hall, 1993.J. Footej “Content-based retrieval of music and audio,,,Proc. SPIEy vol. 3229,pp. 138 - 147,1997.B. Logan, "Mel frequency cepstral coefficients for music本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:肖星星卜素亮
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术