一种结合PLSA和AT的音频事件分类方法技术

技术编号：11640754 阅读：64 留言：0更新日期：2015-06-24 17:20

本发明专利技术公开了一种结合PLSA和AT的音频事件分类方法，该方法在训练阶段用训练样本训练PLSA模型和AT模型；在分类阶段，对于待分类的音频文档，首先用PLSA模型求得文档中潜在的音频事件，然后用AT模型从潜在音频事件中找出若干音频事件作为分类结果。本发明专利技术提出的结合PLSA和AT的音频事件分类方法既能很好地分类纯净音频事件，又能很好地分类混叠音频事件，而且在分类混叠音频事件时能识别出其中的多个音频事件，而不仅仅是识别出其中的一个音频事件。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种结合PLSA和AT的音频事件分类方法。
技术介绍
音频信息是多媒体信息的一种重要表现形式。音频领域中的音频事件分类技术在实际生活中具有广泛的应用，不但可以用于进行多媒体检索、安全监控，而且可以用于智能机器人和智能家居工程。音频文档主要包含两类音频事件，即纯净音频事件和混叠音频事件。纯净音频事件是指某一时刻只有一个音频事件发生，发生的音频事件在此刻与其它音频事件没有时间上的交叠；混叠音频事件是指某一时刻有多个音频事件同时发生，发生的音频事件在此刻产生时间上的交叠。目前的音频分类技术能很好地分类纯净音频事件，但在对混叠音频事件分类时则分类性能大为降低。这主要是因为混叠音频事件受混叠的影响，其特征较混叠之前的纯净音频事件的特征发生了明显的改变，加大了分类的难度。此外，目前多数的混叠音频事件分类技术是将混叠音频事件分类为其所包含的某一音频事件，而未能识别出其中的多个音频事件，这也影响了分类性能的提高。
技术实现思路
本专利技术的目的就是为了解决上述问题，提供一种结合PLSA和AT的音频事件分类方法，本专利技术结合两种主题模型，即PLSA(Probabilistic Latent Semantic Analysis)模型和AT (Author-Topic model)模型，进行分类。PLSA模型和AT模型的提出最初都是用于文本分析。PLSA已有研宄将其引入音频领域进行语义标注和视频分类等，而对于AT模型，现在还未见将其应用于音频领域的相关研宄。本专利技术创新性地将AT模型引入到音频分类领域，并创新性地...
一种结合PLSA和AT的音频事件分类方法

【技术保护点】
一种结合PLSA和AT的音频事件分类方法，其特征是，包括如下步骤：步骤(1)：通过训练音频文档训练得到AT模型；步骤(2)：通过训练音频文档训练得到PLSA模型；步骤(3)：通过步骤(2)得到的PLSA模型,求得待分类的音频文档包含的潜在的M个音频事件；步骤(4)：通过步骤(1)得到的AT模型，从步骤(3)潜在的M个音频事件中选择N个音频事件作为分类结果，其中，1≤N＜M。

【技术特征摘要】

【专利技术属性】
技术研发人员：冷严，李登旺，程传福，万洪林，王晶晶，方敬，徐新艳，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人