基于音频浓缩摘要的海量音频检索方法技术

技术编号：21089864 阅读：46 留言：0更新日期：2019-05-11 10:04

本发明专利技术公开了一种基于音频浓缩摘要的海量音频检索方法，涉及安防监控领域。本发明专利技术包括如下步骤：选择文件夹，生成多线程执行浓缩任务，打开待浓缩的文件，读取音频帧并解码，得到裸的PCM数据，使用VAD算法对PCM裸数据进行判定，并进行语音识别生成摘要信息和音频索引文件，提供音频的检索和播放功能。本发明专利技术通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩，提取出有价值的语音和文字信息，并生成包含摘要信息的音频索引文件，用户可输入文本关键字进行快速检索，并可播放检索结果中的音频数据，大大提高了工作效率。

Massive Audio Retrieval Based on Audio Concentrated Abstracts

全部详细技术资料下载

【技术实现步骤摘要】
基于音频浓缩摘要的海量音频检索方法
本专利技术属于安防监控领域，特别是涉及一种基于音频浓缩摘要的海量音频检索方法。
技术介绍
在安防监控领域，随着监控设备数量的爆炸性增长，其存储的录像数据也呈几何级增长。在公安、刑侦等应用场景下，如果采用人工的方式对这些海量录像数据进行分析，效率将是极其低下的，以至于错过最佳破案时机。因此，如何从这些海量录像数据中挖掘出有价值的信息，以供快速检索和查证，已成为用户非常迫切的需求。在目前已授权的专利中，如专利申请号为【CN201210520403.X】的一种用于具有静止画面视频的视频浓缩方法、专利申请号为【CN201210142026.0】的一种快速视频浓缩摘要方法，大多采用的视频浓缩摘要技术，提取出其中的背景和运动目标，并重建成新的视频图像序列。但录像数据中除了视频，还有音频。音频数据是视频数据的重要补充，能够帮助办案人员更好地理解事实真相。在某些情况下，如视频信号丢失、视频画面模糊等，音频数据可能是唯一的线索和证据。音频数据的特点是：大部分时间内可能都是静音和噪音数据，只有少数时间内包含真正有用的语音信息。为了提高办案人员的工作效率，快速检索海量的音频数据，对音频进行浓缩摘要，是很有必要的。
技术实现思路
本专利技术的目的在于提供一种基于音频浓缩摘要的海量音频检索方法，通过使用多线程并行方式对海量音频数据所在的文件夹进行浓缩，提取出有价值的语音和文字信息，并生成包含摘要信息的音频索引文件，用户能够通过输入关键字进行快速检索，解决了现有的音频数据分析效率低、分析难度大的问题。为解决上述技术问题，本专利技术是通过以下技术方案实现...

【技术保护点】
1.一种基于音频浓缩摘要的海量音频检索方法，其特征在于，包括如下步骤：步骤S01：获取待浓缩文件夹内所有的录像文件和音频文件，并生成若干个线程并行进行浓缩任务；步骤S02：在每一个浓缩任务中，打开一个待浓缩的文件；步骤S03：读取一个音频帧并进行解码，获取裸的PCM音频数据；步骤S04：使用VAD算法对一帧PCM裸数据进行判定，若判定为有效数据，则将本帧的序号作为摘要的起始序号；步骤S05：继续对下一帧PCM裸数据进行判定，直到找到判定为无效数据的那一帧为止，将前一帧的序号作为摘要的结束序号；步骤S06：对起始序列号和结束序列号之间的PCM裸数据进行语音识别，将识别的结果作为摘要的文字描述；步骤S07：判断待浓缩文件内音频是否全部读完；若是，则将所有生成的音频摘要信息保存到对应的音频索引文件中，将所有的音频数据保存到对应的浓缩文件中；若否，则返回执行步骤S03；步骤S08：每浓缩完成一个文件，将列出该文件以及对应的摘要信息；步骤S09：输入文字作为关键字进行检索。

【技术特征摘要】
1.一种基于音频浓缩摘要的海量音频检索方法，其特征在于，包括如下步骤：步骤S01：获取待浓缩文件夹内所有的录像文件和音频文件，并生成若干个线程并行进行浓缩任务；步骤S02：在每一个浓缩任务中，打开一个待浓缩的文件；步骤S03：读取一个音频帧并进行解码，获取裸的PCM音频数据；步骤S04：使用VAD算法对一帧PCM裸数据进行判定，若判定为有效数据，则将本帧的序号作为摘要的起始序号；步骤S05：继续对下一帧PCM裸数据进行判定，直到找到判定为无效数据的那一帧为止，将前一帧的序号作为摘要的结束序号；步骤S06：对起始序列号和结束序列号之间的PCM裸数据进行语音识别，将识别的结果作为摘要的文字描述；步骤S07：判断待浓缩文件内音频是否全部读完；若是，则将所有生成的音频摘要信息保存到对应的音频索引文件中，将所有的音频数据保存到对应的浓缩...

【专利技术属性】
技术研发人员：胡健，王大勇，夏同飞，邵善阳，汤才宝，马福运，
申请(专利权)人：安徽睿极智能科技有限公司，
类型：发明
国别省市：安徽,34

全部详细技术资料下载我是这个专利的主人