一种音视频多维度标注与模型优化方法技术

技术编号：19429787 阅读：34 留言：0更新日期：2018-11-14 11:29

本发明专利技术公开一种音视频多维度标注与模型优化方法，具体包括如下步骤：首先进行样本管理与分拣，针对输入系统的样本数据进行去重，编号，建立样本标注任务库；音频数据预处理阶段，将任务库的视频数据进行音频抽取，同时完成对音频数据的预处理操作；音频内容分析与特征提取阶段，在完成音频预处理后，并依据后台已配置的标注规范体系进行深度分析输出标签数据；步骤304：视频内容分析与特征提取阶段，通过对视频内容进行图像分析，并依据后台已配置的标注规范体系进行深度分析输出标签数据；步骤305：特征融合与标签生成，将识别特征与标签信息融合，输出该样本的标签结果；人工复核与模型优化，系统产生的标签结果数据会经由人工进行复核确认。

全部详细技术资料下载

【技术实现步骤摘要】
一种音视频多维度标注与模型优化方法
本专利技术涉及一种音视频多维度标注与模型优化方法，属于信息标注

技术介绍
当前互联网音视频呈现井喷发展，如何实现对海量音视频数据的分类，将无序混乱的数据进行有效分离，实现科学管理是各类互联网厂商、政府部分亟需解决的现实问题。传统的音视频分类分析标注通常是基于单一分析引擎进行识别，再由人工进行复核。通常来讲这种分析标注方式具有较低的效率，同时给人员带来巨大的工作量。面对当下互联网音视频井喷式爆发，原有的标注方法已不能满足当前需求。同时各类分析引擎也在不断的升级优化中，标注系统如何快速集成并升级各类引擎也成为较大难题。
技术实现思路
本专利技术主要利用音视频中的语音数据以及视频内容等信息展开相关的分类分析研究。通过智能语音分析技术以及突破性的意图理解技术等，深度挖掘音频数据中蕴含的信息，通过事先标注、训练，能够支持定制个性化的特定信息分析模式，实现有目标主题的分拣与标注。同时系统利用图像分析技术，从视频特征的角度开展目标检测以及行为分析的相关研究，并结合文本语义理解技术完成对视频样本库进行视频特征标注。本专利技术的架构内部集成了针对音视频内容分析的各类引擎，海量的音视频数据首先经过系统自动化分析，依据后台标签体系规范输出初始标注结果。再经由人工在此系统内部直接完成分析结果审核与标注补充。系统将依据人工审核、修改记录完成对分析引擎的结果评测，进而针对性的完成具体分析引擎的优化。同时人工复核的数据将会作为引擎升级的训练数据集。最终系统实现了从音视频自动分类分析、标注数据审核、引擎优化的闭环体系。本专利技术提出的构建方法将具...

【技术保护点】
1.一种音视频多维度标注与模型优化方法，其特征在于，具体包括如下步骤：步骤301：首先进行样本管理与分拣，针对输入系统的样本数据进行去重，编号，建立样本标注任务库；步骤302：音频数据预处理阶段，将任务库的视频数据进行音频抽取，形成视频、音频两种格式数据，同时完成对音频数据的预处理操作；步骤303：音频内容分析与特征提取阶段，在完成音频预处理后，对音频内容进行深度分析，并依据后台已配置的标注规范体系进行深度分析输出标签数据；步骤304：视频内容分析与特征提取阶段，通过对视频内容进行图像分析，从画面特征的角度开展目标检测以及行为分析的研判，输出画面特征多维度信息，并依据后台已配置的标注规范体系进行深度分析输出标签数据；步骤305：特征融合与标签生成，样本数据经过音频、视频多维度的分析将会产生各类标签数据；依据已后台配置的标签系统，将识别特征与标签信息融合，输出该样本的标签结果；步骤306：人工复核与模型优化，产生的标签结果数据会经由人工进行复核确认；人工对标签数据的修改、保存操作日志都将会成为对模型分析结果的研判数据，从而实现对模型识别准确率等各项指标的研判；通过对效果的审核，将待优化的...

【技术特征摘要】
1.一种音视频多维度标注与模型优化方法，其特征在于，具体包括如下步骤：步骤301：首先进行样本管理与分拣，针对输入系统的样本数据进行去重，编号，建立样本标注任务库；步骤302：音频数据预处理阶段，将任务库的视频数据进行音频抽取，形成视频、音频两种格式数据，同时完成对音频数据的预处理操作；步骤303：音频内容分析与特征提取阶段，在完成音频预处理后，对音频内容进行深度分析，并依据后台已配置的标注规范体系进行深度分析输出标签数据；步骤304：视频内容分析与特征提取阶段，通过对视频内容进行图像分析，从画面特征的角度开展目标检测以及行为分析的研判，输出画面特征多维度信息，并依据后台已配置的标注规范体系进行深度分析输出标签数据；步骤305：特征融合与标签生成，样本数据经过音频、视频多维度的分析将会产生各类标签数据；依据已后台配置的标签系统，将识别特征与标签信息融合，输出该样本的标签结果；步骤306：人工复核与模型优化，产生的标签结果数据会经由人工进行复核确认；人工对标签数据的修改、保存操作日志都将会成为对模型分析结果的研判数据，从而实现对模型识别准确率等各项指标的研判；通过对效果的审核，将待优化的分析模型识别出，利用已标注维护的样本数据对其进行优化升级。2.根据权利要求1所述的一种音视频多维度标注与模型优化方法，其特征在于，所述步骤302还包括：对音频数据进行VAD检测、特征提取、说话人分离、语种识别操作，形成基础的属性标签，同时完成对音频数据的标注化处理，为后续的音频内容分析与特征提取阶段提供标数据基础。3.根据权利要求1所...

【专利技术属性】
技术研发人员：杜翠兰，王晶，谢程利，段运强，吕萍，柳林，倪江帆，廖子民，
申请(专利权)人：国家计算机网络与信息安全管理中心，讯飞智元信息科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人