一种由音频和图片组成的视频文件的生成和检索播放方法、装置制造方法及图纸

技术编号：16458418 阅读：165 留言：0更新日期：2017-10-25 22:54

本发明专利技术公开了一种由音频和图片组成的视频文件的生成和检索播放方法、装置，本发明专利技术可以在录制音频的同时，以定时、用户点击、自动检测场景转换或者其他软硬件系统通知等方式触发拍照，并在对应时间点将图片嵌入音频中，最终生成一个方便检索、尺寸合适的视频文件；用户可以通过关键帧索引的方式，用图片作为辅助信息快速定位并播放音频。本发明专利技术提供了“音频+图片”的伪视频文件生成、播放、使用的新方法，能大大减小视频文件的尺寸，保留最重要的音频和图片信息，并提供有效的检索功能；特别适用于存储和传输语音解说为主、图片文字为辅的知识型信息；对于目前以微信等为代表的大规模网络化知识和信息分享来说，具有非常积极的作用。

Method and device for generating and retrieving video files composed of audio and pictures

The invention discloses a picture composed of audio and video file generation and retrieval method, playback device, the invention can record audio at the same time, the timing, the user clicks, automatic detection of scene change or other hardware and software system of notification trigger camera, and the corresponding time points in the final picture embedded audio. Create a convenient retrieval, video file size; the user can through key frame index mode, as the rapid positioning auxiliary information with pictures and audio playback. The present invention provides a new method of using the pseudo audio video file + picture \generation, playback, and can greatly reduce the video file size, to retain the most important audio and picture information, and provide the effective retrieval function; especially suitable for the storage and transmission of audio commentary for the knowledge information, supplemented by the main picture text for the present; to WeChat as the representative of the large scale network knowledge and information sharing, has a very positive effect.

全部详细技术资料下载

【技术实现步骤摘要】
一种由音频和图片组成的视频文件的生成和检索播放方法、装置
本专利技术涉及音视频处理
，尤其涉及一种视频文件生成和检索播放方法、装置。
技术介绍
随着录像录音设备的普及，用户录制、传播音视频的需求也越来越多。通过微信、QQ等网络方式进行音视频分享，已经成为大众网络用户的常态，也已经成为传播知识、文化的最重要途径。但用户录制讲座、课堂教学等场合的音视频时常常遇到一个两难的问题：只录制音频时一些关键的图像信息就难以同时采集，不能给人直观印象，并且长音频在回放时不好精确定位其中的某一部分；直接录制为带有声音的视频的话就会面临视频尺寸庞大、不便存储传输的问题。因此，一种能在音频中嵌入关键图片的录制方式将是一种好的解决方案：既控制了文件尺寸的大小，也便于给人直观信息以及精确定位。现有技术中，对音视频的去信息冗余和检索多采用后期处理的方式实现，操作比较麻烦，缺少一种在录制时直接对信息高效采集并整合成可检索视频的方法。
技术实现思路
本专利技术的目的在于针对现有技术的不足，提供一种由音频和图片组成的视频文件的生成和检索播放方法。本专利技术的目的是通过以下技术方案实现的：一种由音...
一种由音频和图片组成的视频文件的生成和检索播放方法、装置

【技术保护点】
一种由音频和图片组成的视频文件的生成方法，其特征在于，包括以下步骤：S1、采集音频，同时采集与音频时间同步的图片，图片的采集方式为自动、手动或其他系统触发；S2、将采集的图片编码为视频流，将音频编码为音频流；S3、将视频流与音频流封装生成视频文件，所述视频文件用于对嵌入了图片后的音频进行索引和连续播放。

【技术特征摘要】
1.一种由音频和图片组成的视频文件的生成方法，其特征在于，包括以下步骤：S1、采集音频，同时采集与音频时间同步的图片，图片的采集方式为自动、手动或其他系统触发；S2、将采集的图片编码为视频流，将音频编码为音频流；S3、将视频流与音频流封装生成视频文件，所述视频文件用于对嵌入了图片后的音频进行索引和连续播放。2.根据权利要求1所述的由音频和图片组成的视频文件的生成方法，其特征在于，所述步骤S2中，将要嵌入的图片编码为视频流对应时间点的I帧，视频流中的其他帧不编码为I帧。3.根据权利要求2所述的由音频和图片组成的视频文件的生成方法，其特征在于，I帧编码图片在视频中保持静止直到下一张图片出现。4.根据权利要求1所述的由音频和图片组成的视频文件的生成方法，其特征在于，所述步骤S1中，自动触发方式为用户定时拍照：当计时器计时到用户设定的定时拍照时间时，自动获取一帧图像，将该图像编码为视频流；或者，自动触发方式为自动检测到场景转换时拍照：用户设置感兴趣的区域和触发拍照的阈值TH，按用户设定的视频帧率获取图像，从获取的图像中提取用户设置的感兴趣区域的图像G，对G进行运动估计得到运动矢量，对运动矢量的长度进行加和，除以感兴趣区域的图像大小，得到运动速度的指标E；当E大于TH时，将当前图像编码为视频流，否则，将载有上一帧信息的视频帧拷贝并写入到视频流中进行编码。5.根据权利要求1所述的由音频和图片组成的视频文件的生成方法，其特征在于，所述步骤S1中，手动触发为用户点击按钮触发：当用户点击拍照按钮时，记录当前时间，获取一帧图像，将该图像编码为视频流；其他系统触发为：通过...

【专利技术属性】
技术研发人员：邵之江，张舵，张丁，王永铭，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人