一种视频编码方法、视频编码装置及电子设备制造方法及图纸

技术编号:18238184 阅读:31 留言:0更新日期:2018-06-17 01:37
本发明专利技术公开了一种视频编码方法、视频编码装置、电子设备及计算机可读存储介质,其中,该视频编码方法包括:对视频中的各帧图像进行图像识别;基于图像识别的结果对所述各帧图像进行聚类;根据聚类的结果,在每一类图像中将预设数量的图像编码为所述视频的关键帧;基于所述关键帧将其它图像编码为预测帧,其中,所述其它图像为所述视频中未被编码为关键帧的图像。本发明专利技术方案能够灵活设置关键帧在视频中的位置,帮助用户在播放视频时更好地对视频进行定位。 1

Video encoding method, video encoding device and electronic device

The present invention discloses a video coding method, a video coding device, an electronic device and a computer readable storage medium, in which the video coding method includes: image recognition of each frame image in the video; the image recognition is based on the result of the image recognition; according to the result of the clustering, each class is in a class. The image is encoded as a key frame of the video, and the other images are coded into a prediction frame based on the key frame, in which the other images are images that are not encoded as key frames in the video. The scheme of the invention can flexibly set the position of the key frames in the video, and help users locate the video better when playing the video. One

【技术实现步骤摘要】
一种视频编码方法、视频编码装置及电子设备
本专利技术属于多媒体
,尤其涉及一种视频编码方法、视频编码装置、电子设备及计算机可读存储介质。
技术介绍
在进行视频编码时,通常会预先设定编码关键帧(I帧)的时间周期,根据该时间周期的起始时间设置若干个编码关键帧的时间戳,用以将与编码关键帧的时间戳所对应的图像编码为关键帧;其它图像则均以关键帧为基础编码为预测帧(P帧或者B帧)。而在通过视频播放器播放视频时,由于关键帧通常作为定位帧为用户提供拉动视频进度条时的定位信息,这将导致用户只能根据固定时间点的关键帧图像对视频进行定位。
技术实现思路
有鉴于此,本专利技术提供了视频编码方法、视频编码装置、电子设备及计算机可读存储介质,使得视频中的关键帧不再处于固定时间戳,帮助用户在播放视频时更好地对视频进行定位。本专利技术的第一方面提供了一种视频编码方法,所述视频编码方法包括:对视频中的各帧图像进行图像识别;基于图像识别的结果对所述各帧图像进行聚类;根据聚类的结果,在每一类图像中将预设数量的图像编码为所述视频的关键帧;基于所述关键帧将其它图像编码为预测帧,其中,所述其它图像为所述视频中未被编码为关键帧的图像。本专利技术的第二方面提供了一种视频编码装置,所述视频编码装置包括:识别单元,用于对视频中的各帧图像进行图像识别;聚类单元,用于基于图像识别的结果对所述各帧图像进行聚类;关键帧编码单元,用于根据聚类的结果,在每一类图像中将预设数量的图像编码为所述视频的关键帧;预测帧编码单元,用于基于所述关键帧将其它图像编码为预测帧,其中,所述其它图像为所述视频中未被编码为关键帧的图像。本专利技术的第三方面提供了一种电子设备,所述电子设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上第一方面所述方法的步骤。本专利技术的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上第一方面所述方法的步骤。由上可见,在本专利技术方案中,首先对视频中的各帧图像进行图像识别,然后基于图像识别的结果对所述各帧图像进行聚类,并根据聚类的结果,在每一类图像中将预设数量的图像编码为关键帧,并基于所述关键帧将其它图像编码为预测帧,其中,所述其它图像为所述视频源文件中未被编码为关键帧的图像。本专利技术方案使得视频编码时的关键帧不在处于固定的时间戳位置上,而是能够根据视频所展现的不同内容灵活设置关键帧的位置,帮助用户在播放视频时更好地进行定位。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的视频编码方法的实现流程示意图;图2是本专利技术实施例提供的视频编码装置的示意图;图3是本专利技术实施例提供的电子设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术上述的技术方案,下面通过具体实施例来进行说明。实施例一图1示出了本专利技术实施例一提供的视频编码方法的实现流程,详述如下:在步骤101中,对视频中的各帧图像进行图像识别;在本专利技术实施例中,可以先对视频中的各帧图像进行图像识别,以获知各帧图像所表示的图像内容;可选地,当视频中存在包含有文字信息的图像时,还可以对各帧图像进行文本识别,以获知各帧图像所表示的文本内容。上述文本识别的对象可以是单个的文字,也可以是多个文字组成的句子或者段落。进一步地,上述文本识别的对象可以是中文,也可以是英文及其他语言文字,还或者可以是混杂几种语言文字的文本。更进一步地,上述文本识别的对象可以是手写文字或者机打文字。具体地,在步骤101中可以采用光学字符识别(OCR,OpticalCharacterRecognition)技术对视频中的各帧图像进行文本识别。当然,也可以采用其它文本识别技术对视频中的各帧图像进行文本识别,此处不作限定。在步骤102中,基于图像识别的结果对上述各帧图像进行聚类;在本专利技术实施例中,基于步骤101的图像识别的结果对上述各帧图像进行聚类,将图像识别的结果相同的图像帧作为同一类;可选地,每一类图像所包含的图像帧的数量均未达到视频中总的图像帧数量的预设比例值,则认为以图像识别的结果相同的图像帧作为同一类的聚类方式过于细化,可以选择继续将图像识别的结果相似的图像帧作为同一大类。可选地,若步骤101中还对上述各帧图像进行了文本识别,则也可以基于文本识别的结果,获取各帧图像之间的文本相似度,将文本相似度大于预设相似度阈值的图像帧作为同一类。当然,也可以通过其它方式对上述各帧图像进行聚类,此处不作限定。在步骤103中,根据聚类的结果,在每一类图像中将预设数量的图像编码为上述视频的关键帧;在本专利技术实施例中,上述预设数量可以与每一类图像的图像帧总数量成正比例关系,但需要注意的是,上述预设数量也是有上限阈值的。例如,假定步骤102中将视频中的各帧图像聚类为两类,A类图像中有10帧图像,B类图像中有20帧图像,则在A类图像中将2帧图像作为关键帧,在B类图像中将4帧作为关键帧。又假定上述预设数量的上限阈值为10,则即便后续还存在100帧的C类图像,也只能在该C类图像中将10帧图像作为关键帧。当然,上述预设数量也可以为一固定值,即无论该类图像的图像帧总数量是多少,均从该类图像中将固定数量的图像帧作为关键帧,此处不作限定。在步骤104中,基于上述关键帧将其它图像编码为预测帧。在本专利技术实施例中,经过步骤103,每一类图像中均存在已被编码为关键帧的图像及其它图像,上述其它图像为上述视频中未被编码为关键帧的图像。则可以各类图像中的关键帧,分别将各类图像中的其它图像编码为预测帧,上述预测帧包括P帧(即前向预测编码帧)及B帧(即双向预测编码帧)。实际上,在进行图像编码时,上述B帧也可以根据已编码好的P帧进行编码,而并不完全直接依赖于关键帧。可选地,在上述步骤101之前,上述视频编码方法还包括:接收视频源文件;缓存上述视频源文件中的图像序列;则上述步骤101包括:对上述图像序列中的各帧图像进行图像识别。其中,电子设备若接有摄像头,则可以在电子设备通过摄像头启动拍摄视频的操作时,接收由摄像头发送来的视频源文件。上述摄像头可以是电子设备自带的摄像头,也可以是电子设备外接的摄像头,此处不作限定。或者,也可以是通过互联网下载视频源文件;又或者,还可以是接收其它电子设备通过蓝牙、红外或者近距离无线通信技术(NearFieldCommunication,NFC)所发送的视频源文件,此处不作限定。可选地,上述步骤104之前,上述视频编码方法还包括:设置一个以上关键帧编码时间戳;将上述视频中上述关键帧编码时间戳所对应的图像编码为关键帧。在本专利技术实施例中,本文档来自技高网...
一种视频编码方法、视频编码装置及电子设备

【技术保护点】
1.一种视频编码方法,其特征在于,所述视频编码方法包括:

【技术特征摘要】
1.一种视频编码方法,其特征在于,所述视频编码方法包括:对视频中的各帧图像进行图像识别;基于图像识别的结果对所述各帧图像进行聚类;根据聚类的结果,在每一类图像中将预设数量的图像编码为所述视频的关键帧;基于所述关键帧将其它图像编码为预测帧,其中,所述其它图像为所述视频中未被编码为关键帧的图像。2.如权利要求1所述的视频编码方法,其特征在于,所述对视频中的各帧图像进行图像识别之前,还包括:接收视频源文件;缓存所述视频源文件中的图像序列;所述对视频中的各帧图像进行图像识别,包括:对所述图像序列中的各帧图像进行图像识别。3.如权利要求1所述的视频编码方法,其特征在于,所述基于所述关键帧将其它图像编码为预测帧之前,还包括:设置一个以上关键帧编码时间戳;将所述视频中所述关键帧编码时间戳所对应的图像编码为关键帧。4.如权利要求1至3任一项所述的视频编码方法,其特征在于,所述视频编码方法还包括:基于对所述关键帧的图像识别的结果,生成与所述关键帧对应的标签信息;根据所述关键帧的时间戳,关联所述标签信息及所述视频。5.如权利要求1至3任一项所述的视频编码方法,其特征在于,所述视频编码方法还包括:根据所述关键帧,生成与所述关键帧对应的预览图;根据所述关键帧的时间戳,关联所述预览图及所述视频。6.一...

【专利技术属性】
技术研发人员:陈泰斌
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1