视频内容处理方法、装置及设备制造方法及图纸

技术编号:21341126 阅读:29 留言:0更新日期:2019-06-13 21:55
本发明专利技术提出了一种视频内容处理方法、装置及设备,其中,方法包括:获取视频帧中的目标区域;提取与目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取目标图像中的各类型的目标元素在目标图像中的显示参数;根据显示参数将目标元素转换为对应的目标标记语言内容,以对目标标记语言内容进行编辑处理。由此,实现了视频中内容的获取,使用户可以方便的获取视频中内容并进行编辑处理。

Video Content Processing Method, Device and Equipment

The invention provides a video content processing method, device and device, in which the method includes: acquiring the target area in the video frame; extracting the target image corresponding to the target area and inputting it into the pre-trained machine learning model for processing, acquiring the display parameters of various types of target elements in the target image; and according to the display parameters, acquiring the target element in the target image. The content of the target markup language is converted to the corresponding content of the target markup language for editing and processing. Thus, the acquisition of content in video is realized, so that users can easily acquire content in video and edit it.

【技术实现步骤摘要】
视频内容处理方法、装置及设备
本专利技术涉及机器学习
,尤其涉及一种视频内容处理方法、装置及设备。
技术介绍
随着互联网技术的发展,通过播放器播放视频成为一种非常普遍的方式。目前,用户在观看视频过程中会存在对视频中的内容进行编辑的需求,比如,对于教学视频,用户想要对视频中的题目进行编辑。由于视频播放的过程中是通过逐帧图像变化来形成视频,用户无法直接对视频中的文字、图片等内容进行编辑,通常需要用户手动输入或者手动调用其他工具进行截取,操作繁琐不便捷。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种视频内容处理方法,通过机器学习模型识别出图像中的文字、图形等内容,进而转换为对应的标记语言内容,实现了视频中内容的获取,使用户可以方便的获取视频中内容并进行编辑处理。本专利技术的第二个目的在于提出一种视频内容处理装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种计算机可读存储介质。本专利技术第一方面实施例提出了一种视频内容处理方法,包括:获取视频帧中的目标区域;提取与所述目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数;根据所述显示参数将所述目标元素转换为对应的目标标记语言内容,以对所述目标标记语言内容进行编辑处理。本专利技术实施例的视频内容处理方法,通过获取视频帧中的目标区域,进而提取与目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取目标图像中的各类型的目标元素在目标图像中的显示参数,进一步根据显示参数将目标元素转换为对应的目标标记语言内容,以对目标标记语言内容进行编辑处理。由此,可以通过机器学习模型识别出图像中的文字、图形等内容,进而转换为Word等文本编辑器可识别的标记语言格式,实现了视频中内容的获取,使用户可以方便的获取视频中内容并进行编辑处理。此外,通过应用于视频播放器,能够扩展播放器的功能,提高用户对产品的粘性。另外,根据本专利技术上述实施例的视频内容处理方法还可以具有如下附加技术特征:可选地,所述获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数,包括:获取所述目标图像中的文字在所述目标图像中的显示参数。可选地,所述根据所述显示参数将所述目标元素转换为对应的目标标记语言内容包括:对所述文字进行识别,获取文字内容;根据所述文字内容和所述显示参数将所述文字转换为对应的目标标记语言内容。可选地,所述获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数,包括:获取所述目标图像中的图形在所述目标图像中的显示参数。可选地,在提取与所述目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理之前,还包括:获取包含样本元素和对应显示参数标记的图像训练样本数据;根据预设的目标函数和所述图像训练样本数据训练预设模型的处理参数,生成所述机器学习模型。可选地,在获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数之后,还包括:在所述视频帧中将所述目标元素绘制为选中状态。可选地,所述根据所述显示参数将所述目标元素转换为对应的目标标记语言内容包括:根据所述显示参数将所述目标元素按照在所述目标图像中的布局进行排版,并转换为对应的目标标记语言内容;将所述目标标记语言内容存储到操作系统的内存剪切板中。本专利技术第二方面实施例提出了一种视频内容处理装置,包括:获取模块,用于获取视频帧中的目标区域;处理模块,用于提取与所述目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数;转换模块,用于根据所述显示参数将所述目标元素转换为对应的目标标记语言内容,以对所述目标标记语言内容进行编辑处理。本专利技术实施例的视频内容处理装置,通过获取视频帧中的目标区域,进而提取与目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取目标图像中的各类型的目标元素在目标图像中的显示参数,进一步根据显示参数将目标元素转换为对应的目标标记语言内容,以对目标标记语言内容进行编辑处理。由此,可以通过机器学习模型识别出图像中的文字、图形等内容,进而转换为Word等文本编辑器可识别的标记语言格式,实现了视频中内容的获取,使用户可以方便的获取视频中内容并进行编辑处理。此外,通过应用于视频播放器,能够扩展播放器的功能,提高用户对产品的粘性。另外,根据本专利技术上述实施例的视频内容处理装置还可以具有如下附加技术特征:可选地,所述处理模块具体用于:获取所述目标图像中的文字在所述目标图像中的显示参数。可选地,所述转换模块具体用于:对所述文字进行识别,获取文字内容;根据所述文字内容和所述显示参数将所述文字转换为对应的目标标记语言内容。可选地,所述处理模块具体用于:获取所述目标图像中的图形在所述目标图像中的显示参数。可选地,所述的装置还包括:训练模块,用于获取包含样本元素和对应显示参数标记的图像训练样本数据;根据预设的目标函数和所述图像训练样本数据训练预设模型的处理参数,生成所述机器学习模型。可选地,所述的装置还包括:绘制模块,用于在所述视频帧中将所述目标元素绘制为选中状态。可选地,所述转换模块具体用于:根据所述显示参数将所述目标元素按照在所述目标图像中的布局进行排版,并转换为对应的目标标记语言内容;将所述目标标记语言内容存储到操作系统的内存剪切板中。本专利技术第三方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如第一方面实施例所述的视频内容处理方法。本专利技术第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所述的视频内容处理方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明图1为本专利技术实施例所提供的一种视频内容处理方法的流程示意图;图2为本专利技术实施例所提供的另一种视频内容处理方法的流程示意图;图3为本专利技术实施例所提供的一种视频界面示意图;图4为本专利技术实施例所提供的一种视频内容处理装置的结构示意图;图5为本专利技术实施例所提供的另一种视频内容处理装置的结构示意图;图6示出了适于用来实现本专利技术实施例的示例性计算机设备的框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的视频内容处理方法、装置及设备。图1为本专利技术实施例所提供的一种视频内容处理方法的流程示意图,如图1所示,该方法包括:步骤101,获取视频帧中的目标区域。本实施例中,在获取视频中的内容时,可以先获取视频帧中的目标区域。其中,目标区域可以为用户从视频的图像帧中选取的区域。作为一种示例,在通过视频播放器播放视频时,用户可以通过触摸屏或者鼠标触发暂停播放器视频播放的指令,将视频暂停在当前图像帧。用户在该图像帧中框选一个矩本文档来自技高网...

【技术保护点】
1.一种视频内容处理方法,其特征在于,包括:获取视频帧中的目标区域;提取与所述目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数;根据所述显示参数将所述目标元素转换为对应的目标标记语言内容,以对所述目标标记语言内容进行编辑处理。

【技术特征摘要】
1.一种视频内容处理方法,其特征在于,包括:获取视频帧中的目标区域;提取与所述目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理,获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数;根据所述显示参数将所述目标元素转换为对应的目标标记语言内容,以对所述目标标记语言内容进行编辑处理。2.如权利要求1所述的视频内容处理方法,其特征在于,所述获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数,包括:获取所述目标图像中的文字在所述目标图像中的显示参数。3.如权利要求2所述的视频内容处理方法,其特征在于,所述根据所述显示参数将所述目标元素转换为对应的目标标记语言内容包括:对所述文字进行识别,获取文字内容;根据所述文字内容和所述显示参数将所述文字转换为对应的目标标记语言内容。4.如权利要求1所述的视频内容处理方法,其特征在于,所述获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数,包括:获取所述目标图像中的图形在所述目标图像中的显示参数。5.如权利要求1所述的视频内容处理方法,其特征在于,在提取与所述目标区域对应的目标图像输入到预先训练的机器学习模型中进行处理之前,还包括:获取包含样本元素和对应显示参数标记的图像训练样本数据;根据预设的目标函数和所述图像训练样本数据训练预设模型的处理参数,生成所述机器学习模型。6.如权利要求1所述的视频内容处理方法,其特征在于,在获取所述目标图像中的各类型的目标元素在所述目标图像中的显示参数之后,还包括:在所述视频帧中将所述目标元素绘制为选中状态。7.如权利要求1所述的视频内容处理方法,其特征在于,所述根据所述显示参数将所述目标元素转换为对应的目标标记语言内容包括:根据所述显示参数将所述目标元素按照在所述目标图像中的布局进行排版,并转换为对应的目标标记语言内容;将所述目标标记语言内容存储到操作系统的内存剪切板中。8.一种视频内容处理装置,其特征在于,...

【专利技术属性】
技术研发人员:王群
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1