图像处理方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:33998998 阅读:17 留言:0更新日期:2022-07-02 11:38
本发明专利技术公开了一种图像处理方法、装置、存储介质及计算机设备。其中,该方法包括:获取图像;提取图像的视觉特征,其中,视觉特征包括图像上的一个或多个特征区域,一个或多个特征区域用于体现图像的信息内容;根据视觉特征,确定图像的裁切框;根据裁切框对图像进行裁切,得到裁切后的图像。本发明专利技术解决了相关技术中,对图像进行裁切时,存在裁切不准确的技术问题。题。题。

【技术实现步骤摘要】
图像处理方法、装置、存储介质及计算机设备


[0001]本专利技术涉及图像处理领域,具体而言,涉及一种图像处理方法、装置、存储介质及计算机设备。

技术介绍

[0002]处理图像时,常常需要对画幅进行调整。例如,对原图像进行拉伸压缩的放缩处理,或者采用居中裁切的方式对原图像进行裁切,进而得到裁切后的图像。然而,图像中的视觉内容千变万化,十分复杂,在相关技术中,调整画幅后经常得不到高质量的图像,图像画面的内容与构图存在扭曲、缺失等问题。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种图像处理方法、装置、存储介质及计算机设备,以至少解决相关技术中,对图像进行裁切时,存在裁切不准确的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种图像处理方法,包括:获取图像;提取所述图像的视觉特征,其中,所述视觉特征包括所述图像上的一个或多个特征区域,所述一个或多个特征区域用于体现所述图像的信息内容;根据所述视觉特征,确定所述图像的裁切框;根据所述裁切框对所述图像进行裁切,得到裁切后的图像。
[0006]可选地,根据所述视觉特征,确定所述图像的裁切框,包括:在所述视觉特征包括多个特征区域的情况下,为所述多个特征区域分配不同的权值,其中,权值的大小表征特征区域的重要性;根据分配权值后的多个特征区域,确定所述图像的裁切框,其中,所述裁切框中包括所述多个特征区域中权值最大的特征区域。
[0007]可选地,根据分配权值后的多个特征区域,确定所述图像的裁切框,包括:将所述多个特征区域以不同的权值融合形成热力图,其中,所述热力图中不同颜色代表不同权值的特征区域;根据所述热力图确定所述裁切框的大小和位置。
[0008]可选地,根据所述裁切框对所述图像进行裁切,得到裁切后的图像,包括:在所述裁切框超出所述图像本身的情况下,确定所述裁切框超出所述图像的超出部分;根据所述裁切框对所述图像进行裁切后,对所述超出部分进行填充,得到裁切后的图像。
[0009]可选地,在所述图像包括多个镜头图像,所述多个镜头图像由视频切割得到的情况下,所述方法还包括:对裁切后的多个镜头图像进行拼接,得到裁切后的视频。
[0010]可选地,在对裁切后的多个镜头图像进行拼接,得到裁切后的视频之前,还包括:对所述多个镜头图像中每个镜头图像中的裁切框采用样条线插值法进行平滑处理,得到平滑处理后的裁切框,其中,平滑处理后的裁切框用于进行裁切,得到裁切后的多个镜头图像。
[0011]可选地,提取所述图像的视觉特征,包括:将所述图像输入图像特征模型,得到所述图像的视觉特征,其中,所述图像特征模型采用第一数据集进行机器学习得到,所述第一
数据集中的训练数据包括:图像和图像的视觉特征。
[0012]可选地,所述图像包括预定对象的多个素材图像,在根据所述裁切框对所述图像进行裁切,得到裁切后的图像之后,还包括:将裁切后的多个素材图像中的每个素材图像输入图像特效模型,得到裁切后的每个素材图像的特效图像,其中,所述图像特效模型采用第二数据集进行机器学习得到,所述第二数据集中的训练数据包括:素材图像和素材图像的特效图像;将多个素材图像对应的特效图像进行拼接,得到所述预定对象的视频。
[0013]可选地,将多个素材图像对应的特效图像进行拼接,得到所述预定对象的视频,包括:将多个素材图像对应的特效图像在显示界面上进行显示;接收对所述多个素材图像对应的特效图像进行调整的调整操作;响应所述调整操作,对所述多个素材图像对应的特效图像进行调整,得到调整后的多个特效图像;将调整后的多个特效图像进行拼接,得到所述预定对象的视频。
[0014]根据本专利技术实施例的另一个方面,还提供了一种图像处理方法,包括:在交互界面上显示图像;在所述交互界面上显示所述图像的视觉特征,其中,所述视觉特征包括所述图像上的一个或多个特征区域,所述一个或多个特征区域用于体现所述图像的信息内容;在所述交互界面上显示所述图像的裁切框,其中,所述裁切框根据所述视觉特征确定;在所述交互界面上显示裁切结果,其中,所述裁切结果根据所述裁切框对所述图像进行裁切得到。
[0015]根据本专利技术实施例的又一个方面,还提供了一种图像处理装置,包括:第一获取模块,用于获取图像;提取模块,用于提取所述图像的视觉特征,其中,所述视觉特征包括所述图像上的一个或多个特征区域,所述一个或多个特征区域用于体现所述图像的信息内容;确定模块,用于根据所述视觉特征,确定所述图像的裁切框;裁切模块,用于根据所述裁切框对所述图像进行裁切,得到裁切后的图像。
[0016]根据本专利技术实施例的再一个方面,还提供了一种图像处理装置,包括:第一显示模块,用于在交互界面上显示图像;第二显示模块,用于在所述交互界面上显示所述图像的视觉特征,其中,所述视觉特征包括所述图像上的一个或多个特征区域,所述一个或多个特征区域用于体现所述图像的信息内容;第三显示模块,用于在所述交互界面上显示所述图像的裁切框,其中,所述裁切框根据所述视觉特征确定;第四显示模块,用于在所述交互界面上显示裁切结果,其中,所述裁切结果根据所述裁切框对所述图像进行裁切得到。
[0017]根据本专利技术实施例的再一个方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的图像处理方法。
[0018]根据本专利技术实施例的再一个方面,还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序;所述处理器,用于执行所述存储器中存储的计算机程序,所述计算机程序运行时使得所述处理器执行上述任意一项所述的图像处理方法。
[0019]根据本专利技术实施例的再一个方面,还提供了一种图像处理方法,包括:获取对象的素材;采用人工智能识别算法识别出所述素材的信息;根据所述素材的信息,采用人工智能视觉算法对所述素材进行视觉处理,得到所述对象的视频。
[0020]可选地,在所述素材为图像素材的情况下,采用所述人工智能识别算法识别出所述素材的信息,包括以下至少之一:采用所述人工智能识别算法中的类别算法识别出所述图像素材所属的类别;采用所述人工智能识别算法中的位置算法识别出所述图像素材中目
标物的位置;采用所述人工智能识别算法中的特征算法识别出所述图像素材中的显著区域;采用所述人工智能识别算法中的打分算法识别出所述图像素材的美学打分。
[0021]可选地,采用人工智能视觉算法对所述素材进行视觉处理,包括以下至少之一:采用人工智能视觉算法,对所述素材进行筛选,对图像素材中的目标物进行裁切,对多种类型的素材进行编排,对图像素材进行渲染。
[0022]可选地,通过交互设备输出中间结果,其中,所述中间结果包括以下至少之一:采用所述人工智能识别算法识别出的所述素材的信息的结果,采用所述人工智能视觉算法对所述素材进行视觉处理的结果。
[0023]根据本专利技术实施例的再一个方面,还提供了一种图像处理装置,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,包括:获取图像;提取所述图像的视觉特征,其中,所述视觉特征包括所述图像上的一个或多个特征区域,所述一个或多个特征区域用于体现所述图像的信息内容;根据所述视觉特征,确定所述图像的裁切框;根据所述裁切框对所述图像进行裁切,得到裁切后的图像。2.根据权利要求1所述的方法,其特征在于,根据所述视觉特征,确定所述图像的裁切框,包括:在所述视觉特征包括多个特征区域的情况下,为所述多个特征区域分配不同的权值,其中,权值的大小表征特征区域的重要性;根据分配权值后的多个特征区域,确定所述图像的裁切框,其中,所述裁切框中包括所述多个特征区域中权值最大的特征区域。3.根据权利要求2所述的方法,其特征在于,根据分配权值后的多个特征区域,确定所述图像的裁切框,包括:将所述多个特征区域以不同的权值融合形成热力图,其中,所述热力图中不同颜色代表不同权值的特征区域;根据所述热力图确定所述裁切框的大小和位置。4.根据权利要求1所述的方法,其特征在于,根据所述裁切框对所述图像进行裁切,得到裁切后的图像,包括:在所述裁切框超出所述图像本身的情况下,确定所述裁切框超出所述图像的超出部分;根据所述裁切框对所述图像进行裁切后,对所述超出部分进行填充,得到裁切后的图像。5.根据权利要求1所述的方法,其特征在于,在所述图像包括多个镜头图像,所述多个镜头图像由视频切割得到的情况下,所述方法还包括:对裁切后的多个镜头图像进行拼接,得到裁切后的视频。6.根据权利要求5所述的方法,其特征在于,在对裁切后的多个镜头图像进行拼接,得到裁切后的视频之前,还包括:对所述多个镜头图像中每个镜头图像中的裁切框采用样条线插值法进行平滑处理,得到平滑处理后的裁切框,其中,平滑处理后的裁切框用于进行裁切,得到裁切后的多个镜头图像。7.根据权利要求1所述的方法,其特征在于,提取所述图像的视觉特征,包括:将所述图像输入图像特征模型,得到所述图像的视觉特征,其中,所述图像特征模型采用第一数据集进行机器学习得到,所述第一数据集中的训练数据包括:图像和图像的视觉特征。8.根据权利要求7所述的方法,其特征在于,所述图像包括预定对象的多个素材图像,在根据所述裁切框对所述图像进行裁切,得到裁切后的图像之后,还包括:将裁切后的多个素材图像中的每个素材图像输入图像特效模型,得到裁切后的每个素材图像的特效图像,其中,所述图像特效模型采用第二数据集进行机器学习得到,所述第二
数据集中的训练数据包括:素材图像和素材图像的特效图像;将多个素材图像对应的特效图像进行拼接,得到所述预定对象的视频。9.根据权利要求8所述的方法,其特征在于,将多个素材图像对应的特效图像进行拼接,得到所述预定对象的视频,包括:将多个素材图像对应的特效图像在显示界面上进行显示;接收对所述多个素材图像对应的特效图像进行调整的调整操作;响应所述调整操作,对所述多个素材图像对应的特效图像进行调整,得到调整后的多个特效图像;将调整后的多个特效图像进行拼接,得到所述预定对象的视频。10.一种图像处理方法,其特征在于,包括:在交互界面上显示图像;在所述交互界面上显示所述图像的视觉特征,其中,所述视觉特征包括所述图像上的一个或多...

【专利技术属性】
技术研发人员:高占宁任沛然王攀谢宣松
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1