一种图像编辑方法、装置、设备和介质制造方法及图纸

技术编号：41329717 阅读：4 留言：0更新日期：2024-05-13 15:08

本发明专利技术涉及一种图像编辑方法、装置、设备和介质，属于图像处理技术领域，解决了现有技术中操作复杂、智能化低的问题。图像编辑方法包括：获取待编辑图像和指示文本；将所述指示文本输入到自然语言模型中，以提取所述指示文本对应的关键词；将所述待编辑图像和所述关键词输入到图像编辑模型，所述图像编辑模型包括多个子模型；根据所述关键词选择相应的子模型处理所述待编辑图像，得到中间图像，并通过梯度下降法优化所述子模型的目标函数，得到所述图像编辑模型的初始参数；所述图像编辑模型根据所述初始参数和所述中间图像得到最优参数和最终图像。本发明专利技术实现了图像的智能化编辑，操作简单。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理，具体而言涉及一种图像编辑方法、装置、设备和介质。

技术介绍

1、随着社会的发展，图像编辑技术在现代数字时代中应用广泛，涵盖了多个领域和行业，在日常生活、娱乐、商业和科学研究都有着重要作用；很多图像编辑软件应运而生，为用户提供了丰富的图像编辑功能，让用户能够轻松地处理图像。

2、传统图像编辑软件使用需要一定的技能和经验，初学者需要耗费大量时间来学习软件的操作流程和工具使用方法，且手动操作容易引起误差，处理大批量的图像时，需要的工作量巨大；现有的图像编辑技术需要用户根据不同需求手动配置神经网络模型，存在操作复杂、智能化低等技术问题。

技术实现思路

1、鉴于上述的分析，本专利技术实施例旨在提供一种图像编辑方法、装置、设备和介质，用以解决现有技术中存在的上述问题中的一者或多者。

2、本专利技术的目的是这样实现的：

3、本专利技术第一方面实施例提供一种图像编辑方法，包括：

4、获取待编辑图像和指示文本；

5、将所述指示文本输入到自然语言模型中，以提取所述指示文本对应的关键词；

6、将所述待编辑图像和所述关键词输入到图像编辑模型，所述图像编辑模型包括多个子模型；根据所述关键词选择相应的子模型处理所述待编辑图像，得到中间图像，并通过梯度下降法优化所述子模型的目标函数，得到所述图像编辑模型的初始参数；

7、所述图像编辑模型根据所述初始参数和所述中间图像得到最优参数和最终图像；

9、进一步地，所述将所述指示文本输入到自然语言模型中进行提取，得到所述指示文本对应的关键词，包括：将所述指示文本进行分词，得到子词；将所述子词进行向量化处理，得到文本嵌入向量；计算所述文本嵌入向量的重要性值，并设置一个重要性值预设阈值；将所述重要性值大于所述预设阈值的所述文本嵌入向量对应的所述子词设为所述关键词，所述关键词包括图像中待编辑的位置信息、编辑类型信息和目标输出信息。

10、进一步地，所述根据所述关键词选择相应的子模型处理所述待编辑图像，得到中间图像，包括：根据所述位置信息定位所述待编辑图像中的待编辑区域；根据所述编辑类型信息和所述目标输出信息处理所述待编辑图像中的所述待编辑区域，并生成所述中间图像。

11、进一步地，所述子模型包括去噪子模型，所述去噪子模型的目标函数表示如下：

12、

13、其中，θ表示所述初始参数，y表示所述中间图像，fθ(·)表示所述物理干涉单元，is表示所述待编辑图像，β表示调整系数，g(·)表示上采样滤波器，表示正则化项。

14、进一步地，所述子模型还包括超分辨率子模型，所述超分辨率子模型的目标函数表示如下：

15、

16、其中，θ表示所述初始参数，y表示所述中间图像，d(·)表示下采样滤波器，fθ(·)表示所述物理干涉单元，is表示所述待编辑图像，β表示调整系数，g(·)表示上采样滤波器，表示正则化项。

17、进一步地，所述子模型还包括修复子模型，所述修复子模型的目标函数表示如下：

18、

19、其中，m表示待修复的区域，fθ(·)表示所述物理干涉单元，is表示所述待编辑图像，表示正则化项。

20、进一步地，所述正则化项表示如下：

21、

22、其中，γ1和γ2分别表示l1范数和l2范数的系数。

23、本专利技术第二方面实施例提供一种图像编辑装置，包括：

24、获取模块，用于获取待编辑图像和指示文本；

25、提取模块，用于将所述指示文本输入到自然语言模型中，以提取所述指示文本对应的关键词；

26、处理模块，用于将所述待编辑图像和所述关键词输入到图像编辑模型，所述图像编辑模型包括多个子模型；根据所述关键词选择相应的子模型处理所述待编辑图像，得到中间图像，并通过梯度下降法优化所述子模型的目标函数，得到所述图像编辑模型的初始参数；

27、输出模块，用于所述图像编辑模型根据所述初始参数和所述中间图像得到最优参数和最终图像；

28、其中，所述图像编辑模型包括物理干涉单元和生成单元；所述物理干涉单元用于模拟物理干扰；所述生成单元用于根据真实场景，以生成图像。

29、本专利技术第三方面实施例提供一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现任一实施例所述的图像编辑方法。

30、本专利技术第四方面实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现任一实施例所述的图像编辑方法。

31、与现有技术相比，本专利技术至少可实现如下有益效果之一：

32、本专利技术提供的图像编辑方法，通过图像编辑模型根据输入的指示文本的关键词，选择相应的子模型处理待编辑图像，实现了图像的智能化编辑，操作简单。

本文档来自技高网...

【技术保护点】

1.一种图像编辑方法，其特征在于，包括：

2.根据权利要求1所述的图像编辑方法，其特征在于，所述将所述指示文本输入到自然语言模型中进行提取，得到所述指示文本对应的关键词，包括：

3.根据权利要求2所述的图像编辑方法，其特征在于，所述根据所述关键词选择相应的子模型处理所述待编辑图像，得到中间图像，包括：

4.根据权利要求1所述的图像编辑方法，其特征在于，所述子模型包括去噪子模型，所述去噪子模型的目标函数如下所示：

5.根据权利要求1所述的图像编辑方法，其特征在于，所述子模型还包括超分辨率子模型，所述超分辨率子模型的目标函数如下所示：

6.根据权利要求1所述的图像编辑方法，其特征在于，所述子模型还包括修复子模型，所述修复子模型的目标函数如下所示：

7.根据权利要求4或5或6所述的图像编辑方法，其特征在于，所述正则化项表示如下：

8.一种图像编辑装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现

10.一种存储介质，其特征在于，其上存储有计算机程序，所述程序被处理器执行时，实现权利要求1-7任一项所述的图像编辑方法。

...

【技术特征摘要】

1.一种图像编辑方法，其特征在于，包括：

2.根据权利要求1所述的图像编辑方法，其特征在于，所述将所述指示文本输入到自然语言模型中进行提取，得到所述指示文本对应的关键词，包括：

3.根据权利要求2所述的图像编辑方法，其特征在于，所述根据所述关键词选择相应的子模型处理所述待编辑图像，得到中间图像，包括：

4.根据权利要求1所述的图像编辑方法，其特征在于，所述子模型包括去噪子模型，所述去噪子模型的目标函数如下所示：

5.根据权利要求1所述的图像编辑方法，其特征在于，所述子模型还包括超分辨率子模型，所述超分辨率子模型的目标函数如下所示：<...

【专利技术属性】
技术研发人员：王倪剑桥，张鹏，
申请(专利权)人：北京智谱华章科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人