图像处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：24890774 阅读：59 留言：0更新日期：2020-07-14 18:17

本发明专利技术提供了一种图像处理方法、装置、电子设备、计算机可读存储介质，该方法包括：对漫画图片按照漫画格进行分割，生成多个候选图片和多个候选图片之间的第一排列顺序；针对每个候选图片，从候选图片中提取文本信息，以及，生成与文本信息对应的语音信息，以及，基于候选图片的画面内容和文本信息的语义中的至少一个，获取特效信息，以及基于特效信息，对候选图片和语音信息中的至少一个进行编辑，生成与候选图片匹配的具有目标特效的视频片段，其中，目标特效为与特效信息匹配的特效；按照第一排列顺序，对与各候选图片分别匹配的所述视频片段进行拼接，生成与所述漫画图片匹配的目标视频。本发明专利技术能够将已有漫画转换为视频。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、装置、电子设备及计算机可读存储介质
本专利技术涉及图像处理
，特别是涉及一种图像处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着硬件技术的发展，移动智能设备在互联网的占比已经超过PC(PersonalComputer，个人计算机)端。与PC的横屏显示不同，移动设备主要是竖屏显示方式。因此，许多原本适用于PC的信息展示方式已经不适合移动端。以漫画来说，在PC端显示的漫画类型为页漫，由于PC端为宽屏、横屏显示，因此，为了适用于PC端的内容显示，页漫中的漫画格可以横向以及纵向排列，例如如图1所示的页漫，包括6个漫画格，画面内容较为密集；而随着技术的发展，目前移动端已经成为主流终端，由于移动端(例如手机)主要为窄屏、竖屏显示，因此，漫画开发者开发并创作了不同于页漫的条漫，例如如图2所示的条漫，条漫中的漫画格自上而下依次排序，通过连续画面叙述故事，在阅读时由于通过纵向阅读的多格长条形漫画，因此称为条漫画。条漫不同于页漫，条漫的漫画格采用上下结构进行排列，方便用户上下滑动切换显示的漫画格；并且条...

【技术保护点】
1.一种图像处理方法，其特征在于，包括：/n对漫画图片按照漫画格进行分割，生成多个候选图片和所述多个候选图片之间的第一排列顺序；/n针对每个候选图片，从所述候选图片中提取文本信息，以及，生成与所述文本信息对应的语音信息，以及，基于所述候选图片的画面内容和所述文本信息的语义中的至少一个，获取特效信息，以及基于所述特效信息，对所述候选图片和所述语音信息中的至少一个进行编辑，生成与所述候选图片匹配的具有目标特效的视频片段，其中，所述目标特效为与所述特效信息匹配的特效；/n按照所述第一排列顺序，对与各候选图片分别匹配的所述视频片段进行拼接，生成与所述漫画图片匹配的目标视频。/n

【技术特征摘要】
1.一种图像处理方法，其特征在于，包括：
对漫画图片按照漫画格进行分割，生成多个候选图片和所述多个候选图片之间的第一排列顺序；
针对每个候选图片，从所述候选图片中提取文本信息，以及，生成与所述文本信息对应的语音信息，以及，基于所述候选图片的画面内容和所述文本信息的语义中的至少一个，获取特效信息，以及基于所述特效信息，对所述候选图片和所述语音信息中的至少一个进行编辑，生成与所述候选图片匹配的具有目标特效的视频片段，其中，所述目标特效为与所述特效信息匹配的特效；
按照所述第一排列顺序，对与各候选图片分别匹配的所述视频片段进行拼接，生成与所述漫画图片匹配的目标视频。

2.根据权利要求1所述的方法，其特征在于，所述基于所述特效信息，对所述候选图片和所述语音信息中的至少一个进行编辑，生成与所述候选图片匹配的具有目标特效的视频片段，包括：
当所述特效信息包括画面特效时，基于所述画面特效的特效参数对所述候选图片进行编辑，以获取多帧图像，以及，基于所述画面特效的特效参数，获取所述多帧图像的第二排列顺序和各帧图像的显示时长，以及，按照所述第二排列顺序和所述显示时长，将所述多帧图像编辑为第一视频；和/或，当所述特效信息包括音频特效时，在所述语音信息中添加所述音频特效，生成音频数据；
将所述第一视频的视频开始时间和所述音频数据的音频开始时间进行对齐，生成与所述候选图片匹配的具有目标特效的视频片段。

3.根据权利要求1所述的方法，其特征在于，所述基于所述候选图片的画面内容和所述文本信息的语义中的至少一个，获取特效信息，包括：
获取与所述候选图片的目标内容匹配的场景信息和/或剧情信息，其中，所述目标内容为所述候选图片的画面内容和所述文本信息的语义中的至少一个；
获取与所述场景信息和/或所述剧情信息匹配的第一特效信息，以作为所述候选图片的特效信息。

4.根据权利要求1所述的方法，其特征在于，当所述文本信息包括拟声词时，基于所述文本信息的语义，获取特效信息，包括：
获取与所述拟声词匹配的第二特效信息，以作为所述候选图片的特效信息。

5.根据权利要求1所述的方法，其特征在于，当所述文本信息包括与不同对话框匹配的多组文本段时，所述生成与所述文本信息对应的语音信息，包括：
针对每个对话框，基于人物与对话框之间的预设第一对应关系，识别与所述对话框匹配的目标人物；
针对每个目标人物，基于所述漫画图片的人物与音色类型之间...

【专利技术属性】
技术研发人员：王波，张骞，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人