一种处理图像的方法、装置及介质制造方法及图纸

技术编号:28445680 阅读:14 留言:0更新日期:2021-05-15 21:06
本文公开了一种处理图像的方法、装置及介质,此方法包括:在取景模式下显示实时图像;获取麦克风采集的语音数据;识别所述语音数据;在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上。本文可以为用户提供娱乐性视觉效果,提高软件的趣味性,提高用户的使用体验,还可以在节日时增强节日氛围。在节日时增强节日氛围。在节日时增强节日氛围。

【技术实现步骤摘要】
一种处理图像的方法、装置及介质


[0001]本文涉及移动终端数据处理
,尤其涉及一种处理图像的方法、装置及介质。

技术介绍

[0002]随着终端软件的智能程度不断提高,语音助手也可以为用户提供越来越多的语音控制功能。用户对图像处理类软件的智能化需求也越来越高。

技术实现思路

[0003]为克服相关技术中存在的问题,本文提供一种处理图像的方法、装置及介质。
[0004]根据本文实施例的第一方面,提供一种用于移动终端的处理图像的方法,包括:
[0005]在取景模式下显示实时图像;
[0006]获取麦克风采集的语音数据;
[0007]识别所述语音数据;
[0008]在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上;
[0009]或者,
[0010]显示通过无线通信链路接收的实时图像;
[0011]获取麦克风采集的语音数据或者通过无线通信链路接收的语音数据;
[0012]识别所述语音数据;
[0013]在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上。
[0014]上述处理图像的方法还具有以下特点:
[0015]所述方法还包括:
[0016]确定所述渲染图像对应的渲染位置,所述渲染位置对应于一主体部位;
[0017]所述将所述渲染图像合成到所述实时图像上,包括:
[0018]检测所述实时图像中目标主体的所述主体部位,将所述渲染图像合成至所述实时图像中所述目标主体的所述主体部位所对应的渲染位置。
[0019]上述处理图像的方法还具有以下特点:
[0020]所述方法还包括:
[0021]确定所述实时图像中目标主体的所述主体部位的面积,根据所述主体部位的面积调整所述渲染图像的大小。
[0022]上述处理图像的方法还具有以下特点:
[0023]所述方法还包括:使用包含预设用语的内容的语音数据集合训练语音识别模型,所述包含预设用语的内容的语音数据集合中的语音的属性包括以下中的多种:不同的性别、不同的语调、不同的环境噪声、不同的音量;
[0024]所述识别所述语音数据,包括:使用所述语音识别模型识别所述语音数据。
[0025]上述处理图像的方法还具有以下特点:
[0026]所述包含预设用语的内容包括节日祝福用语;
[0027]所述方法包括:判断所述语音数据的语音内容中是否包括节日祝福用语,所述判断所述语音数据的语音内容中包括节日祝福用语,包括:
[0028]判断所述节日祝福用语中的节日是否是公众节日,在所述节日祝福用语中的节日是公众节日时,判断当前日期是否对应于所述公众节日,在当前日期对应于所述公众节日时,确定所述语音数据的语音内容中包括节日祝福用语;在所述节日祝福用语中的节日是非公众节日时,根据日志类软件记录的信息判断当前日期是否对应于所述非公众节日,当前日期对应于所述非公众节日时,确定所述语音数据的语音内容中包括节日祝福用语。
[0029]根据本文实施例的第二方面,还提供了一种处理图像的装置,包括:
[0030]显示模块,用于在取景模式下显示实时图像,或者,显示通过无线通信链路接收的实时图像;
[0031]获取模块,用于获取麦克风采集的语音数据或者通过无线通信链路接收的语音数据;
[0032]识别模块,用于识别所述语音数据;
[0033]第一确定模块,在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像;
[0034]第一合成模块,用于将所述渲染图像合成到所述实时图像上。
[0035]上述处理图像的装置还具有以下特点:
[0036]所述装置还包括:
[0037]第二确定模块,用于确定所述渲染图像对应的渲染位置,所述渲染位置对应于一主体部位;
[0038]所述第一合成模块包括:
[0039]检测模块,用于所述实时图像中目标主体的所述主体部位;
[0040]第二合成模块,用于将所述渲染图像合成至所述实时图像中所述目标主体的所述主体部位所对应的渲染位置。
[0041]上述处理图像的装置还具有以下特点:
[0042]所述第一合成模块还包括:
[0043]第三确定模块,用于确定所述实时图像中目标主体的所述主体部位的面积;
[0044]调整模块,用于根据所述主体部位的面积调整所述渲染图像的大小。
[0045]上述处理图像的装置还具有以下特点:
[0046]所述装置还包括:
[0047]训练模块,用于使用包含预设用语的内容的语音数据集合训练语音识别模型,所述包含预设用语的内容的语音数据集合中的语音的属性包括以下中的多种:不同的性别、不同的语调、不同的环境噪声、不同的音量;
[0048]所述识别模块,用于使用以下方法识别所述语音数据:使用所述语音识别模型识别所述语音数据。
[0049]上述处理图像的装置还具有以下特点:
[0050]所述包含预设用语的内容包括节日祝福用语;
[0051]所述装置还包括第一判断模块,用于判断所述语音数据的语音内容中是否包括节日祝福用语:
[0052]所述第一判断模块包括:
[0053]第二判断模块,用于判断所述节日祝福用语中的节日是否是公众节日;
[0054]第三判断模块,用于在所述节日祝福用语中的节日是公众节日时,判断当前日期是否对应于所述公众节日,在当前日期对应于所述公众节日时,确定所述语音数据的语音内容中包括节日祝福用语;在所述节日祝福用语中的节日是非公众节日时,根据日志类软件记录的信息判断当前日期是否对应于所述非公众节日,当前日期对应于所述非公众节日时,确定所述语音数据的语音内容中包括节日祝福用语。
[0055]根据本文实施例的第三方面,还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种处理图像的方法,所述方法包括:
[0056]在取景模式下显示实时图像;
[0057]获取麦克风采集的语音数据;
[0058]识别所述语音数据;
[0059]在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上;
[0060]或者,
[0061]显示通过无线通信链路接收的实时图像;
[0062]获取麦克风采集的语音数据或者通过无线通信链路接收的语音数据;
[0063]识别所述语音数据;
[0064]在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上。本文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种处理图像的方法,用于移动终端,其特征在于,包括:在取景模式下显示实时图像;获取麦克风采集的语音数据;识别所述语音数据;在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上;或者,显示通过无线通信链路接收的实时图像;获取麦克风采集的语音数据或者通过无线通信链路接收的语音数据;识别所述语音数据;在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设用语的内容对应的渲染图像,将所述渲染图像合成到所述实时图像上。2.如权利要求1所述的处理图像的方法,其特征在于,所述方法还包括:确定所述渲染图像对应的渲染位置,所述渲染位置对应于一主体部位;所述将所述渲染图像合成到所述实时图像上,包括:检测所述实时图像中目标主体的所述主体部位,将所述渲染图像合成至所述实时图像中所述目标主体的所述主体部位所对应的渲染位置。3.如权利要求2所述的处理图像的方法,其特征在于,所述方法还包括:确定所述实时图像中目标主体的所述主体部位的面积,根据所述主体部位的面积调整所述渲染图像的大小。4.如权利要求1所述的处理图像的方法,其特征在于,所述方法还包括:使用包含预设用语的内容的语音数据集合训练语音识别模型,所述包含预设用语的内容的语音数据集合中的语音的属性包括以下中的多种:不同的性别、不同的语调、不同的环境噪声、不同的音量;所述识别所述语音数据,包括:使用所述语音识别模型识别所述语音数据。5.如权利要求1所述的处理图像的方法,其特征在于,所述包含预设用语的内容包括节日祝福用语;所述方法包括:判断所述语音数据的语音内容中是否包括节日祝福用语,所述判断所述语音数据的语音内容中包括节日祝福用语,包括:判断所述节日祝福用语中的节日是否是公众节日,在所述节日祝福用语中的节日是公众节日时,判断当前日期是否对应于所述公众节日,在当前日期对应于所述公众节日时,确定所述语音数据的语音内容中包括节日祝福用语;在所述节日祝福用语中的节日是非公众节日时,根据日志类软件记录的信息判断当前日期是否对应于所述非公众节日,当前日期对应于所述非公众节日时,确定所述语音数据的语音内容中包括节日祝福用语。6.一种处理图像的装置,其特征在于,包括:显示模块,用于在取景模式下显示实时图像,或者,显示通过无线通信链路接收的实时图像;
获取模块,用于获取麦克风采集的语音数据或者通过无线通信链路接收的语音数据;识别模块,用于识别所述语音数据;第一确定模块,在所述语音数据的语音内容中包括包含预设用语的内容时,确定所述包含预设...

【专利技术属性】
技术研发人员:王倩梁瑀航
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1