AI语音识别的智能图片生成方法、装置、设备及介质制造方法及图纸

技术编号：37276838 阅读：6 留言：0更新日期：2023-04-20 23:44

本发明专利技术涉及人工智能技术，揭露了一种AI语音识别的智能图片生成方法，包括：获取待识别语音，对所述待识别语音进行降噪处理，得到降噪信号；对所述降噪信号进行数据转化，得到数据信号；对所述数据信号进行特征提取，得到数据特征；获取单词语义库，根据所述单词语义库对所述数据特征进行特征检索，得到所述数据特征对应的单词；在预设的图库中根据所述单词进行关键词搜索，得到目标图片。本发明专利技术还提出一种AI语音识别的智能图片生成装置、电子设备以及存储介质。本发明专利技术可以提高图片生成技术的效率。率。率。

全部详细技术资料下载

【技术实现步骤摘要】
AI语音识别的智能图片生成方法、装置、设备及介质

[0001]本专利技术涉及人工智能
，尤其涉及一种AI语音识别的智能图片生成方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着生物识别技术手段的成熟，已经广泛应用于各个领域，其中图像处理领域为重要应用场景之一。语音是人体的一项基本生理功能，而且具有唯一性和不可复制性，语音识别可以对语音数据进行转换识别成易懂的文字语言数据，通过机器系统学习生成图片。传统的图片生成技术需要经过专业技术人员设计修改，通过扫描仪将数据载入高配置的计算机系统从而完成操作流程，在操作上对人员专业性要求高，流程繁琐导致图片生成时间较长。综上所述，现有图片生成技术存在效率低的问题。

技术实现思路

[0003]本专利技术提供一种AI语音识别的智能图片生成方法、装置、电子设备及计算机可读存储介质，其主要目的在于解决图片生成技术存在效率低的问题。
[0004]为实现上述目的，本专利技术提供的一种AI语音识别的智能图片生成方法，包括：
[0005]获取待识别语音，对所述待识别语音进行降噪处理，得到降噪信号；
[0006]对所述降噪信号进行数据转化，得到数据信号；
[0007]对所述数据信号进行特征提取，得到数据特征；
[0008]获取单词语义库，根据所述单词语义库对所述数据特征进行特征检索，得到所述数据特征对应的单词；
[0009]在预设的图库中根据所述单词进行关键词搜索，得到目标图片。
[0010]可选地，所...

【技术保护点】

【技术特征摘要】
1.一种AI语音识别的智能图片生成方法，其特征在于，所述方法包括：获取待识别语音，对所述待识别语音进行降噪处理，得到降噪信号；对所述降噪信号进行数据转化，得到数据信号；对所述数据信号进行特征提取，得到数据特征；获取单词语义库，根据所述单词语义库对所述数据特征进行特征检索，得到所述数据特征对应的单词；在预设的图库中根据所述单词进行关键词搜索，得到目标图片。2.如权利要求1所述的AI语音识别的智能图片生成方法，其特征在于，所述对所述待识别语音进行降噪处理，得到降噪信号，包括：将所述待识别语音转化为语音信号，并对所述语音信号进行能量计算，得到静音帧和语音帧；对所述静音帧进行功率谱值计算，得到静音帧功率谱值；对所述语音帧进行平均噪声功率谱值计算，得到语音帧功率谱值；将所述语音帧功率谱值与所述静音帧功率谱值进行差值处理，得到降噪功率谱；对所述降噪功率谱进行语音帧转化，得到降噪信号。3.如权利要求2所述的AI语音识别的智能图片生成方法，其特征在于，利用下式对所述语音信号进行能量计算：其中，M表示为所述待识别语音的短时能量；N表示为所述待识别语音的帧长；x
n
表示为所述待识别语音的第n个信号帧；m表示为所述信号帧中的噪声点。4.如权利要求1所述的AI语音识别的智能图片生成方法，其特征在于，所述对所述降噪信号进行数据转化，得到数据信号，包括：按照预设的采样频率对所述降噪信号进行采样，得到采样值；将所述采样值进行量化处理，得到量化数据；将所述量化数据进行编码，得到数据信号。5.如权利要求1所述的AI语音识别的智能图片生成方法，其特征在于，所述对所述数据信号进行特征提取，得到数据特征，包括：对所述数据信号进行切分，得到多个子序列；对所述子序列进行预处理，得到标准序列；将所述标准向量进行卷积计算，得到数...

【专利技术属性】
技术研发人员：汪刚，
申请(专利权)人：中创科技广州有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人