一种音频数据可视化处理方法、装置、设备及存储介质制造方法及图纸

技术编号:38564832 阅读:30 留言:0更新日期:2023-08-22 21:03
本发明专利技术提供了一种音频数据可视化处理方法、装置、设备及存储介质,涉及信号处理技术领域。所述音频数据可视化处理方法,包括:获取原始音频数据,对原始音频数据进行特征分类,得到至少一个音频类别;对音频类别进行特征提取,得到特征信息;将特征信息转换为对应的用户界面元素;在获取针对用户界面元素的修改指令时,调整原始音频数据,得到修正音频数据。本发明专利技术能够将原始音频数据通过用户界面元素为用户提供音频视觉化的体验,以使得广大用户能够更加直观地感受和理解音频数据的内容,并通过对用户界面元素的修改,对音频数据进行调整。整。整。

【技术实现步骤摘要】
一种音频数据可视化处理方法、装置、设备及存储介质


[0001]本专利技术涉及信号处理
,具体为一种音频数据可视化处理方法、装置、设备及存储介质。

技术介绍

[0002]音频数据可视化处理是指将音频数据的特征信息通过图像数据表征出来,从而达到音频模态和图像模态互相表达目的的技术手段。随着线上直播行业的兴起,以视频、音频为媒介的信息传递手段得到快速发展,随之诞生了大量视频数据处理、图像数据处理方法,但是现有的音频处理手段较为单调,一般只是将带有音乐的音频数据插入视频中,或将音频中的人声的音色进行替换为其他预设的音色,专业人士会通过音频处理器对音频数据的具体参数进行精细化处理,然而一般用户难以直观地对音频数据进行调整。
[0003]上述对问题的发现过程的描述,仅用于辅助理解本专利技术的技术方案,并不代表上述内容是现有技术。

技术实现思路

[0004]本专利技术的目的在于提供一种音频数据可视化处理方法、装置、设备及存储介质,以解决现有技术中用户难以直观地感受、理解和调整音频数据的技术问题。
[0005]为实现上述目本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种音频数据可视化处理方法,其特征在于,包括:获取原始音频数据,对所述原始音频数据进行特征分类,得到至少一个音频类别;对所述音频类别进行特征提取,得到特征信息;将所述特征信息转换为对应的用户界面元素;在获取针对所述用户界面元素的修改指令时,调整所述原始音频数据,得到修正音频数据。2.根据权利要求1所述的音频数据可视化处理方法,其特征在于,所述获取原始音频数据,对所述原始音频数据进行特征分类,得到至少一个音频类别,包括:对原始音频数据进行特征采样得到特征序列;将所述特征序列输入特征编码器,得到所述特征序列的特征向量;将所述特征向量输入特征解码器,得到至少一个音频类别。3.根据权利要求1所述的音频数据可视化处理方法,其特征在于,所述音频类别包括人声音频和/或乐器音频。4.根据权利要求3所述的音频数据可视化处理方法,其特征在于,所述对所述音频类别进行特征提取,得到特征信息,包括:对所述人声音频进行文本特征提取,得到与时间轴相关的字幕特征。5.根据权利要求4所述的音频数据可视化处理方法,其特征在于,所述对所述人声音频进行文本特征提取,得到与时间轴相关的字幕特征,包括:对所述人声音频进行音色分析,对所述人声音频进行分类提取,得到至少一种对应的分类人声音频;对所述分类人声音频进行文本特征提取,得到所述分类人声音频与时间轴相关的字幕特征。6.根据权利要求5所述的音频数据可视化处理方法,其特征在于,所述在获取针对所述用户界面元素的修改指令时,调整所述原始音频数据,得到修正音频数据,包括:在获取针对所述用户界面元素中对应字幕的修改指令时,根据所述字幕的音色为修改后的字幕对应的音频段进行音频重组,得到修正音频数据。7...

【专利技术属性】
技术研发人员:李泉
申请(专利权)人:深圳市亿晟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1