音频处理方法、装置、设备及可读存储介质制造方法及图纸

技术编号：29041340 阅读：27 留言：0更新日期：2021-06-26 05:51

本发明专利技术公开了一种音频处理方法、装置、设备及可读存储介质，所述方法包括：获取待处理音频，并将所述待处理音频转换为目标文本；对所述目标文本进行特征提取，以获得所述目标文本对应的文本特征数据；通过预设手语手势转换模型获取所述文本特征数据对应的目标手语手势图像，并显示所述目标手语手势图像，由此将音频转化为相应的手语手势图像，从而提高了信息传输方式的多样性，进而提升用户体验。进而提升用户体验。进而提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、设备及可读存储介质

[0001]本专利技术涉及音频处理
，尤其涉及一种音频处理方法、装置、设备及可读存储介质。

技术介绍

[0002]信息本身是无形的，如果要使信息能被人理解和接受，必须将信息通过一定的方法表示出来，例如电视剧在播放视频或新闻信息时，通常采用视频结合音频或文字的方式进行信息传输，信息传输方式过于单一。
[0003]然而据最新研究数据表明，中国听障人群数量达到2.2亿，中度以上听力损失的有7000多万，由于目前大多数播放终端进行视频播放时仅支持音频播放，例如主流媒体的新闻直播节目大部分是不配手语播音员的同步播报及文字同步播报，即目前由于信息传输方式比较单一，而导致该类人员观看新闻直播节目时无法理解新闻内容，从而影响该类人员观看体验。
[0004]上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

[0005]本专利技术的主要目的在于提供一种音频处理方法、装置、设备及可读存储介质，旨在解决目前信息传输方式过于单一而影...

【技术保护点】

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述音频处理方法包括以下步骤：获取待处理音频，并将所述待处理音频转换为目标文本；对所述目标文本进行特征提取，以获得所述目标文本对应的文本特征数据；通过预设手语手势转换模型获取所述文本特征数据对应的目标手语手势图像，并显示所述目标手语手势图像。2.如权利要求1所述的音频处理方法，其特征在于，所述将所述待处理音频转换为目标文本的步骤包括：对所述待处理音频进行人声提取，以获得待处理音频中的目标人声音频；对所述目标人声音频进行语义识别，以获得目标文本。3.如权利要求2所述的音频处理方法，其特征在于，所述对所述待处理音频进行人声提取，以获得待处理音频中的目标人声音频的步骤包括：获取所述待处理音频的音频特征；将所述音频特征输入至预设音频分离模型，以通过所述预设音频分离模型获取所述音频特征对应的音频特征分离结果，其中，所述音频特征分离结果包括目标人声音频特征；基于所述目标人声音频特征获取待处理音频中的目标人声音频。4.如权利要求1所述的音频处理方法，其特征在于，所述通过预设手语手势转换模型获取所述文本特征数据对应的手语手势图像的步骤之前，还包括：获取初始模型及若干个文本训练数据；通过所述初始模型确定所述文本训练数据对应的手语手势预测结果；获取所述文本训练数据对应的手语手势真实结果，并基于所述手语手势预测结果和所述手语手势真实结果确定损失函数；通过梯度下降的方式更新所述初始模型的模型参数，并将所述损失函数收敛或模型训练轮次达到预设训练迭代轮次时对应的模型参数作为最终模型参数；根据所述最终模型参数确定预设手语手势转换模型。5.如权利要求1所述的音频处理方法，其特征在于，所述将所述待处理音频转换为目标文本的步骤之后，还包括：对所述目标文本进行分词处理，以获得所述目标文本对应的多组文本分词；分别对各组所述文本分词进行语义识别，以获得...

【专利技术属性】
技术研发人员：田园，
申请(专利权)人：深圳创维RGB电子有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人