一种根据音频输入类型动态调整字幕与翻译模式的方法技术

技术编号：46289205 阅读：7 留言：0更新日期：2025-09-02 21:20

本发明专利技术提供一种根据音频输入类型动态调整字幕与翻译模式的方法，采集多个来源的音频数据并预处理；基于智能音频信号分类算法构建音频分类模型并训练，划分音频数据的类别；将当前音频输入到音频分类模型中，确定当前音频所处的类别；构建音频类别、字幕与翻译模式两者的映射关系，根据当前音频所处的类别匹配对应的字幕与翻译模式，并实时显示字幕与翻译内容；基于当前音频所匹配到的字幕与翻译模式，自动隐藏相关选项设置；能够实时检测当前音频所处的类别，并根据音频类别动态调整字幕与翻译模式，根据字幕与翻译模式自动隐藏或是显示相关选项设置，减少不必要的设置选项，优化用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及音频领域，尤指一种根据音频输入类型动态调整字幕与翻译模式的方法。

技术介绍

1、在当前的音频处理技术应用中，用户界面往往呈现出繁多的选项设置，这一状况给用户带来了诸多困扰。以一款通用的音频编辑软件为例，其界面上布满了各类功能选项，从复杂的音频参数调节，如采样率、比特率的设置，到多种针对不同使用场景的特殊功能选项，像专业音频录制时的降噪模式选择、音乐创作中的和弦编辑选项等。对于普通用户而言，众多的选项不仅让人眼花缭乱，还增加了操作的难度与学习成本。例如，一位只想简单剪辑一段语音音频的用户，却要在满屏的选项中艰难寻找所需功能，那些针对音乐音频的复杂特效选项、专辑封面相关设置等，在处理语音时毫无用处，却占据了大量屏幕空间，使得界面显得极为混乱。

2、如何根据不同来源的音频，智能地自动隐藏或显示一些选项设置，是当前亟待解决的问题，例如，对于语音音频，界面上仅展示与语音处理相关的选项，自动隐藏与音乐相关的选项，对于音乐音频，界面上仅展示与音乐相关的选项，自动隐藏与语音处理相关的选项，这样用户界面得以极大简化，去除了不必要...

【技术保护点】

1.一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤S1中，为每个音频采集源分配唯一识别码，将其与音频采集设备或数据源的相关信息进行关联存储。

3.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤S2中，采用隐马尔可夫模型对不同来源的音频进行分类，具体过程包括：

4.根据权利要求3所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤S2中，选用梅尔频率倒谱系数进行特...

【技术特征摘要】

1.一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤s1中，为每个音频采集源分配唯一识别码，将其与音频采集设备或数据源的相关信息进行关联存储。

3.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤s2中，采用隐马尔可夫模型对不同来源的音频进行分类，具体过程包括：

4.根据权利要求3所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤s2中，选用梅尔频率倒谱系数进行特征提取，对提取的特征进行归一化处理，并将经过特征提取和归一化处理后的每一帧音频特征向量依次排列，形成观测序列。

5.根据权利要求3所述的一种根据音频输入类型动态调整字幕与翻译模式的方法，其特征在于，所述步骤s2中，使用baum-welch算法对模型参...

【专利技术属性】
技术研发人员：周瞳，何仲春，罗益峰，
申请(专利权)人：广州朗国电子科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人