【技术实现步骤摘要】
本专利技术涉及音频领域,尤指一种根据音频输入类型动态调整字幕与翻译模式的方法。
技术介绍
1、在当前的音频处理技术应用中,用户界面往往呈现出繁多的选项设置,这一状况给用户带来了诸多困扰。以一款通用的音频编辑软件为例,其界面上布满了各类功能选项,从复杂的音频参数调节,如采样率、比特率的设置,到多种针对不同使用场景的特殊功能选项,像专业音频录制时的降噪模式选择、音乐创作中的和弦编辑选项等。对于普通用户而言,众多的选项不仅让人眼花缭乱,还增加了操作的难度与学习成本。例如,一位只想简单剪辑一段语音音频的用户,却要在满屏的选项中艰难寻找所需功能,那些针对音乐音频的复杂特效选项、专辑封面相关设置等,在处理语音时毫无用处,却占据了大量屏幕空间,使得界面显得极为混乱。
2、如何根据不同来源的音频,智能地自动隐藏或显示一些选项设置,是当前亟待解决的问题,例如,对于语音音频,界面上仅展示与语音处理相关的选项,自动隐藏与音乐相关的选项,对于音乐音频,界面上仅展示与音乐相关的选项,自动隐藏与语音处理相关的选项,这样用户界面得以极大简化,去除了不必要
...【技术保护点】
1.一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤S1中,为每个音频采集源分配唯一识别码,将其与音频采集设备或数据源的相关信息进行关联存储。
3.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤S2中,采用隐马尔可夫模型对不同来源的音频进行分类,具体过程包括:
4.根据权利要求3所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤S2中,选用梅
...【技术特征摘要】
1.一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤s1中,为每个音频采集源分配唯一识别码,将其与音频采集设备或数据源的相关信息进行关联存储。
3.根据权利要求1所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤s2中,采用隐马尔可夫模型对不同来源的音频进行分类,具体过程包括:
4.根据权利要求3所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤s2中,选用梅尔频率倒谱系数进行特征提取,对提取的特征进行归一化处理,并将经过特征提取和归一化处理后的每一帧音频特征向量依次排列,形成观测序列。
5.根据权利要求3所述的一种根据音频输入类型动态调整字幕与翻译模式的方法,其特征在于,所述步骤s2中,使用baum-welch算法对模型参...
【专利技术属性】
技术研发人员:周瞳,何仲春,罗益峰,
申请(专利权)人:广州朗国电子科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。