【技术实现步骤摘要】
盲人无障碍电影音频处理方法、装置及存储介质
[0001]本专利技术涉及音频处理领域,尤其是涉及一种盲人无障碍电影音频处理方法、装置及存储介质。
技术介绍
[0002]无障碍电影是专门为了方便残障人士观看的经过加工的电影节目,分为盲人与聋人两种版本。对于盲人观众,在保留电影原声和对白的同时,会适时地插入一些对电影画面内容的解说描述。
[0003]最早这些工作是在电影放映现场人工进行的,志愿者们要拿着话筒一遍遍重复劳动;随着越来越多的社会力量加入,专业制作的无障碍版本电影诞生,这些电影大多以光盘形式传播,不仅减少了志愿者的重复工作,也能让盲人在家就能轻松享受电影的乐趣。
[0004]随着互联网视频的普及,可以线上欣赏的无障碍电影也越来越多,由此诞生了一种新的形式:即在普通的电影版本上,外挂一路解说音轨来实现盲人无障碍电影,该音轨称为AD音轨(Audio Description Track),简称AD轨,其时长与电影正片保持一致。这种形式免去了电影介质的再生产,降低了制作成本。
[0005]采用AD轨的无障碍电影播放过程中,会有两路音轨同时播放,即一路电影音轨与一路解说音轨;在前期录制和制作解说音轨时,解说朗读的段落原则上会避开电影中人物的对白段落,选择较为安静的段落穿插解说,但电影中除了人物对白外,为了烘托气氛往往还有背景音乐、环境声响,在时间轴上不可避免地会与解说朗读的内容重叠,引起听觉掩蔽的现象,导致观众无法很好听清解说内容,影响观赏体验。
[0006]对此,一般播放器会支持AD轨的音 ...
【技术保护点】
【技术特征摘要】
1.一种基于外挂AD音轨的盲人无障碍电影音频处理方法,其特征在于,包括:获取正片的媒体数据流和外挂AD音轨的媒体数据流;基于正片的媒体数据流解析分离得到正片视频帧队列Q
videoES
、正片音频帧队列Q
audioES
,并基于外挂AD音轨的媒体数据流解析分离得到AD轨音频帧队列Q
audioES
,并完成正片视频帧队列Q
videoES
、正片音频帧队列Q
audioES
和AD轨音频帧队列Q
audioES
的时间轴同步;基于正片音频帧队列Q
audioES
提取正片处理段PCM数据帧序列,并基于AD轨音频帧队列Q
audioES
提取AD轨处理段PCM数据帧序列;对AD轨处理段PCM数据帧序列进行语音活动检测,得到每一帧的语音活动状态,其中,所述语音活动状态为活动或不活动;对正片处理段PCM数据帧序列的每一帧计算音量,得到正片音量序列,并对该正片音量序列种的元素逐个计算移动平均值,得到正片平均音量序列;对AD轨处理段PCM数据帧序列中语音活动状态为不活动的帧修改为静音值,并对剩余帧逐个计算移动平均值,得到AD轨平均音量序列;基于语音活动检测结果逐帧调节正片平均音量序列和AD轨平均音量序列;基于处理得到的正片平均音量序列和AD轨平均音量序列生成待播放的音频。2.根据权利要求1所述的一种基于外挂AD音轨的盲人无障碍电影音频处理方法,其特征在于,所述基于语音活动检测结果逐帧调节正片平均音量序列和AD轨平均音量序列,具体包括:初始调节值生成步骤:逐帧确定正片平均音量序列和AD轨平均音量序列中每帧音量的相对调节幅度,得到正片相对调节值序列和AD轨相对调节值序列;音量调节步骤:根据正片相对调节值序列和AD轨相对调节值序列调节正片平均音量序列和AD轨平均音量序列。3.根据权利要求2所述的一种基于外挂AD音轨的盲人无障碍电影音频处理方法,其特征在于,所述正片相对调节值序列和AD轨相对调节值序列中任一帧的调节值的确定过程如下:当该帧的语音活动状态为不活动时,正片相对调节值和AD轨相对调节值均为0;当该帧的语音活动状态为活动时,则计算该帧的正片平均音量和AD轨平均音量的差值:若该帧的正片平均音量和AD轨平均音量的差值小于
‑
10,则正片相对调节值和AD轨相对调节值均为0;若该帧的正片平均音量和AD轨平均音量的差值小于在
‑
10到0之间,AD轨相对调节值为0,正片相对调节值为D
movie
=L
AD
'(t)
‑
...
【专利技术属性】
技术研发人员:沈德荣,佘奕龙,潘磊,邱志飞,魏祯,
申请(专利权)人:百视通网络电视技术发展有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。