用于数字音频信号和数字音频/视频信号的时标修改方法和通过使用该方法的数字电视信号?技术

技术编号:3055095 阅读:255 留言:0更新日期:2012-04-11 18:40
问题:需要能够确保时标被修改的音频信号和视频信号之间的同步的方法。解决方案:当分析移位Sa=Ss/α具有小数值时,分别选择最接近该小数值的两个自然数作为修改后的分析间隔Sa’和补偿后的分析间隔Sa”,其中Ss是合成移位,而α是指定的时标(可变速度比)。在通过将源音频样本划分为重叠的连续分析窗口来改变重放速度的源音频样本的时标修改中,只要满足预定条件,就交替地应用修改后的分析间隔Sa’和补偿后的分析间隔Sa”。累积估算的重放时间和时标被修改的音频信号的实际重放时间之间的时差。满足预定条件的情况是累积时差超过允许误差范围的上限阈值或下限阈值的情况。在改变AV信号的重放速度的处理中,如果给定重放速度改变的视频信号的实际可变速度比作为音频信号的目标可变速度比来改变音频信号的重放速度,则可以获得视频信号和音频信号之间的同步。通过将该技术应用到数字TV或TV电话,可以连续观看电话中断时间的广播信号。通过在从过去或现在初始化的低速模式重放后还可以通过高速重放模式赶上当前正在接收的广播信号。(*该技术在2024年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数字音频信号的时标(time-scale)修改(“TSM”)。特别地,本专利技术涉及时标修改方法,其中在TSM处理之后,可以几乎与预定的时标(或可变速度比率)成精确比例地修改数字音频信号的再现时间,由此在再现时几乎完全保持多媒体信号的时标再现中的视频和音频信号之间的同步。
技术介绍
由于引进了叠加-添加(overlap-add)(“OLA”)方法,用于在时域中修改数字音频信号的再现速度的方法已经被发展为同步的叠加和添加(“SOLA”)方法和基于波形相似性的叠加和添加(“WSOLA”)方法,它们都基于OLA。这些技术的基本原理在于通过分析并同步输入音频数据流来修改原始数字音频信号的时标。根据TSM方法的基本概念,当将输入音频信号的数据流分段为连续的预定大小的多个窗口(帧)时,相邻窗口(帧)相互重叠所分配的长度(分析步骤)。然后,如果给定了时标α的值(用户分配的正常再现速度与所修改的再现速度的比率),则取决于α的值重新计算并添加在分析步骤期间获得的多个窗口中的相邻窗口的重叠区域。换句话说,根据时标α的值,在压缩或扩展相邻窗口的重叠区域后连接窗口。当合成窗口时,加权系数被本文档来自技高网...

【技术保护点】
一种用于数字音频信号的时标修改方法,其中将输入信号的音频采样流分段为多个重叠分析窗口,将重叠区域的长度改变为对应于所分配的时标α的长度,加权合成重叠区域,由此被转换为时标输出信号,该方法包括步骤:a)定义从输入音频采样的第mSa采样 (m:周期索引)开始的N+Kmax个采样作为当前周期m的分析窗口W↓[m],其中如果期望的合成间隔Ss除以时标α所得的值是自然数,则分配该值作为分析间隔Sa,而如果是小数,则分别分配最接近该小数的两个自然数作为修改后的分析间隔Sa’和补偿后的分析间隔Sa”,每次当满足特定的期望条件时,交替地应用修改后的分析间隔Sa’和补偿后的分析间隔Sa”来代替分析...

【技术特征摘要】
【国外来华专利技术】KR 2003-11-11 10-2003-00796101.一种用于数字音频信号的时标修改方法,其中将输入信号的音频采样流分段为多个重叠分析窗口,将重叠区域的长度改变为对应于所分配的时标α的长度,加权合成重叠区域,由此被转换为时标输出信号,该方法包括步骤a)定义从输入音频采样的第mSa采样(m周期索引)开始的N+Kmax个采样作为当前周期m的分析窗口Wm,其中如果期望的合成间隔Ss除以时标α所得的值是自然数,则分配该值作为分析间隔Sa,而如果是小数,则分别分配最接近该小数的两个自然数作为修改后的分析间隔Sa’和补偿后的分析间隔Sa”,每次当满足特定的期望条件时,交替地应用修改后的分析间隔Sa’和补偿后的分析间隔Sa”来代替分析间隔Sa;b)当在来自输出音频采样的末尾的OV个采样和与之重叠的当前周期分析窗口的OV个采样之间显示出最高的波形相似性时,计算当前周期分析窗口Wm的移位值Km,同时将当前周期分析窗口Wm的起始点移位特定预定数量个采样,该预定数量在被定义为从前一周期m-1的输出信号的末尾开始计算的第OV+1采样开始的Kmax个采样的搜索范围内;c)定义从当前周期分析窗口的前端第Km+1采样开始的N个采样作为要添加到当前周期的附加帧,其中通过将从附加帧的前端开始的OV个采样叠加到从前一周期帧的末尾开始的OV个采样来合成当前周期m的输出信号;和d)累积当前周期m的输出信号的实际再现时间和由时标α计算出的推算再现时间之间的误差,其中当累积误差偏离允许误差范围的上限或下限时,认为满足特定的期望条件。2.如权利要求1所述的修改方法,还包括步骤时标α改变时,基于改变后的时标重新计算分析间隔Sa,其中使用改变后的时标和重新计算出的分析间隔Sa处理时标修改。3.如权利要求1或2所述的修改方法,其中时标α包括由用户输入装置分配的时标,或通过与视频信号的时标修改一起执行的视频信号的时标处理提供的视频信号的实际时标。4.如权利要求1所述的修改方法,其中当在每个周期在搜索范围Kmax中移位分析窗口Wm时跳过多个采样。5.如权利要求1到4中任意一个所述的修改方法,其中通过由从前一周期帧的末尾开始的特定数量个采样组成的重叠区域和与前一周期帧重叠的当前周期的当前周期分析窗口Wm的特定数量个采样之间的交叉相关性来确定波形相似性。6.如权利要求5所述的修改方法,其中在前一周期帧的采样和当前分析窗口中,选择其索引为k(k大于2的自然数)的倍数的采样并将其参与到交叉相关性的计算中。7.一种用于数字音频/视频信号的时标修改方法,其中输入数字音频/视频信号被分离为音频信号和视频信号,使用相同的时标α时标每个信号,该方法包括步骤a)周期地计算通过基于时标α时标视频信号所获得的时标的视频信号的实际时标;b)确定时标的视频信号的当前周期的实际时标是否与前一周期的时标不同,其中如果不同,则将当前周期的实际时标作为目标时标α’,目标时标α’成为用于音频信号的时标修改的参考;和c)将输入音频信号的采样流分段为多个重叠分析窗口,将重叠区域的长度改变为对应于目标时标α’的长度,加权合成重叠区域,由此修改为时标的输出音频信号。8.如权利要求7所述的时标修改方法,其中步骤c)包括步骤a)定义从输入音频采样的第mSa采样(m周期索引)开始的N+Kmax个采样作为当前周期m的分析窗口Wm,其中如果期望的合成间隔Ss除以时标α所得的值是自然数,则分配该值作为分析间隔Sa,而如果是小数,则分别分配最接近该小数的两个自然数作为修改后的分析间隔Sa’和补偿后的分析间隔Sa”,每次当满足特定的期望条件时,交替地应用修改后的分析间隔Sa’和补偿后的分析间隔Sa”来代替分析间隔Sa;b)当在来自输出音频采样的末尾的OV个采样和与之重叠的当前周期分析窗口的OV个采样之间显示出最高的波形相似性时,计算当前周期分析窗口Wm的移位值Km,同时将当前周期分析窗口Wm的起始点移位特定预定数量个采样,该预定数量在被定义为从前一周期m-1的输出信号的末尾开始计算的第OV+1采样开始的Kmax个采样的搜索范围内;c)定义从当前周期分析窗口的前端第Km+1采样开始的N个采样作为要添加到当前周期的附加帧,其中通过将从附加帧的前端开始的OV个采样叠加到从前一周期帧的末尾开始的OV个采样来合成当前周期m的输出信号;和d)累积当前周期m的输出信号的实际再现时间和时标α’计算的推算再现时间之间的误差,其中当累积误差偏离允许误差范围的上限或下限时,认为满足特定的期望条件。9.如权利要求1、7或8所述的时标修改方法,其中视频信号的实际时标是从过去的某个点T1到当前时间T2的流逝时间T2-T1与过去的某个点T1中的时标视频帧的时间标签TS1到当前时间T2中的时标的视频帧的当前时间标签TS2的流逝时间TS2-TS1之间的比率。10.如权利要求7或8所述的时标修改方法,其中确定允许误差范围的上限和下限在误差范围内,使得在音频和视频时标的再现期间不会识别出信号之间的不同步。11.如权利要求8所述的时标修改方法,其中当在每个周期在搜索范围Kmax中移位分析窗口Wm时跳过多个采样。12.如权利要求8所述的时标修改方法,其中通过由从前一周期帧的末尾开始的特定数量个采样组成的重叠区域和与前一周期帧重叠的当前周期分析窗口Wm的特定数量个采样之间的交叉相关性来确定波形相似性。13.如权利要求12所述的时标修改方法,其中在每个前一周期帧的所有采样和当前分析窗口中,选择其索引为k(k大于2的自然数)的倍数的采样并将其参与到交叉相关性的计算中。14.一种使...

【专利技术属性】
技术研发人员:崔元龙
申请(专利权)人:科斯莫坦股份有限公司
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1