【技术实现步骤摘要】
本专利技术涉及广播电视领域中一种音视频信息提取装置、方法及包 含这种装置的音视频处理设备,特别是一种能够对音视频节目流对相 关信息进行智能提取的设备和方法。
技术介绍
随着音视频技术及广播电视领域相关技术的发展,新的广播格式 提供了更大的数据容量,同时,人们对清晰度和节目多样性方面要求 越来越高,越来越多的音视频节目内容,通过各种播放终端呈现给用 户。更多的频道,更大的数据量,更加丰富的内容,使得信息的流量 大大增加,为用户在频道选择,数据存储,和有效信息的提取方面带 来了更大的复杂度。在众多的电视节目中,针对不同的用户,每个人的喜好不同,其 收视的时间段、感兴趣的内容以及收视电视节目时的工作状态各有不 同,即使在一个频道/节目播放中,有用户非常关注、并希望进行记录 的,也有更多的、重复的、强加于用户的信息。由于广播方式的特点, 在节目广播中很难为用户提供信息定制。各种各样的信息糅杂在其间, 因此不可避免的对用户产生了大量的冗余信息。此外,有一些节目内 容由于特殊原因,音频与视频会有一定的误差,使得大量的信息之间 的关系更为复杂。针对不同的用户,如何将其关注的电 ...
【技术保护点】
一种音视频处理装置,包括:接收播放信号输出传输流的接收单元;对所述接收单元输出的传输流进行解码的解码单元;接收用户输入的指定内容的用户接口单元,其特征在于,该音视频处理装置还包括:提取规定内容的信息提取单元;和存储所述规定内容的信息存储单元, 所述指定内容包括指定视频内容或指定音频内容的一方,另一方由预先存储的音视频对照关系表来确定, 所述信息提取单元包括: 音频识别单元,从来自所述解码单元的音频流中识别出指定音频内容; 视频识别单元,从来自所述解码单 元的视频流中识别出指定视频内容;和 信息匹配单元,接收来自所述音频识别单元的 ...
【技术特征摘要】
1.一种音视频处理装置,包括接收播放信号输出传输流的接收单元;对所述接收单元输出的传输流进行解码的解码单元;接收用户输入的指定内容的用户接口单元,其特征在于,该音视频处理装置还包括提取规定内容的信息提取单元;和存储所述规定内容的信息存储单元,所述指定内容包括指定视频内容或指定音频内容的一方,另一方由预先存储的音视频对照关系表来确定,所述信息提取单元包括音频识别单元,从来自所述解码单元的音频流中识别出指定音频内容;视频识别单元,从来自所述解码单元的视频流中识别出指定视频内容;和信息匹配单元,接收来自所述音频识别单元的识别结果和所述视频识别单元的识别结果,确定音频识别单元的识别结果与所述视频识别单元的识别结果是否匹配,在二者匹配的情况下,则将与所述指定视频内容或和所述指定音频内容对应的规定内容记录在所述信息存储单元中。2. 如权利要求l所述的音视频处理装置,其特征在于, 所述指定内容还包括所述信息提取单元的规定的启动模式, 所述规定的启动模式是指如下模式之一(1) 所述视频识别单元的启动在所述音频识别单元的识别成功后 进行,此时的视频识别对象是音频识别单元的识别成功时刻前后规定 时间段内的视频流;(2) 所述音频识别单元的启动在所述视频识别单元的识别成功后 进行,此时的音频识别对象是视频识别单元的识别成功时刻前后规定 时间段内的音频流;(3) 所述音频识别单元的启动与所述视频识别单元的启动相互独3. 如权利要求l所述的音视频处理装置,其特征在于, 所述音频识别单元的识别结果与所述视频识别单元的识别结果是否匹配是指音频识别单元识别出指定音频内容的音频时间戳和所述视 频识别单元识别出指定视频内容的视频时间戳是否匹配,在二者的时 间戳匹配的情况下,则将与该两个时间戳对应的音频信息和视频信息 记录在所述信息存储单元中。4. 如权利要求3所述的音视频处理装置,其特征在于,所述信息提取单元还包括吋钟校正单元,所述时钟校正单元确定所述音频时间戳和所述视 频时间戳是否匹配。5. 如权利要求4所述的音视频处理装置,其特征在于, 确定所述音频时间戳和所述视频时间戳是否匹配是指二者所对应的识别成功时刻的时间差在规定范围内。6. 如权利要求5所述的音视频处理装置,其特征在于, 所述规定范围是指如下范围之一0以上300亳秒以下;0以上100毫秒以下;0以上50毫秒以下;O毫秒。7. 如权利要求3所述的音视频处理装置,其特征在于,将与所述两个时间戳对应的音频信息和视频信息记录在所述信息 存储单元中可以是覆盖记录也可以是追加记录。8. 如权利要求l所述的音视频处理装置,其特征在于,所述音频 识别单元包括音频采集单元(21),该音频采集单元从来自所述解码单元的音频 流中采集音频信号;和音频关键词提取与匹配单元(24),将所述音频采集单元所采集的 音频信号与所述指定音频内容进行匹配,以从来自所述解码单元的音 频流中识别出从所述指定内容中的指定音频内容。9. 如权利要求l所述的音视频处理装置,其特征在于,所述视频识别单元包括视频采集单元(22),该视频采集单元从来自所述解码单元的视频流中按照规定采样方式采集视频图像;和图像关键词识别单元,对所述视频采集单元所采集的视频图像进行检测确认该图像中是否有所述指定视频内容,以从来自所述解码单元的视频流中识别出从所述指定内容中的指定视频内容。10. 如权利要求9所述的音视频处理装置,其特征在于,还包括图像缓存单元,存储所述视频采集单元(22)所采集的视频图像,并在需要时将所存储的视频图像送到所述图像关键词识别单元进行识别。11. 如权利要求9所述的音视频处理装置,其特征在于,所述规定采样方式是连续抽取视频流中的每一图像帧或者按照规定抽取规则抽取规定的图像帧。12. 如权利要求ll所述的音视频处理装置,其特征在于,所述按照规定抽取规则抽取规定的图像帧是指间隔规定时间提取规定数目的视频图像、或者是指仅提取规定类型的图像帧。13. 如权利要求1所述的音视频处理装置,其特征在于,所述规定内容是指如下内容中的至少一个作为与所述视频指定内容对应的视频信息的视频图像截屏信息、作为与所述音视频指定内容对应的音视频信息的音视频片段、所述音频识别单元的识别结果及所述视频识别单元的识别结果的文本。14. 如权利要求l所述的音视频处理装置,其特征在于,所述指定音频内容和所述指定视频内容相同。15. —种音视频处理装置,包括接收播放信号输出传输流的接收单元;对所述接收单元输出的传输流进行解码的解码单元;接收用户输入的指定内容...
【专利技术属性】
技术研发人员:张志刚,藤井由纪夫,长屋茂喜,
申请(专利权)人:株式会社日立制作所,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。