收录方法和收录装置制造方法及图纸

技术编号:16606489 阅读:41 留言:0更新日期:2017-11-22 16:29
本发明专利技术公开了一种收录方法和收录装置,该收录方法包括:根据电子节目指南设置语音识别任务;根据智能处理服务器的状态分发所述语音识别任务;所述智能处理服务器根据所述语音识别任务对相应的视频素材进行语音识别处理,并存储语音识别处理后的文字信息,从而用户可以通过与所述文字信息相关的关键字搜索到相应的视频素材。本发明专利技术的技术方案根据电子节目指南设置语音识别任务,通过智能语音识别,自动的将收录素材语音信息识别并呈现为文字信息;素材管理平台可根据语音信息快速定位素材,给后期生产平台提供有力的支持。

Collection method and recording device

The invention discloses a method and device for collection included, including the collection of methods: according to the electronic program guide set speech recognition task; according to the intelligent processing of the state of the server distributes the speech recognition task; the intelligent processing server according to the speech recognition task of speech recognition processing of the corresponding video material, and storage of speech recognition after processing the text information, so the user can search the corresponding video material related to the text information by keywords. The technical scheme of the invention set speech recognition tasks according to electronic program guide, through the intelligent voice recognition, automatic speech recognition and information will be included in the material presented as text information; material management platform according to the voice information to locate the material, provide strong support for the later production platform.

【技术实现步骤摘要】
收录方法和收录装置
本专利技术涉及媒资管理
,具体而言,涉及一种收录方法和收录装置。
技术介绍
随着节目生产全流程的数字化、网络化、信息化,以及互联网和移动互联网的发展,传统电视逐渐与互联网进行融合,由此电视台有了“融媒体”业务的需求。同时,为了应对媒介发展新格局,为包括电视、广播、网站、手机、互联网电视在内的媒体平台提供内容的共享、管理和生产服务。随着视频素材量呈现爆炸式增长,为了更好的利用视频资源,对接融媒体生产平台,为台内生产提供服务,提出一种收录节目内容方法迫在眉睫。
技术实现思路
鉴于上述问题,本专利技术提供了一种新的收录方法和收录装置。本专利技术的一个实施方式提供一种收录方法,包括:根据电子节目指南设置语音识别任务;根据智能处理服务器的状态分发所述语音识别任务;所述智能处理服务器根据所述语音识别任务对相应的视频素材进行语音识别处理,并存储语音识别处理后的文字信息。在上述的收录方法中,从外部系统接口接收所述电子节目指南。在上述的收录方法中,所述智能处理服务器通过访问索引文件获取所述视频素材。在上述的收录方法中,在所述视频素材进行语音识别处理的同时,所述智能处理服务器对所述视频素材进行拆条处理。在上述的收录方法中,所述拆条处理包括转场识别处理、人脸识别处理和字幕识别处理。本专利技术的另一实施方式提供一种收录装置,包括:语音识别任务设置模块,根据电子节目指南设置语音识别任务;任务分发模块,根据智能处理服务器的状态分发所述语音识别任务;存储模块,所述智能处理服务器根据所述语音识别任务对相应的视频素材进行语音识别处理,并存储语音识别处理后的文字信息。在上述的收录装置中,电子节目指南获取模块,从外部系统接口接收所述电子节目指南。在上述的收录装置中,所述智能处理服务器通过访问索引文件获取所述视频素材。在上述的收录装置中,在所述视频素材进行语音识别处理的同时,所述智能处理服务器对所述视频素材进行拆条处理。在上述的收录装置中,所述拆条处理包括转场识别处理、人脸识别处理和字幕识别处理。本专利技术的技术方案根据电子节目指南设置语音识别任务,通过建设收录系统同时提供智能语音识别,通过智能语音识别,自动地将收录素材语音信息识别并呈现为文字信息;素材管理平台可根据语音识别信息快速定位素材,给后期生产平台提供有力的支持。附图说明为了更清楚地说明本专利技术的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对本专利技术保护范围的限定。图1示出了实施例1的收录方法的流程图。图2示出了实施例2的收录装置的示意结构图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在下文中,可在本专利技术的各种实施例中使用的术语“包括”或“可包括”指示所公开的功能、操作或元件的存在,并且不限制一个或更多个功能、操作或元件的增加。此外,如在本专利技术的各种实施例中所使用,术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。在本专利技术的各种实施例中,表述“A或/和B中的至少一个”包括同时列出的文字的任何组合或所有组合。例如,表述“A或/和B中的至少一个”可包括A、可包括B或可包括A和B二者。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本专利技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。本专利技术用于智能电视系统、转码中心进行配合工作,获取保存在共享区域的收录文件,通过智能语音识别服务器处理可供广播电视台内其他系统使用。实施例1图1示出了实施例1的收录方法的流程图。在步骤S110中,根据电子节目指南设置语音识别任务。电子节目指南(EPG:ElectronicProgramGuide)包含了每天收录的所有频道的播出单。针对需要语音识别处理的视频节目设置语音识别任务,例如,可以设置在一段时期内,对每天19:00-19:30CCTV1新闻联播执行语音识别。可以从诸如智能电视系统的外部系统接口获取电子节目指南。在步骤S120中,根据智能处理服务器的状态分发所述语音识别任务。由于广播电视台存在各种各样的大量信息、任务需要处理,可能有多个智能处理服务器对这些信息、任务进行处理。因此,可以根据智能处理服务器的当前状态来分配语音识别任务,例如,可以将更多的任务分配给相对空闲的智能处理服务器。在步骤S130中,在所述智能处理服务器根据所述语音识别任务对相应的视频素材进行语音识别处理后,存储语音识别处理后的文字信息。智能处理服务器可通过访问索引文件获取所述视频素材。例如,智能处理服务器从共享文件夹中访问m3u8而获取视频素材。切片服务器可读取EPG信息生成m3u8文件。也可通过ffmpeg将H264和AAC编码的MP4文件进行切片处理,生成m3u8播放列表(索引文件)和多个.ts文件,并将其(m3u8、多个ts)放置指定目录下。m3u8是文件索引,一档节目录制下来会有很多数据文件,可形成一个m3u8文件索引。智能处理服务器对相应的视频素材进行语音识别处理以获得相应的文字信息。语音识别包括两个阶段:训练和识别。为了更好的进行语音识别,智能处理服务器可以是经提前训练的智能处理服务器。不管是训练还是识别,都必须对输入语音预处理和特征提取。训练阶段所做的具体工作是收集大量的语音语料,经过预处理和特征提取后得到特征矢量参数,最后通过特征建模达到建立训练语音的参考模型库的目的。而识别阶段所做的主要工作是将输入语音的特征矢量参数和参考模型库中的参考模型进行相似性度量比较,然后把相似性最高的输入特征矢量作为识别结果输出。这样,最终就达到了语音识别的目的。在视频素材进行语音识别处理的同时,智能处理服务器可以对所述视频素材进行拆条处理。拆条处理主要根据转场识别技术和人脸识别技术。转场识别技术识别出视频中镜头转换的画面,为后续智能识别处理提供帧精确处理数据。转场识别技术基于直方图的切变镜头自动检测算法,保证识别的准确性。转场识别是在收录素材迁移的环节进行,通过底层识别库自动抽取素材转场帧来辅助快速定位片段切点,节省了拆条时seek素材的时间,尤其对新闻类节目的拆条效率有很大提升。拆条客户端在执行拆条素材审核时会根据数据库中记录的素材信息,自动加载素材对应的转场帧,用户可本文档来自技高网...
收录方法和收录装置

【技术保护点】
一种收录方法,其特征在于,包括:根据电子节目指南设置语音识别任务;根据智能处理服务器的状态分发所述语音识别任务;所述智能处理服务器根据所述语音识别任务对相应的视频素材进行语音识别处理,并存储语音识别处理后的文字信息,从而用户可以通过与所述文字信息相关的关键字搜索到相应的视频素材。

【技术特征摘要】
1.一种收录方法,其特征在于,包括:根据电子节目指南设置语音识别任务;根据智能处理服务器的状态分发所述语音识别任务;所述智能处理服务器根据所述语音识别任务对相应的视频素材进行语音识别处理,并存储语音识别处理后的文字信息,从而用户可以通过与所述文字信息相关的关键字搜索到相应的视频素材。2.根据权利要求1所述的收录方法,其特征在于,从外部系统接口接收所述电子节目指南。3.根据权利要求1所述的收录方法,其特征在于,所述智能处理服务器通过访问索引文件获取所述视频素材。4.根据权利要求1所述的收录方法,其特征在于,在所述视频素材进行语音识别处理的同时,所述智能处理服务器对所述视频素材进行拆条处理。5.根据权利要求4所述的收录方法,其特征在于,所述拆条处理包括转场识别处理、人脸识别处理和字幕识别处理。6.一种收录装置,其特征在于,包括...

【专利技术属性】
技术研发人员:郭昌雄吴剑海瞿向雷李君杜歆文金圣韬仲亚军孟琳
申请(专利权)人:苏州市广播电视总台
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1