【技术实现步骤摘要】
一种基于音频智能识别搜索节目的方法
[0001]本专利技术涉及一种基于音频智能识别搜索节目的方法,属于机顶盒视频
技术介绍
[0002]随着信息化的高速发展,各终端设备均已智能化,衍生的应用、终端设备大部分都支持语音识别功能;在视频应用或网站中,传统的搜索节目是通过键盘、语音(片名、明星名、关键词)搜索;若不知任何节目信息,而通过某一细节却无法直接找到对应的节目,如听到某段音乐、经典台词,或看到某一精彩剪辑片段,想看其对应的节目视频,但不知道是某节目、某集次、某时间段,此情景下,传统的搜索节目方式已无法满足此需求,往往是在网站中进行搜索查找,看其对应的是某节目、集次、时间段,再去观看,整个过程比较繁琐;然而身边高速化运转的一切事物让用户越来越难以接受与“慢”相关的现象,越来越追求及时反馈。
技术实现思路
[0003]本专利技术目的是提供了一种基于音频智能识别搜索节目的方法,不仅结构牢固不易分离,而且施工方便。
[0004]本专利技术为实现上述目的,通过以下技术方案实现:一种基于音频智能识别搜 ...
【技术保护点】
【技术特征摘要】
1.一种基于音频智能识别搜索节目的方法,其特征在于,包括以下步骤:1)将节目视频文件中存在诸多不同纬度的数据特征,通过深度采集视频数据信息,包含图像、音频、文本;2)对基础数据的类型及格式进行数据结构化预加工处理:清洗、筛选、转换、排序等;3)根据多模态特征融合理解结果对视频文件进行智能打标,输出多维度视频标签信息:音频指纹、视频片段关键词、对应时间戳的字幕,根据对文本的标记,并对相应视频进行自动标签、归类,形成媒资标签体系库;4)基于语音识别、语义理解技术,训练模型,构建语法,指定使用语法;5)唤醒设备,对终端设备说出指令词或音频数据,进行指令解析,提取关键词,识别其意图;进行识别检索,基于标签体系,识别结果只在指令信息列表中匹配;6)反馈识别结果,包含该指令信息中的所有节目或直接定位到对应台词、画面所在时间位置,以供用户选择或直接观看。2.根据权利要求1所述的基于音频智能识别搜索节目的方法,其特征在于,所述步骤2中基础数据的类型及格式进行数据结构化预加工处理具体步骤如下:2
‑
1)对视频图像以CN...
【专利技术属性】
技术研发人员:陶文文,杜丽娜,刘喆,胡中涛,谢恩鹏,修志远,韩昭瑞,
申请(专利权)人:山东浪潮超高清视频产业有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。