一种基于音频智能识别搜索节目的方法技术

技术编号：33636165 阅读：39 留言：0更新日期：2022-06-02 01:49

本发明专利技术提供了一种基于音频智能识别搜索节目的方法，其特征在于，包括：获取节目视频资源；采集提取视频中不同类型的基础数据信息；经过模型训练，输出多维度视频标签，形成标签库；通过指令词或音频数据，进行识别检索，匹配出结果。本发明专利技术对比现有搜索方式，增加了歌曲原声与哼唱、经典台词、行为画面等指令形式，结合视频标签体系，对媒资进行快速准确检索，提升视频检索的效率。升视频检索的效率。升视频检索的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于音频智能识别搜索节目的方法

[0001]本专利技术涉及一种基于音频智能识别搜索节目的方法，属于机顶盒视频

技术介绍

[0002]随着信息化的高速发展，各终端设备均已智能化，衍生的应用、终端设备大部分都支持语音识别功能；在视频应用或网站中，传统的搜索节目是通过键盘、语音（片名、明星名、关键词）搜索；若不知任何节目信息，而通过某一细节却无法直接找到对应的节目，如听到某段音乐、经典台词，或看到某一精彩剪辑片段，想看其对应的节目视频，但不知道是某节目、某集次、某时间段，此情景下，传统的搜索节目方式已无法满足此需求，往往是在网站中进行搜索查找，看其对应的是某节目、集次、时间段，再去观看，整个过程比较繁琐；然而身边高速化运转的一切事物让用户越来越难以接受与“慢”相关的现象，越来越追求及时反馈。

技术实现思路

[0003]本专利技术目的是提供了一种基于音频智能识别搜索节目的方法，不仅结构牢固不易分离，而且施工方便。
[0004]本专利技术为实现上述目的，通过以下技术方案实现：一种基于音频智能识别搜...

【技术保护点】

【技术特征摘要】
1.一种基于音频智能识别搜索节目的方法，其特征在于，包括以下步骤：1）将节目视频文件中存在诸多不同纬度的数据特征，通过深度采集视频数据信息，包含图像、音频、文本；2）对基础数据的类型及格式进行数据结构化预加工处理：清洗、筛选、转换、排序等；3）根据多模态特征融合理解结果对视频文件进行智能打标，输出多维度视频标签信息：音频指纹、视频片段关键词、对应时间戳的字幕，根据对文本的标记，并对相应视频进行自动标签、归类，形成媒资标签体系库；4）基于语音识别、语义理解技术，训练模型，构建语法，指定使用语法；5）唤醒设备，对终端设备说出指令词或音频数据，进行指令解析，提取关键词，识别其意图；进行识别检索，基于标签体系，识别结果只在指令信息列表中匹配；6）反馈识别结果，包含该指令信息中的所有节目或直接定位到对应台词、画面所在时间位置，以供用户选择或直接观看。2.根据权利要求1所述的基于音频智能识别搜索节目的方法，其特征在于，所述步骤2中基础数据的类型及格式进行数据结构化预加工处理具体步骤如下：2
‑
1）对视频图像以CN...

【专利技术属性】
技术研发人员：陶文文，杜丽娜，刘喆，胡中涛，谢恩鹏，修志远，韩昭瑞，
申请(专利权)人：山东浪潮超高清视频产业有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人