当前位置: 首页 > 专利查询>许丰专利>正文

智能标引导航系统技术方案

技术编号:9865775 阅读:158 留言:0更新日期:2014-04-03 00:45
本发明专利技术公开了一种智能标引导航系统,由多媒体节目,网络服务平台、智能音频标引工具和音频标引导航模块组成;网络服务平台提供音频特征数据库及相关媒体的音频标引导航信息;智能音频标引工具在原始音频信息中嵌入相对于音频压缩算法非确定区域不会被舍弃的具有抗噪性、鲁棒性和不可感知性的音频标引信息,包括节目唯一标识、节目属性、版权信息、网络服务平台链接,以及与多媒体节目本身相关的各时间节点上的主题、人物、商品与内容介绍关联的应用程序、支付接口、多媒体节目、网络链接、评价信息、赞助商的索引及链接;通过插件还能进行基于图像水印的标引和导航。本发明专利技术还公开了一种基于智能标引的第二屏社区服务平台。

【技术实现步骤摘要】
智能标引导航系统
本专利技术涉及一种具备可检测音频特征以及提取预先嵌入的数据信息的音频分析与识别系统,通过音频中提取的导航信息能够把原始音视频节目中所有包含的物体都通过关联引导到各自的相关数据、网址或电子商务接口。
技术介绍
普通的音频数据不具备导航的特点,实现防伪、广告和收费应用都很困难,如果能将音视频节目中的所有剧情、人物和商品信息的相关服务和商务链接作为音频标引都放入对应的时间轴上的音频数据中,就能够提供更适于媒体服务的智能标引导航系统。
技术实现思路
本专利技术解决了传统音频数据无法被自动识别和导航的缺点,提供了一种智能标引导航系统,其特征在于,由制作方提供的多媒体节目,发行方使用的智能音频标引工具、用户方使用的音频标引导航模块和服务方提供的网络服务平台组成;所述多媒体节目是指包含音频数据,以及在音频数据基础上包含多路音频数据、文字数据、图片数据和视频数据中的一种或多种格式数据的数字文件或数据流;所述智能音频标引工具通过识别和分析多媒体节目中原始音频的特定压缩算法,找到位于人的感知盲区的冗余数据同时又是处于所述特定压缩算法的非确定区域不会被舍弃的数据,在其中嵌入具有抗噪性、鲁棒性和不可感知性的音频标引信息,所述音频标引信息的基础数据包括多媒体节目的唯一标识、节目属性、版权信息和网络服务平台链接,所述音频标引信息的扩展数据是与多媒体节目本身相关的各时间节点上的信息及导航链接,包括:主题、人物与内容介绍,关联的应用程序、支付接口、多媒体节目、人物及相关商品的链接,按时间或好评等级分类的评价信息,附加的详细节目介绍、导演、主演、主题分类、发行年份、国家地区和赞助商的索引及链接;所述音频标引导航模块,通过分析和识别多媒体节目的音频标引信息,能够获得多媒体节目的唯一标识和版权信息,并能根据网络服务平台链接和音频标引信息的扩展数据中的导航链接,获取实时的链接信息,指向相关的应用程序、支付接口、网页、博客和多媒体节目链接;所述网络服务平台提供相关导航链接的信息与电子商务服务。这样实现的好处是,节省了媒体资源,原先广告只能位于片头、片尾等关键位置,且不是每个用户都适合。而音频标引信息是直接以音视频节目每个时刻所在时间点上的剧情、人物和商品为索引,进行展开,相当于以内容为引导和分类的智能广告检索与导航系统。所述的智能标引导航系统,其特征在于,所述网络服务平台包括加强型音频搜索引擎,在传统网页搜索引擎的基础上增加了音频的分析、识别与搜索,通过声学建模、模式分类和动态规划方法建立音频的旋律特征,生成音频特征数据库。这样做的好处是,即使是没有嵌入音频标引信息的多媒体节目,网络服务平台仍然可以提供关联商品索引和广告服务,通过特征计算形成匹配数据,并把相关标引导航信息和所述匹配数据关联起来,以后客户端采用音频标引导航模块的智能播放系统能够计算同样的匹配数据,通过网络服务平台找到并导入对应的多媒体节目的标引导航信息。所述的智能标引导航系统,其特征在于,所述网络服务平台包括加强型音频搜索引擎,在传统网页搜索引擎的基础上增加了音频的分析、识别与搜索,通过声学建模、模式分类和动态规划方法建立音频的旋律特征和每个人物或发声对象的独特的声纹特征,生成音频特征数据库;所述音频标引导航模块在多媒体节目中没有找到相关音频标引信息的情况下,还能够与所述网络服务平台的音频特征数据库配合,进行多媒体节目的精确匹配,并通过网络服务平台找到多媒体节目的相关链接。所述的智能标引导航系统,其特征在于,所述音频标引导航模块在多媒体节目中没有找到相关音频标引信息的情况下,还能够与所述网络服务平台的音频特征数据库配合,通过以下方法的组合,进行多媒体节目的精确匹配,并通过网络服务平台找到多媒体节目的相关链接:(I)识别文件名;(2)识别文件头中的属性信息;(3)识别文件的哈希值;(4)通过声学建模、模式分类和动态规划方法识别音频的旋律特征和声纹特征;(5)通过声学建模、模式分类和动态规划方法识别10秒内的哼唱特征。对于文件形式的多媒体节目,通常以文件名,文件头以及文件体中包含的特征数据能够匹配对应准确的多媒体节目,为了保障更准确,因此还使用了文件哈希值,以及某时间段的音频旋律特征或者由用户通过人声哼唱提供的音频数据旋律特征来加强对多媒体节目文件的识别。对于在线数据流形式的多媒体节目,主要以音频旋律特征来识别。其它辅助的手段还包括使用额外数据包形式的数字水印,嵌入图像的水印以及字幕文件中的文字信息。所述的智能标弓I导航系统,其特征在于,所述多媒体节目的数据或数据流,还能够通过所述网络服务平台更新的智能标引导航系统插件,以图像水印的标引形式进行辅助的版权鉴别和导航服务;所述图像水印是采用人眼对特定频率图像数据亮度的微弱变化不敏感的原理,通过小波算法进行频率排序,对特定像素进行信息嵌入处理和冗余处理,形成鲁棒性的与图像一体化的可鉴别水印。所述的智能标引导航系统,其特征在于,所述智能标引导航系统通过云计算的协同模式进行音频特征比对与逐步完善音频特征;即各智能标引导航系统与网络服务平台配合工作,在所述智能标引导航系统实时播放或采集音频时,一方面进行音频特征分析和提取,发送到网络服务平台,同数据库中已有的旋律特征和/或声纹特征进行比对,网络服务平台按相似度从高到低返回对应的匹配对象以及关联导航数据给智能标引导航系统;另一方面各智能标引导航系统也在协同进行特定播放对象的音频特征的分布式运算;对于通过其它关联数据或人工识别已经确定的特定对象,音频特征分析和提取的数据,发送到网络服务平台进行更新,对现有数据库中对应的所述特定对象的旋律特征和/或声纹特征进行补充。所述的智能标引导航系统,其特征在于,所述网络服务平台使用基于标识认证的安全技术为通过审核的注册会员提供自助广告服务和电子商务服务,会员通过基于多媒体节目本身相关的各时间节点上的信息及导航链接,包括:主题、人物与内容介绍,关联的应用程序、支付接口、多媒体节目、人物及相关商品的链接,按时间或好评等级分类的评价信息,以及附加的详细节目介绍、导演、主演、主题分类、发行年份、国家地区和赞助商的索引及链接,进行广告和商品匹配以及竞价排名;所述基于标识认证的技术是指,通过椭圆曲线算法构建多个种子公私钥对,按特定次序编号,使用用户标识的哈希值作为多项式,把相关子项值指向的编号对应的公钥进行点加运算形成用户的公钥,同样把相关子项值指向的编号对应的私钥进行模加运算形成用户的私钥,这样就构建了用户标识与公钥之间的唯一映射关系,生成用户公钥的种子公钥及算法库公开,包括在所述音频标引导航模块中,生成用户私钥的种子私钥及算法库保密,包括在所述网络服务平台中,用户私钥通过用户设备的唯一标识加密后存储在专用的硬件中或存储空间。所述的智能标引导航系统,其特征在于,所述网络服务平台具有电子商务功能,包含带有商品审核与发布功能的电子商城和电子支付功能;所述电子商城除采用标准的商品购买模式,还采用团购模式和反向团购模式;所述团购模式分成由用户发起的散单拼团按统一批发价进行购买的用户团购和由商家指定的特定数量商品按统一批发价进行销售且认购数量超过一定比例才成交的商家团购;所述反向团购模式也分为两种,一种是由用户自由出价,网络服务平台进行自动撮合,按本文档来自技高网...

【技术保护点】
一种智能标引导航系统,其特征在于,由制作方提供的多媒体节目,发行方使用的智能音频标引工具、用户方使用的音频标引导航模块和服务方提供的网络服务平台组成;所述多媒体节目是指包含音频数据,以及在音频数据基础上包含多路音频数据、文字数据、图片数据和视频数据中的一种或多种格式数据的数字文件或数据流;所述智能音频标引工具通过识别和分析多媒体节目中原始音频的特定压缩算法,找到位于人的感知盲区的冗余数据同时又是处于所述特定压缩算法的非确定区域不会被舍弃的数据,在其中嵌入具有抗噪性、鲁棒性和不可感知性的音频标引信息,同时为防止音频受损带来的音频标引信息损失,所述音频标引信息的数据做了一定数据量的备份、冗余和纠错处理;所述音频标引信息的基础数据包括多媒体节目的唯一标识、节目属性、版权信息和网络服务平台链接,所述音频标引信息的扩展数据是与多媒体节目本身相关的各时间节点上的信息及导航链接,包括:主题、人物与内容介绍,关联的应用程序、支付接口、多媒体节目、人物及相关商品的链接,按时间或好评等级分类的评价信息,附加的详细节目介绍、导演、主演、主题分类、发行年份、国家地区和赞助商的索引及链接;所述音频标引导航模块,通过分析和识别多媒体节目的音频标引信息,能够获得多媒体节目的唯一标识和版权信息,并能根据网络服务平台链接和音频标引信息的扩展数据中的导航链接,获取实时的链接信息,指向相关的应用程序、支付接口、网页、博客和多媒体节目链接;所述网络服务平台提供相关导航链接的信息与电子商务服务。...

【技术特征摘要】
1.一种智能标引导航系统,其特征在于,由制作方提供的多媒体节目,发行方使用的智能音频标引工具、用户方使用的音频标引导航模块和服务方提供的网络服务平台组成;所述多媒体节目是指包含音频数据,以及在音频数据基础上包含多路音频数据、文字数据、图片数据和视频数据中的一种或多种格式数据的数字文件或数据流;所述智能音频标引工具通过识别和分析多媒体节目中原始音频的特定压缩算法,找到位于人的感知盲区的冗余数据同时又是处于所述特定压缩算法的非确定区域不会被舍弃的数据,在其中嵌入具有抗噪性、鲁棒性和不可感知性的音频标引信息,同时为防止音频受损带来的音频标引信息损失,所述音频标引信息的数据做了一定数据量的备份、冗余和纠错处理;所述音频标引信息的基础数据包括多媒体节目的唯一标识、节目属性、版权信息和网络服务平台链接,所述音频标引信息的扩展数据是与多媒体节目本身相关的各时间节点上的信息及导航链接,包括:主题、人物与内容介绍,关联的应用程序、支付接口、多媒体节目、人物及相关商品的链接,按时间或好评等级分类的评价信息,附加的详细节目介绍、导演、主演、主题分类、发行年份、国家地区和赞助商的索引及链接;所述音频标引导航模块,通过分析和识别多媒体节目的音频标引信息,能够获得多媒体节目的唯一标识和版权信息,并能根据网络服务平台链接和音频标引信息的扩展数据中的导航链接,获取实时的链接信息,指向相关的应用程序、支付接口、网页、博客和多媒体节目链接;所述网络服务平台提供相关导航链接的信息与电子商务服务。2.根据权利要求1中所述的智能标引导航系统,其特征在于,所述网络服务平台包括加强型音频搜索引擎,在传统网页搜索引擎的基础上增加了音频的分析、识别与搜索,通过声学建模、模式分类和动态规划方法建立音频的旋律特征和每个人物或发声对象的独特的声纹特征,生成音频特征数据库;所述音频标引导航模块在多媒体节目中没有找到相关音频标引信息的情况下,还能够与所述网络服务平台的音频特征数据库配合,进行多媒体节目的精确匹配,并通过网络服务平台找到多媒体节目和服务的相关链接。3.根据权利要求2中所述的智能标引导航系统,其特征在于,所述智能标引导航系统通过云计算的协同模式进行音频特征比对与逐步完善音频特征;即各智能标引导航系统与网络服务平台配合工作,在所述智能标引导航系统实时播放或采集音频时,一方面进行音频特征分析和提取,发`送到网络服务平台,同数据库中已有的旋律特征和/或声纹特征进行比对,网络服务平台按相似度从高到低返回对应的匹配对象以及关联导航数据给智能标引导航系统;另一方面各智能标引导航系统也在协同进行特定播放对象的音频特征的分布式运算;对于通过其它关联数据或人工识别已经确定的特定对象,音频特征分析和提取的数据,发送到网络服务平台进行更新,对现有数据库中对应的所述特定对象的旋律特征和/或声纹特征进行补充。4.根据权利要求3中所述的智能标引导航系统,其特征在于,所述多媒体节目的数据或数据流,还能够通过所述网络服务平台更新的智能标引导航系统插件,以图像水...

【专利技术属性】
技术研发人员:许丰
申请(专利权)人:许丰
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1