全媒体中多维检测特定目标的方法技术

技术编号：12266929 阅读：55 留言：0更新日期：2015-10-31 13:53

全媒体中多维检测特定目标的方法,具体步骤是：根据检索条件样本,确定搜索引擎和检测识别引擎要检索和识别的目标参考样本数据的数据类型；根据的搜索引擎和检测识别引擎要检索和识别的目标参考样本数据的数据类型，选择匹配的检测识别引擎；分析每个检测识别引擎的结果，得到检索关键词、目标特征量数据，作为检索条件发送给搜索引擎进行检索；相关的每个搜索引擎从输入的目标检索数据中检索符合条件的数据，并记录数据片段和出现位置；每个搜索引擎检索不同的数据，得到不同的检索结果，将这些检索结果再进行汇总、分类输出；多种方式不同维度的检索，提高了数据的查全率和查准率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种从全媒体数据中检测特定目标出现的方法，尤其涉及一种全媒体中多维检测特定目标的方法。
技术介绍
全媒体信息包含文字、语音、图片、视频等多种形式的数据，从这些信息中找特定的目标（人、物），涉及声纹识别、语音识别、图像识别、视频指纹、文字分析等多项技术，是一项复杂的系统工程。并且，由于声纹、语音、图像识别及视频指纹技术都处于发展阶段，单一一项技术无法达到预期的查全、查准等性能指标要求。在媒体中声纹、语音、图像、视频指纹、文字信息，具有一定的内在关联性，例如，视频信息一般包括文字、声音、视频画面，声音数据包括可以识别成文字的说话音，也包含说话人不同于他人的生物特征等，这些信息通过内容分析，可以建立一定的关系，这就为通过多种方式检索共同目标提供了技术基础。基于对声纹、语音、图像、视频指纹、文字信息的长期研究，我们发现可以通过一定的统计分析，提取这些信息中两项、三项、多项之间的共同特征或描述内容，利用一种检索方式的结果，拓展到几种方式协同检索，提供综合检索结果。例如，从声纹检测，判断出说话的人是谁，同时，提取这个人说话的片段信息；知道了说话人是谁后，可以从语音识别中，找到涉及这个说话人的内容；也可以查询到说话人的图片和相关视频片段；还可以进一步找到相关的文字信息。由于语音识别、图像识别、视频指纹识别采用DNN、HMM等技术，它们大多数是基于统计分析模型，这些技术均有一定的缺陷，单一技术手段不能达到预期的识别效果。为了提高单一技术的性能，需要大幅提高统计分析的样本模型库的数据量，但是，环境噪声、说话人的口...

【技术保护点】
全媒体中多维检测特定目标的方法，其特征在于，具体步骤如下：S1：根据检索条件样本,确定搜索引擎和检测识别引擎要检索和识别的目标参考样本数据的数据类型；S2：根据的搜索引擎和检测识别引擎要检索和识别的目标参考样本数据的数据类型，选择匹配的检测识别引擎；S3：分析每个检测识别引擎的结果，得到检索关键词、目标特征量数据，作为检索条件发送给搜索引擎进行检索；S4：相关的每个搜索引擎从输入的目标检索数据中检索符合条件的数据，并记录数据片段和出现位置；S5：每个搜索引擎检索不同的数据，得到不同的检索结果，将这些检索结果再进行汇总、分类输出。

【技术特征摘要】

【专利技术属性】
技术研发人员：薛丹，陈淑珊，张松涛，迟立明，
申请(专利权)人：瑞达昇科技大连有限公司，
类型：发明
国别省市：辽宁;21

全部详细技术资料下载我是这个专利的主人