【技术实现步骤摘要】
新媒体内容的搜索方法、装置和计算机设备
本申请涉及搜索
,尤其涉及一种新媒体内容的搜索方法、装置和计算机设备。
技术介绍
随着计算技术的发展,全景(panorama)图片、全景视频、三维(ThreeDimension;以下简称:3D)模型、三维动画及其在虚拟现实(VirtualReality;以下简称:VR)和增强现实(AugmentedReality;以下简称:AR)场景下的展示与用户交互代表了下一代信息展现的形态和趋势,已受到越来越多的关注。同时,摄影技术(如鱼眼镜头、全景相机、深度摄像头等)、建模技术(如3D扫描工具、动作追踪等)、以及编程工具的高速发展,使此类内容的生产越来越容易,在互联网上,此类内容也将越来越多地出现。主流的网页浏览器现已支持对此类内容的展示和交互。下文将全景、3D、VR和/或AR这类内容统称为“新媒体内容”,与传统内容(文本、二维图片、视频和/或音频)相比,新媒体内容具有连贯性、多线性、多角度、临场感、大空间、高交互、信息即时性和线上联动线下等优点。这些新媒体内容具有更加丰富的视觉信息、能提供更具沉浸感、真实性和趣味性的视觉体验,尤其适合支持复杂环境、虚拟户外、沉浸探索、操作指导等场景下的信息展示和用户交互,在人工智能时代下,可以提供用户搜索需求的更高满足感。传统的互联网搜索技术主要利用文本信息对海量网页内容进行索引,典型地,利用词频-逆向文件频率(TermFrequency–InverseDocumentFrequency;以下简称:TF-IDF)以及词向量(word2vec)技术等在网页库中建立文字索引并搜索内容匹配用 ...
【技术保护点】
1.一种新媒体内容的搜索方法,其特征在于,包括:获取用户输入的检索词,所述检索词包括图片;对所述图片进行语义分析和内容识别,获得所述图片的视觉特征信息;根据所述图片的视觉特征信息,获得特征向量编码,作为从所述用户输入的检索词中提取的检索键值;对所述检索键值和基于视角采样获得的新媒体内容的键值进行匹配,获得匹配的新媒体内容和对应的匹配度;按照匹配度由高到低的顺序选择预定数量的新媒体内容,并通过浏览器呈现选择的新媒体内容。
【技术特征摘要】
1.一种新媒体内容的搜索方法,其特征在于,包括:获取用户输入的检索词,所述检索词包括图片;对所述图片进行语义分析和内容识别,获得所述图片的视觉特征信息;根据所述图片的视觉特征信息,获得特征向量编码,作为从所述用户输入的检索词中提取的检索键值;对所述检索键值和基于视角采样获得的新媒体内容的键值进行匹配,获得匹配的新媒体内容和对应的匹配度;按照匹配度由高到低的顺序选择预定数量的新媒体内容,并通过浏览器呈现选择的新媒体内容。2.根据权利要求1所述的方法,其特征在于,所述检索词还包括:所述图片的文本上下文;所述对所述图片进行语义分析和内容识别,获得所述图片的视觉特征信息之后,还包括:检验所述图片的视觉特征信息中的图片语义与所述文本上下文语义的一致性。3.根据权利要求2所述的方法,其特征在于,所述根据所述图片的视觉特征信息,获得特征向量编码,作为从所述用户输入的检索词中提取的检索键值包括:如果所述图片语义与所述文本上下文语义一致,则将所述图片的视觉特征信息中用于表征图片语义的特征向量与所述文本上下文的特征信息进行融合,获得融合后的特征向量编码,所述文本上下文的特征信息包括所述文本上下文的文本原文和/或所述文本上下文的特征向量;如果所述图片语义与所述文本上下文语义不一致,则根据所述图片的视觉特征信息中用于表征图片语义的特征向量,获得特征向量编码。4.根据权利要求1-3任意一项所述的方法,其特征在于,所述对所述检索键值和基于视角采样获得的新媒体内容的键值进行匹配,获得匹配的新媒体内容和对应的匹配度之前,还包括:基于视角采样对新媒体内容资源库中的新媒体内容进行特征键值提取,获得所述新媒体内容的键值。5.根据权利要求4所述的方法,其特征在于,所述基于视角采样对新媒体内容资源库中的新媒体内容进行特征键值提取,获得所述新媒体内容的键值包括:通过改变观察位置、观察角度和/或可视范围,对所述新媒体内容资源库中的新媒体内容进行视角采样,获取至少两张图片,其中,所述至少两张图片中的每张图片均为将所述新媒体内容在可视范围内,按照观察角度在观察位置进行平面投影所得;对于包含动画内容的新媒体内容,则进一步配合帧采样在时间轴上采样生成图片;对所述图片进行语义分析和内容识别,获得所述图片的视觉特征信息;根据所述图片的视觉特征信息,获得特征向量编码,作为所述新媒体内容的键值。6.根据权利要求1或5所述的方法,其特征在于,所述对所述图片进行语义分析和内容识别,获得所述图片的视觉特征信息包括:通过显著性检测算法识别所述图片中主体内容的位置,去除所述图片的背景,保留前景;通过物体检测和分类算法定位所述图片中存在的物体,并识别所述图片中各物体的类别,获得所述图片中各物体在所述图片中的区域坐标、根据物体区域坐标分割的各区域的视觉特征向量、以及所述图片中各物体的类别标签。通过通用图像识别算法对所述图片的整体和/或局部进行特征提取,获得所述图片的视觉特征向量;对所述图片中各物体在所述图片中的区域坐标、根据物体区域坐标分割的各区域的视觉特征向量、所述图片中各物体的类别标签和所述图片的视觉特征向量进行组合,获得所述图片的视觉特征信息。7.一种新媒体内容的搜索装置,其特征在于,包括:获取模块,用于获取用户输入的检索词,所述检索词包括图片;图片识别模块,用于对所述图片进行语义分析和内容识别,获得...
【专利技术属性】
技术研发人员:董维山,王宇亮,陈曼仪,王群,张峥,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。