三维模型的标记方法和装置制造方法及图纸

技术编号:19695958 阅读:16 留言:0更新日期:2018-12-08 12:14
本发明专利技术实施例提出一种三维模型的标记方法和装置。该方法包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到待显示三维模型在待标记图像中的标记位置。本发明专利技术实施例针对不同类别的模型和图像场景准确地产生标记,有利于更加准确和自然地显示模型初始化位置,产生的标记也更加符合三维模型和待标记图像的特点。

【技术实现步骤摘要】
三维模型的标记方法和装置
本专利技术涉及人工智能和增强现实
,尤其涉及一种三维模型的标记方法和装置。
技术介绍
AR(AugmentedReality,增强现实)技术是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,可以把原本在现实世界的一定时间空间范围内很难体验到的实体信息(例如视觉信息、声音、味道、触觉等),通过电脑等科学技术,模拟仿真后再叠加到真实世界,被人类感官所感知,从而达到超越现实的感官体验。真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。随着计算技术的发展,实现网络(web)AR效果的关键一步是在合适的位置放置合适的模型。
技术实现思路
本专利技术实施例提供一种三维模型的标记方法和装置,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种三维模型的标记方法,包括:一种三维模型的标记方法,其特征在于,包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,所述已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,所述标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用所述标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中的标记位置。结合第一方面,本专利技术实施例在第一方面的第一种实现方式中,根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则,包括:在各样本图像中标注出各种三维模型的类别信息应该出现的标记范围信息和模型可放置坐标;提取各样本图像的场景特征信息;根据各样本图像中标注出的各种三维模型的类别信息应该出现的标记范围信息、模型可放置坐标和场景特征信息,采用机器学习算法进行训练,得到所述标记定位规则。结合第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,所述标记范围信息包括标记各顶点的坐标;所述模型可放置坐标为所述标记范围信息中的一个坐标。结合第一方面的第一种实现方式或第一方面的第二种实现方式,本专利技术实施例在第一方面的第三种实现方式中,采用所述标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中的标记位置,包括:获取摄像头拍摄的待标记图像;将根据所述标记定位规则对所述待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中应该出现的标记范围信息和模型可放置坐标。结合第一方面的第三种实现方式,本专利技术实施例在第一方面的第四种实现方式中,获取摄像头拍摄的待标记图像,包括:通过浏览器获取终端设备的摄像头输入内容,所述摄像头输入内容包括所述待标记图像。结合第一方面的第四种实现方式,本专利技术实施例在第一方面的第五种实现方式中,还包括:向所述浏览器返回所述待显示三维模型在所述待标记图像中应该出现的标记范围信息和模型可放置坐标;或向所述浏览器返回错误状态。第二方面,本专利技术实施例提供了一种三维模型的标记装置,包括:标记模块,用于根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,所述已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,所述标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;匹配模块,用于采用所述标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中的标记位置。结合第二方面,本专利技术实施例在第二方面的第一种实现方式中,所述标记模块包括:标注子模块,用于在各样本图像中标注出各种三维模型的类别信息应该出现的标记范围信息和模型可放置坐标;提取子模块,用于提取各样本图像的场景特征信息;训练子模块,用于根据各样本图像中标注出的各种三维模型的类别信息应该出现的标记范围信息、模型可放置坐标和场景特征信息,采用机器学习算法进行训练,得到所述标记定位规则。结合第二方面的第一种实现方式,本专利技术实施例在第二方面的第二种实现方式中,所述标记范围信息包括标记各顶点的坐标;所述模型可放置坐标为所述标记范围信息中的一个坐标。结合第二方面的第一种实现方式或第二方面的第二种实现方式,本专利技术实施例在第二方面的第三种实现方式中,所述匹配模块包括:获取子模块,用于获取摄像头拍摄的待标记图像;匹配子模块,用于将根据所述标记定位规则对所述待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中应该出现的标记范围信息和模型可放置坐标。结合第二方面的第三种实现方式,本专利技术实施例在第二方面的第四种实现方式中,获取子模块还用于通过浏览器获取终端设备的摄像头输入内容,所述摄像头输入内容包括所述待标记图像。结合第二方面的第四种实现方式,本专利技术实施例在第二方面的第五种实现方式中,还包括:返回模块,用于向所述浏览器返回所述待显示三维模型在所述待标记图像中应该出现的标记范围信息和模型可放置坐标;或向所述浏览器返回错误状态。第三方面,本专利技术实施例提供了一种三维模型的标记装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,三维模型的标记装置的结构中包括处理器和存储器,所述存储器用于存储支持三维模型的标记装置执行上述三维模型的标记方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述三维模型的标记装置还可以包括通信接口,用于三维模型的标记装置与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储三维模型的标记装置所用的计算机软件指令,其包括用于执行上述三维模型的标记方法所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:根据三维模型的类别信息和待标记图像的场景特征信息,在待标记图像中确定出三维模型对应的标记位置,这样有利于针对不同类别的模型和图像场景准确地产生标记,有利于更加准确和自然地显示模型初始化位置,产生的标记更加符合三维模型和待标记图像的特点。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为根据本专利技术实施例的三维模型的标记方法的流程图。图2为根据本专利技术实施例的三维模型的标记方法的流程图。图3为根据本专利技术实施例的三维模型的标记装置的方框图。图4为根据本专利技术实施例的三维模型的标记装置的方框图。图5为根据本专利技术实施例的三维模型的标记方法的示例图。图6为根据本专利技术实施例的三维模型的标记方法的流程图。图7为根据本专利技术实施例的三维模型的标记方法的示例图。图8为根据本专利技术实施例的三维模型的标记装置的结构框图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述本文档来自技高网...

【技术保护点】
1.一种三维模型的标记方法,其特征在于,包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,所述已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,所述标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用所述标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中的标记位置。

【技术特征摘要】
1.一种三维模型的标记方法,其特征在于,包括:根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,所述已标注的样本图像中标注了各种三维模型的类别信息对应的标记信息,所述标记定位规则包括三维模型的类别信息、二维图像的场景特征信息和标记位置的对应关系;采用所述标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中的标记位置。2.根据权利要求1所述的方法,其特征在于,根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则,包括:在各样本图像中标注出各种三维模型的类别信息应该出现的标记范围信息和模型可放置坐标;提取各样本图像的场景特征信息;根据各样本图像中标注出的各种三维模型的类别信息应该出现的标记范围信息、模型可放置坐标和场景特征信息,采用机器学习算法进行训练,得到所述标记定位规则。3.根据权利要求2所述的方法,其特征在于,所述标记范围信息包括标记各顶点的坐标;所述模型可放置坐标为所述标记范围信息中的一个坐标。4.根据权利要求2或3所述的方法,其特征在于,采用所述标记定位规则对待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中的标记位置,包括:获取摄像头拍摄的待标记图像;将根据所述标记定位规则对所述待标记图像和待显示三维模型的类别信息进行匹配,得到所述待显示三维模型在所述待标记图像中应该出现的标记范围信息和模型可放置坐标。5.根据权利要求4所述的方法,其特征在于,获取摄像头拍摄的待标记图像,包括:通过浏览器获取终端设备的摄像头输入内容,所述摄像头输入内容包括所述待标记图像。6.根据权利要求5所述的方法,其特征在于,还包括:向所述浏览器返回所述待显示三维模型在所述待标记图像中应该出现的标记范围信息和模型可放置坐标;或向所述浏览器返回错误状态。7.一种三维模型的标记装置,其特征在于,包括:标记模块,用于根据已标注的样本图像,采用机器学习算法进行训练得到标记定位规则;其中,所述已标注的样本图...

【专利技术属性】
技术研发人员:王群王宇亮乔岳张苗
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1