对象标注方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:32734734 阅读:15 留言:0更新日期:2022-03-20 08:40
本公开提供了一种对象标注方法、装置、电子设备以及存储介质,本公开涉及人工智能技术领域,具体涉及图像处理和增强现实的技术领域,可以应用于设备安装调试的远程指导等场景。具体实现方案为:两个终端建立视频通信之后,一个终端可以响应于针对实时视频画面中目标实体对象的待标注区域的模型展示操作,在待标注区域显示对应的标注模型,同时将标注模型的模型数据发送至另一个终端,以便另一个终端基于模型数据在实时视频画面中目标实体对象的待标注区域显示对应的标注模型。上述方法可以在多个终端同时显示的实时视频画面中,通过标注模型来指示实体对象中用户所描述的区域,使得各个用户可以直观准确地定位到被描述的区域。区域。区域。

【技术实现步骤摘要】
对象标注方法、装置、电子设备以及存储介质


[0001]本公开涉及人工智能
,具体涉及图像处理和增强现实的
,可以应用于设备安装调试的远程指导等场景。

技术介绍

[0002]在工业设备的安装调试场景中,需要工程师在安装调试现场实地工作。当工程师在工作过程遇到障碍时,需要其他人员通过视频进行远程指导,然而在一些情况下,仅通过视频指导无法提供准确的指导。

技术实现思路

[0003]本公开提供了一种对象标注方法、装置、电子设备以及存储介质。
[0004]根据本公开的第一方面,一种对象标注方法,包括:
[0005]与终端建立视频通信,以便与终端显示相同的实时视频画面;
[0006]响应于针对实时视频画面中目标实体对象的待标注区域的模型展示操作,在待标注区域显示对应的标注模型;
[0007]将标注模型的模型数据发送至终端,以便终端在实时视频画面中目标实体对象的待标注区域显示对应的标注模型。
[0008]根据本公开的第二方面,提供了一种对象标注方法,包括:
[0009]与终端建立视频通信,以便与终端显示相同的实时视频画面;
[0010]接收终端发送的标注模型的模型数据,其中,标注模型是终端响应于针对实时视频画面中目标实体对象的待标注区域的模型展示操作而获得的;
[0011]基于模型数据,在实时视频画面中目标实体对象的待标注区域显示对应的标注模型。
[0012]根据本公开的第三方面,提供了一种对象标注装置,包括:
[0013]第一通信模块,用于与终端建立视频通信,以便与终端显示相同的实时视频画面;
[0014]第一显示模块,用于响应于针对实时视频画面中目标实体对象的待标注区域的模型展示操作,在待标注区域显示对应的标注模型;
[0015]数据发送模块,用于将标注模型的模型数据发送至终端,以便终端在实时视频画面中目标实体对象的待标注区域显示对应的标注模型。
[0016]根据本公开的第四方面,提供了一种对象标注装置,包括:
[0017]第二通信模块,用于与终端建立视频通信,以便与终端显示相同的实时视频画面;
[0018]数据接收模块,用于接收终端发送的标注模型的模型数据,其中,标注模型是终端响应于针对实时视频画面中目标实体对象的待标注区域的模型展示操作而获得的;
[0019]第二显示模块,用于基于模型数据,在实时视频画面中目标实体对象的待标注区域显示对应的标注模型。
[0020]根据本公开的第五方面,提供了一种电子设备,包括:
[0021]至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面或第二方面提供的对象标注方法。
[0022]根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述第一方面或第二方面提供的对象标注方法。
[0023]根据本公开的第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述第一方面或第二方面提供的对象标注方法。
[0024]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
[0025]本公开提供的技术方案带来的有益效果是:
[0026]在本公开的技术方案中,多个终端可以显示同一个实时视频画面,用户可以通过其使用的终端为实时视频画面中的实体对象添加标注模型,其他终端可以在各自显示的实时视频画面中的相同位置显示该标注模型,通过标注模型来指示实体对象中用户所描述的区域,使得各个用户可以直观准确地定位到被描述的区域。
附图说明
[0027]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0028]图1示出了本公开实施例提供的一种对象标注系统的架构图;
[0029]图2示出了本公开实施例提供的一种对象标注方法的流程示意图;
[0030]图3示出了本公开实施例提供的第一终端和第二终端显示实时视频画面的示例性示意图;
[0031]图4示出了本公开实施例提供的第一终端和第二终端在实时视频画面中显示一种标注模型的示例性示意图;
[0032]图5示出了本公开实施例提供的第一终端和第二终端在实时视频画面中显示一种标注模型的示例性示意图;
[0033]图6示出了本公开实施例提供的一种对象标注装置的示意图;
[0034]图7示出了本公开实施例提供的另一种对象标注装置的示意图;
[0035]图8示出了可以用来实施本公开实施例提供的对象标注方法的示例电子设备的示意性框图。
具体实施方式
[0036]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0037]在工业设备的安装调试场景中,需要工程师在安装调试现场实地工作。当工程师在工作过程遇到障碍时,需要其他人员通过视频进行远程指导,然而在一些情况下,仅通过视频指导无法提供准确的指导。
[0038]本公开实施例提供的对象标注方法、装置、电子设备以及存储介质,旨在解决现有技术的如上技术问题中的至少一个。
[0039]本公开实施例提供的一种对象标注系统,对象标注系统可以包括两个终端,这两个终端可以通过网络通信,二者可以互相传输文字信息、语音信息、图片信息、视频信息和文件等数据。在一些应用场景中,两个终端可以通过网络建立视频通信,在建立视频通信之后,两个终端可以显示相同的实时视频画面,同时使用终端的用户可以进行实时通话。这里,同时显示的实时视频画面可以是由任一终端拍摄得到的,上述的视频画面的具体来源可以基于实际的应用场景而定。以工业终端的安装调试场景为例,两个终端之中的一个是安装调试现场的工程师所使用的终端,另一个是提供远程指导的其他人员(如专家)所使用的终端。在本公开实施例中,上述终端的类型可以根据实际应用场景而定,下面以两个终端是第一终端和第二终端为例,对本公开实施例提供的对象标注方法进行介绍。
[0040]图1示出了本公开实施例提供的一种对象标注系统的架构图,如图1所示,对象标注系统包括第一终端和第二终端,第一终端和第二终端可以通过网络通信,二者可以互相传输文字信息、语音信息、图片信息、视频信息和文件等数据。在一些应用场景中,第一终端和第二终端可以通过网络建立视频通信,在建立视频通信之后,第一终端和第二终端可以显示相同的实时视频画面,同时使用第一终端和第二终端的用户可以进行实时通话。这里,同时显示的实时视频画本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象标注方法,包括:与终端建立视频通信,以便与所述终端显示相同的实时视频画面;响应于针对所述实时视频画面中目标实体对象的待标注区域的模型展示操作,在所述待标注区域显示对应的标注模型;将所述标注模型的模型数据发送至所述终端,以便所述终端在所述实时视频画面中所述目标实体对象的所述待标注区域显示对应的所述标注模型。2.根据权利要求1所述的方法,所述待标注区域是通过用户的所述模型展示操作而确定的。3.根据权利要求2所述的方法,所述模型展示操作包括模型选择操作和位置选择操作;所述响应于针对所述实时视频画面中目标实体对象的待标注区域的模型展示操作,在所述待标注区域显示对应的标注模型,包括:响应于所述模型选择操作,从模型库中确定出标注模型;响应于所述位置选择操作,在所述实时视频画面中的目标实体对象上确定出待标注区域;在所述待标注区域显示对应的所述标注模型。4.根据权利要求2所述的方法,所述模型展示操作包括模型绘制操作;所述响应于针对所述实时视频画面中目标实体对象的待标注区域的模型展示操作,在所述待标注区域显示对应的标注模型,包括:响应于在所述实时视频画面中目标实体对象的待标注区域附近的所述模型绘制操作,在所述待标注区域显示标注模型。5.根据权利要求1所述的方法,在所述响应于针对所述实时视频画面中目标实体对象的待标注区域的模型展示操作,在所述待标注区域显示对应的标注模型之后,还包括:检测所述实时视频画面中的内容;在确定所述实时视频画面未包含所述目标实体对象的所述待标注区域时,停止显示所述待标注区域对应的所述标注模型。6.根据权利要求1所述的装置,所述实时视频画面是拍摄得到的,或者所述实时视频画面是由所述终端发送来的。7.一种对象标注方法,包括:与终端建立视频通信,以便与所述终端显示相同的实时视频画面;接收所述终端发送的标注模型的模型数据,其中,所述标注模型是所述终端响应于针对所述实时视频画面中目标实体对象的待标注区域的模型展示操作而获得的;基于所述模型数据,在所述实时视频画面中所述目标实体对象的所述待标注区域显示对应的所述标注模型。8.根据权利要求7所述的方法,所述模型展示操作包括模型选择操作和位置选择操作,所述标注模型是所述终端响应于所述模型选择操作从模型库中确定出的,所述待标注区域是所述终端响应于所述位置选择操作在所述实时视频画面中的目标实体对象上确定出的;所述模型数据包括所述标注模型的标识信息和所述待标注区域的位置信息。9.根据权利要求7所述的方法,所述模型展示操作包括模型绘制操作;
所述标注模型是所述终端响应于在所述实时视频画面中目标实体对象的待标注区域附近的模型绘制操作而生成的;所述模型数据包括所述标注模型的多个关键点的位置信息。10.根据权利要求7所述的装置,在所述基于所述模型数据,在所述实时视频画面中所述目标实体对象的所述待标注区域显示对应的所述标注模型之后,还包括:检测所述实时视频画面中的内容;在确定所述实时视频画面未包含所述目标实体对象的所述待标注区域时,停止显示所述待标注区域对应的所述标注模型。11.根据权利要求7所述的方法,所述实时视频画面是拍摄得到的,或者所述实时视频画面...

【专利技术属性】
技术研发人员:郭旭辉
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1