标注信息格式转换方法、装置、设备和介质制造方法及图纸

技术编号:25308403 阅读:31 留言:0更新日期:2020-08-18 22:27
本发明专利技术实施例公开了一种标注信息格式转换方法。所述方法包括:接收具有标注信息的目标文件;如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。以实现图像训练数据中不同类型数据的不同标注信息的格式转换,节省算法工程师的时间,提升计算机视觉任务的构建效率。

【技术实现步骤摘要】
标注信息格式转换方法、装置、设备和介质
本专利技术实施例涉及计算机视觉技术,尤其涉及一种标注信息格式转换方法、装置、设备和介质。
技术介绍
在如今的大数据时代,大量的训练数据是进行深度学习的前提,而训练数据产生离不开数据标注,数据标注作为机器学习工程中重要的一环,是构建AI金字塔的基础。目前,不同的传统机器学习、深度学习框架和算法对标注数据的格式以及标注信息的文件类型要求各不相同,一般都是当需要对接收的格式不是用户需求的格式时,需要算法工程师现写代码,花大量时间在格式转换及优化上,例如,当用户需要的是Yolo格式的txt文件,而下载的训练数据标注信息为PascalVoc格式的xml文件,这就需要算法工程师单独写将Yolo格式的txt文件转换为PascalVoc格式的xml文件的格式转换算法,进而把PascalVoc格式的xml文件转换为Yolo格式的txt文件,因为不同的格式转换需要不同的格式转换算法,因此,每当用户需要的格式文件与下载的格式文件的格式不一致时,都需要单独写转换算法,这样工作量很大,降低了格式转换的效率。
技术实现思路
本专利技术实施例提供一种标注信息格式转换方法、装置、设备和介质,以实现图像训练数据中不同类型数据的不同标注信息的格式转换,节省算法工程师的时间,提升计算机视觉任务的构建效率。第一方面,本专利技术实施例提供了一种标注信息格式转换方法,该方法包括:接收具有标注信息的目标文件;如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。第二方面,本专利技术实施例还提供了一种标注信息格式转换装置,该装置包括:目标文件接收模块,用于接收具有标注信息的目标文件;第一格式转换模块,用于如果所述目标文件的原始文件格式属于预设待转换格式,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;第二格式转换模块,用于接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。第三方面,本专利技术实施例还提供了一种设备,其特征在于,该设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例中任一所述的标注信息格式转换方法。第四方面,本专利技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本专利技术实施例中任一所述的标注信息格式转换方法。本专利技术实施例的技术方案,接收具有标注信息的目标文件,以便后续基于该目标文件,对目标文件的格式进行判断,以及进行转换。如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式。这样当后续若客户需要的目标文件的目标文件格式与目标文件的原始文件格式不同时,可以直接通过预设通用格式将目标文件的原始文件格式转换成用户所需的目标文件格式,实现了图像训练数据中不同类型数据的不同标注信息的格式转换。接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式,这样不需算法工程师单独写将原始文件格式的目标文件转换成用户所需的文件格式的目标文件,节省了算法工程师的时间,提升计算机视觉任务的构建效率。附图说明图1是本专利技术实施例一中的标注信息格式转换方法的流程图;图2是本专利技术实施例一中的一种标注信息处理平台的架构示意图;图3是本专利技术实施例二中的标注信息格式转换方法的流程图;图4是本专利技术实施例二中的YOLO格式的目录结构示意图;图5是本专利技术实施例三中的标注信息格式转换方法的流程图;图6是本专利技术实施例四中的标注信息格式转换装置的结构示意图;图7是本专利技术实施例五中的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的标注信息格式转换方法的流程图,本实施例可适用于图像训练数据中不同类型数据的不同标注信息的格式转换的情况,该方法可以由标注信息格式转换装置来执行,该标注信息格式转换装置可以由软件和/或硬件来实现,该标注信息格式转换装置可以配置在计算设备上,具体包括如下步骤:S110、接收具有标注信息的目标文件。示例性的,标注信息可以是对一个对象进行标注的信息,例如,对一个画有一只狗的图片,在图片中选中狗这个对象,对狗进行标注,可以标注该对象的名称、该对象的动作,比如,可以对该对象标注为:狗,还可以对该对象标注为:狗在跳跃。目标文件可以是具有对一个对象的标注信息的文件,例如,可以是文件夹,该目标文件中还可以包含有其他子文件夹。这里接收具有标注信息的目标文件,可以是接收用户上传的具有标注信息的目标文件,示例性的,参考图2所示的一种标注信息处理平台的架构示意图,在该平台上可以对具有标注信息的目标文件进行处理,如图2所示,该平台中具有客户端和服务器端,客户可以在客户端通过文件夹上传模块,将以带相对路径信息的目标文件上传至服务器端,服务器端可以接收客户从客户端上传的目标文件。通过接收具有标注信息的目标文件,以便后续基于该目标文件,对目标文件的格式进行判断,以及进行转换。S120、如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式。示例性的,原始文件格式可以是目标文件的文件格式。预设待转换格式可以是计算机视觉领域常用的格式类型。可选的,可以是YOLO格式、PascalVOC格式或COCO格式。预设通用格式可以是将目标文件的原始文件格式转换成的格式,预设通用格式至少包括预设待转换格式。可选的,所述预设通用格式可以是JSON格式,该预设通用格式中可以至少包括:YOLO格式、PascalVOC格式和COCO格式这三种格式。可以理解的是,预设待转换格式可以是YOLO格式、PascalVOC格式或COCO格式,预设通用格式可以是JSON格式,该JSON格式中兼容了YOLO格式、PascalVOC格本文档来自技高网...

【技术保护点】
1.一种标注信息格式转换方法,其特征在于,包括:/n接收具有标注信息的目标文件;/n如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;/n接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。/n

【技术特征摘要】
1.一种标注信息格式转换方法,其特征在于,包括:
接收具有标注信息的目标文件;
如果所述目标文件的原始文件格式属于预设待转换格式时,则基于所述标注信息将所述目标文件的原始文件格式转换成预设通用格式,其中,所述预设通用格式至少包括所述预设待转换格式;
接收用于获取所述目标文件的文件获取请求,如果与所述文件获取请求对应的目标文件格式与所述预设通用格式不同,则将所述目标文件由所述预设通用格式转换为目标文件格式。


2.根据权利要求1所述的方法,其特征在于,所述基于所述标注信息将所述目标文件的原始文件格式转换成所述预设通用格式,包括:
将所述目标文件进行拆解,得到所述目标文件的各个子文件;
基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式。


3.根据权利要求2所述的方法,其特征在于,所述基于所述标注信息,分别将每个所述子文件的原始子文件格式转换成所述预设通用格式,包括:
对每个所述子文件中的标注信息中的每一行标注内容进行拆解,得到各所述子文件中每一行所述标注内容的语义信息;
基于所述语义信息确定所述子文件的原始子文件格式;
将各所述原始子文件格式转换成预设通用格式。


4.根据权利要求1所述的方法,其特征在于,所述目标文件的原始文件格式属于预设待转换格式,包括:
将所述目标文件的原始文件格式的目录结构与所述预设待转换格式的目录结构进行比对;
若比对结果一致,则确定所述原始文件格式属于预设待转换格式。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于目录结构对所述目标文件进行校验,确定所述目标文件的原始文件格式;
若所述原始文件格式属于所述预设待转换格式,则基于基本格式对所述目标文件中的各子文件进行校验,确定各所述子文件的原始子文件格式是否符合规范;
若各所述子文件的原始子文件格式符合规范,则基于标注内容...

【专利技术属性】
技术研发人员:王恬宇黄卓静
申请(专利权)人:光际科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1