视觉学习方法、系统、设备及存储介质技术方案

技术编号:35134971 阅读:58 留言:0更新日期:2022-10-05 10:09
本申请实施例公开了一种视觉学习方法、系统、设备及存储介质,其中,所述方法包括:采用系统资源层提供视觉学习对应的底层数据;采用接口适配层从所述系统资源层调用所述底层数据,并基于所述底层数据为应用层提供接口服务;采用所述应用层基于所述接口适配层提供的接口服务实现所述视觉学习。接口服务实现所述视觉学习。接口服务实现所述视觉学习。

【技术实现步骤摘要】
视觉学习方法、系统、设备及存储介质


[0001]本申请涉及但不限于计算机视觉
,尤其涉及一种视觉学习方法、 系统、设备及存储介质。

技术介绍

[0002]近年来,随着海量数据积累、计算能力提升以及算法创新,人工智能 (Artificial Intelligence,AI)计算机视觉类技术蓬勃发展。在应用深度学习框 架进行模型训练时,算法与框架、算法与数据集之间需要兼容适配。在相关技 术中,计算机视觉学习框架的应用程序接口(Application Programming Interface, API)多种多样、数据格式参差不齐、接口编写方式各不相同。由于视觉学习 框架的API在不同模式下的接口编写方式不同,使得通过不同的视觉学习框架 训练网络模型时需要重新学习、碎片化严重等,不利于AI产业生态发展。

技术实现思路

[0003]有鉴于此,本申请实施例至少提供一种视觉学习方法、系统、设备及存储 介质。
[0004]本申请实施例的技术方案是这样实现的:
[0005]一方面,本申请实施例提供一种视觉学习方法,所述方法包括:
[0006]采用系统资源层提供视觉学习对应的底层数据;
[0007]采用接口适配层从所述系统资源层调用所述底层数据,并基于所述底层数 据为应用层提供接口服务;
[0008]采用所述应用层基于所述接口适配层提供的接口服务实现所述视觉学习。
[0009]另一方面,本申请实施例提供一种视觉学习系统,所述视觉学习系统包括:
[0010]所述系统资源层,用于提供视觉学习对应的底层数据;
[0011]所述接口适配层,用于从所述系统资源层调用所述底层数据,并基于所述 底层数据为应用层提供接口服务;
[0012]所述应用层,用于基于所述接口适配层提供的接口服务实现所述视觉学习。
[0013]再一方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所 述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时 实现上述方法中的部分或全部步骤。
[0014]又一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算 机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。
[0015]又一方面,本申请实施例提供一种计算机程序,包括计算机可读代码,当 所述计算机可读代码在计算机设备中运行时,所述计算机设备中的处理器执行 用于实现上述方法中的部分或全部步骤。
[0016]又一方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品 包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计 算机读取并执行
时,实现上述方法中的部分或全部步骤。
[0017]本申请实施例中,首先,通过系统资源层提供视觉学习对应的底层数据, 这样能够为视觉学习的实现过程提供充足的底层数据;然后,通过接口适配层 从所述系统资源层调用所述底层数据,并基于底层数据为应用层提供接口服务; 这样,接口适配层置于系统资源层和应用层之间,既能够从系统资源层调用所 需要的底层数据还能够为作为上层系统的应用层提供接口服务,以使得应用层 能够通过从接口适配层提供的接口服务中调用相应的数据实现视觉学习;如此, 应用层能够通过统一的接口适配层进行不同数据的读入,实现了对应用接口的 统一及规范化使用,从而能够使用不同的深度学习框架作为后端,并且能够在 不同的深度学习框架之间进行切换,进而能够提高视觉学习的效率。
[0018]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的, 而非限制本公开的技术方案。
附图说明
[0019]此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符 合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
[0020]图1为本申请实施例提供的一种视觉学习方法的实现流程示意图;
[0021]图2为本申请实施例提供的一种视觉学习方法的另一实现流程示意图;
[0022]图3为本申请实施例提供的一种视觉学习方法的又一实现流程示意图;
[0023]图4为本申请实施例提供的视觉学习方法的实现框架示意图;
[0024]图5为本申请实施例提供的一种视觉学习系统的组成结构示意图;
[0025]图6为本申请实施例提供的一种计算机设备的硬件实体示意图。
具体实施方式
[0026]为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和实施例 对本申请的技术方案进一步详细阐述,所描述的实施例不应视为对本申请的限 制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施 例,都属于本申请保护的范围。
[0027]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集, 但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集, 并且可以在不冲突的情况下相互结合。
[0028]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术 领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申 请的目的,不是旨在限制本申请。
[0029]在对本申请实施例进行进一步详细说明之前,先对本申请实施例中涉及的 名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
[0030]1)计算机视觉,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测 量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送 给仪器检测的图像。本申请实施例中计算机视觉是指一种具备获取、处理和解 释视觉数据能力的功能单元。
[0031]2)机器学习,作为人工神经网络可以根据学习过程中的示例数据来独立地 构建(训练)出基本规则。尤其是在机器视觉领域,神经网络通常采用监督式 学习的方法来训练,即通过示例数据和示例数据的预定义结果来进行训练。
[0032]3)模型训练(model training),利用训练数据,基于机器学习算法,建立 或改进机器学习模型参数的过程。
[0033]4)训练数据(training data),用于训练机器学习模型的输入数据样本子集。
[0034]5)推理(inference),从给定的前提进行论证并得出结论。推理既指过程 也指结果,其中,在人工智能领域中,一个前提是一个事实、一个规则、一个 模型、一个特征或原始数据。
[0035]6)深度神经网络学习(deep neural network learning),通过训练具有许多 隐层的神经网络来创建丰富层次表示的方法。
[0036]本申请实施例提供一种视觉学习方法,该方法可以由计算机设备的处理器 执行。其中,计算机设备指的可以是服务器、笔记本电脑、平板电脑、台式计 算机、智能电视、机顶盒、移动设备(例如移动电话、便携式视频播放器、个 人数字助理、专用消息设备、便携式游戏设备)等具备数据处理能力的设备。 图1为本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视觉学习方法,其特征在于,所述方法包括:采用系统资源层提供视觉学习对应的底层数据;采用接口适配层从所述系统资源层调用所述底层数据,并基于所述底层数据为应用层提供接口服务;采用所述应用层基于所述接口适配层提供的接口服务实现所述视觉学习。2.根据权利要求1所述的方法,其特征在于,所述接口适配层包括多类接口,所述采用接口适配层从所述系统资源层调用所述底层数据,并基于所述底层数据为应用层提供接口服务,包括:采用所述多类接口从系统资源层调用所述底层数据,并通过所述多类接口基于所述底层数据为所述应用层提供接口服务。3.根据权利要求2所述的方法,其特征在于,所述多类接口包括:模型定义类接口、算法训练类接口和应用推理类接口。4.根据权利要求3所述的方法,其特征在于,所述采用所述多类接口从系统资源层调用所述底层数据,并通过所述多类接口基于所述底层数据为所述应用层提供接口服务,包括:采用所述模型定义类接口提供所述底层数据对应的模型结构;采用所述算法训练类接口基于所述底层数据对所述模型结构进行训练,得到训练后的模型结构,并为所述应用层提供所述算法训练类接口对应的服务;采用所述应用推理类接口对所述底层数据进行处理,并基于已处理底层数据为所述应用层提供所述应用推理类接口对应的服务。5.根据权利要求4所述的方法,其特征在于,所述模型定义类接口支持定义所述底层数据的数据结构和模型结构。6.根据权利要求4所述的方法,其特征在于,所述采用所述模型定义类接口提供所述底层数据对应的模型结构,包括:采用所述模型定义类接口定义所述底层数据的数据结构;基于所述数据结构,确定所述模型结构。7.根据权利要求3所述的方法,其特征在于,所述算法训练类接口包括:第一数据处理接口、优化器接口、量化训练接口、混合精度接口和分布式接口。8.根据权利要求7所述的方法,其特征在于,所述采用所述算法训练类接口基于所述底层数据对所述模型结构进行训练,得到训练后的模型结构,并为所述应用层提供所述算法训练类接口对应的服务,包括:采用所述第一数据处理接口将所述底层数据的格式转换成为与所述模型结构匹配的格式,得到转换后的数据;采用所述优化器接口基于所述转换后的数据对所述模型结构的模型参数进行更新,并为所述应用层提供更新后的模型结构;采用所述量化训练接口在所述模型结构的训练过程中感知所述模型结构的损失;采用所述混合精度接口基于所述损失对所述更新后的模型结构进行混合精度训练,并为所述应用层提供混合精度训练后的模型结构;采用所述分布式接口将所述模型结构在训练过程中的数据在多个进程之间进行数据传输,并基于所述多个进程向所述应用层传输数据。
9.根据权利要求3所述的方法,其特征在于,所述算法训练类接口还包括:可视化接口、蒸馏接口和图算融合接口。10.根据权利要求9所述的方法,其特征在于,所述采用所述算法训练类接口基于所述底层数据对所述模型结构进行训练,得到训练后的模型结构,并为所述应用层提供所述算法训练类接口对应的服务,包括:采用所述可视化接口将所述底层数据的格式转换成为与所述模型结构匹配的格式,并对转换后的数据进行可视化,并为所述应用层提供可视化的所述转换后的数据;采用所述蒸馏接口通过教师网络指导学生网络对所述模型结构进行训练,并为所述应用层提供训练后的模型结构;采用所述图算融合接口对所述模型结构对应的计算图逻辑进行调整,并基于调整后的计算图逻辑同步调整所述模型结构,为所述应用层提供调整后的模型结构。11.根据权利要求3所述的方法,其特征在于,所述应用推理类接口包括:流程编排接口、...

【专利技术属性】
技术研发人员:吴庚
申请(专利权)人:上海商汤智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1