基于AI的图像识别解决方法、装置及可读存储介质制造方法及图纸

技术编号：26343437 阅读：36 留言：0更新日期：2020-11-13 20:45

本发明专利技术公开了一种基于AI的图像识别解决方法、装置及可读存储介质，涉及图像识别技术领域，基于AI的图像识别解决方法包括：获取用户指示图像；通过至少一个上级预测模型，得到相应的预设指令触发标识；基于得到的至少一个上级预测模型的预设指令触发标识，更新用户指示图像中相应第二指令触发对象的特征标识；基于更新至少一个特征标识后的用户指示图像，训练图像识别模型，使得图像识别模型能够基于用户终端采集的用户实时图像，进行对应第一指令触发对象及至少一个第二指令触发对象的控制指令预测，以基于控制指令预测结果执行控制指令预测结果对应的控制指令，能够实现基于图像识别的控制指令触发的方案。

全部详细技术资料下载

【技术实现步骤摘要】
基于AI的图像识别解决方法、装置及可读存储介质
本专利技术涉及图像识别
，具体而言，涉及一种基于AI的图像识别解决方法、装置及可读存储介质。
技术介绍
目前，随着智能移动终端的普及和技术手段的革新，视频通话、直播等功能逐渐兴起。相比起发送文字或者语音，用户之间直接进行视频交互符合当下的发展趋势。设备在用户进行视频交互的过程中，当用户需要使用一些相关指令时，大多还是通过手动按键、或者简单的语音输入实现触发相关的功能。在实际使用中，用户可能不方便直接动手操作，而进行语音输入又可能与正在使用的功能发生冲突（例如正在进行通话、观看视频或者进行直播等）。而在现有技术中，并没有较为成熟的通过识别包含有用户动作的图像触发对应指令的方案。有鉴于此，如何提供一种能够基于图像识别解决控制指令触发的方案，是本领域技术人员需要解决的。
技术实现思路
本专利技术的目的在于提供一种基于AI的图像识别解决方法、装置及可读存储介质。第一方面，本专利技术实施例提供一种基于AI的图像识别解决方法，所述方法包括：...

【技术保护点】
1.一种基于AI的图像识别解决方法，其特征在于，应用于计算机设备，所述计算机设备与用户终端通信连接，所述方法包括：/n获取用于图像识别的图像识别模型的用户指示图像，所述用户指示图像包括与指令触发对象相对应的至少两个特征标识，所述指令触发对象包括：第一指令触发对象及至少一个第二指令触发对象，所述第二指令触发对象的图像获取时间范围大于所述第一指令触发对象的图像获取时间范围；/n将所述用户指示图像分别输入至少一个上级预测模型，每个所述上级预测模型用于对一个所述第二指令触发对象进行预测；/n通过所述至少一个上级预测模型，分别对所述用户指示图像进行第二指令触发对象预测，得到相应的预设指令触发标识；/n基...

【技术特征摘要】
1.一种基于AI的图像识别解决方法，其特征在于，应用于计算机设备，所述计算机设备与用户终端通信连接，所述方法包括：
获取用于图像识别的图像识别模型的用户指示图像，所述用户指示图像包括与指令触发对象相对应的至少两个特征标识，所述指令触发对象包括：第一指令触发对象及至少一个第二指令触发对象，所述第二指令触发对象的图像获取时间范围大于所述第一指令触发对象的图像获取时间范围；
将所述用户指示图像分别输入至少一个上级预测模型，每个所述上级预测模型用于对一个所述第二指令触发对象进行预测；
通过所述至少一个上级预测模型，分别对所述用户指示图像进行第二指令触发对象预测，得到相应的预设指令触发标识；
基于得到的所述至少一个上级预测模型的预设指令触发标识，更新所述用户指示图像中相应第二指令触发对象的特征标识，得到更新至少一个特征标识后的用户指示图像；
基于所述更新至少一个特征标识后的用户指示图像，训练所述图像识别模型，使得所述图像识别模型能够基于所述用户终端采集的用户实时图像，进行对应所述第一指令触发对象及所述至少一个第二指令触发对象的控制指令预测，以基于控制指令预测结果执行所述控制指令预测结果对应的控制指令。

2.根据权利要求1所述的方法，其特征在于，所述获取用于图像识别的图像识别模型的用户指示图像，包括：
基于所述第一指令触发对象的图像获取时间范围，采集用户实时图像对应所述第一指令触发对象的数据及对应所述至少一个第二指令触发对象的数据；
基于采集的数据构造所述图像识别模型的用户指示图像。

3.根据权利要求1所述的方法，其特征在于，所述基于得到的所述至少一个上级预测模型的预设指令触发标识，更新所述用户指示图像中相应第二指令触发对象的特征标识，得到更新至少一个特征标识后的用户指示图像，包括：
分别将各所述上级预测模型的预设指令触发标识，作为用户指示图像中相应的第二指令触发对象的特征标识进行标注，以更新用户指示图像中相应第二指令触发对象的特征标识，得到更新至少一个特征标识后的用户指示图像。

4.根据权利要求1所述的方法，其特征在于，所述将所述用户指示图像分别输入至少一个上级预测模型之前，所述方法还包括：
获取所述至少一个上级预测模型的用户指示图像，各所述上级预测模型的用户指示图像基于相应的所述第二指令触发对象的图像获取时间范围采样得到，且至少包括相应的所述第二指令触发对象对应的特征标识；
分别将各所述上级预测模型的用户指示图像，输入至相应的上级预测模型，并通过相应的上级预测模型进行所述第二指令触发对象的预测，得到相应的预设指令触发标识；
基于得到的预设指令触发标识、及各所述上级预测模型的用户指示图像所标注的特征标识，确定各所述上级预测模型的损失函数的值；
基于各所述上级预测模型的损失函数的值，更新相应的上级预测模型的模型参数，以使得所述上级预测模型能够基于采集的用户实时图像，对相应的所述第二指令触发对象进行预测。

5.根据权利要求1所述的方法，其特征在于，所述计算机设备还与动作分析服务器和动作捕捉服务器均通信连接，所述用户实时图像包括所述用户的多个向量的信息，所述用户实时图像为特定动作图像；
所述方法还包括验证所述用户实时图像的步骤，包括：
获取采集的多个用户实时图像帧，且任意两个用户实时图像帧之间具有至少一个相同向量的信息，将任意两个用户实时图像帧之间，相同向量的信息进行匹配，若每个相同向量的信息都相匹配，则得到至少一组指令动作；或者，
发送动作验证触发标识给动作分析服务器，所述动作验证触发标识用于触发所述动作分析服务器对所述多个向量的信息中的特征指标进行认证；
当接收到所述动作分析服务器根据所述动作验证触发标识返回的认证通过的信息，执行所述得到至少一组指令动作的步骤；或者，
根据图像切割技术对所述特定动作图像进行切割得到局部动作图像；再根据画面捕捉技术识别所述局部动作图像，得到结构化的所述多个向量的信息；
向所述用户终端发送安全协议，所述安全协议用于请求所述用户终端向动作分析服务器授权获取某一动作捕捉服务器中的指令动作；
若接收到所述用户终端根据所述安全协议返回的确认授权的信息，则向至少一个动作捕捉服务器分别获取与所述多个向量中多个向量的信息一致的指令动作，执行所述得到至少一组指令动作的步骤；
将所述至少一组指令动作中每个向量的信息分别与所述多个向量的信息进行匹配，得到至少一组动作参考数据；
根据所述每...

【专利技术属性】
技术研发人员：不公告发明人，
申请(专利权)人：广州佰锐网络科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人