学习对象识别方法、装置、设备及存储介质制造方法及图纸

技术编号：38259447 阅读：11 留言：0更新日期：2023-07-27 10:20

本公开涉及一种学习对象识别方法、装置、设备及存储介质。该方法包括：获取包含学习对象的目标书页图像；利用预先训练的对象识别模型，对目标书页图像进行对象识别处理，确定学习对象的第一类型；利用预先训练的特征向量提取模型，对目标书页图像进行特征提取处理，得到目标特征向量和学习对象的第二类型；基于第一类型、目标特征向量以及第二类型，确定目标书页图像中学习对象的目标类型。由此，对于包含学习对象的书页图像，提高了学习对象的识别精度，尤其是质量较差的书页图像，和/或，包含差异较小的多个不同学习对象的书页图像，也能够准确的识别出学习对象的类型，进而加载出与学习对象匹配的讲解视频，从而提升学生的学习兴趣。兴趣。兴趣。

全部详细技术资料下载

【技术实现步骤摘要】
学习对象识别方法、装置、设备及存储介质

[0001]本公开涉及计算机
，尤其涉及一种学习对象识别方法、装置、设备及存储介质。

技术介绍

[0002]当学生在课堂或者利用业余时间学习新知识时，为了提高学生的学习兴趣，学生可以利用学习机拍摄包含学习对象的书页，并利用学习机从拍摄得到的书页图像中识别学习对象，进而加载学习对象的讲解视频以对学生进行讲解。
[0003]为了从书页图像中识别学习对象，相关技术采用多模型融合方法从书页图像中识别出学习对象。然而，在很多情况下，采用多模型融合方法无法准确的识别学习对象的类型，尤其当学习机拍摄的书页图像质量较差，和/或，当书页图像中包含的不同学习对象之间差异较小时，采用多模型融合方法很难准确的识别学习对象的类型，导致出现加载的讲解视频与学习对象不匹配的问题。由此，有必要提供一种准确性较高的学习对象识别方法。

技术实现思路

[0004]为了解决上述技术问题，本公开提供了一种学习对象识别方法、装置、设备及存储介质。
[0005]第一方面，本公开提供了一种学习对象识别方法，该方法包括：
[0006]获取包含学习对象的目标书页图像；
[0007]利用预先训练的对象识别模型，对所述目标书页图像进行对象识别处理，确定所述学习对象的第一类型；
[0008]利用预先训练的特征向量提取模型，对所述目标书页图像进行特征提取处理，得到目标特征向量和所述学习对象的第二类型；
[0009]基于所述第一类型、所述目标特征向量以及所述第二类型，确...

【技术保护点】

【技术特征摘要】
1.一种学习对象识别方法，其特征在于，包括：获取包含学习对象的目标书页图像；利用预先训练的对象识别模型，对所述目标书页图像进行对象识别处理，确定所述学习对象的第一类型；利用预先训练的特征向量提取模型，对所述目标书页图像进行特征提取处理，得到目标特征向量和所述学习对象的第二类型；基于所述第一类型、所述目标特征向量以及所述第二类型，确定所述目标书页图像中学习对象的目标类型。2.根据权利要求1所述的方法，其特征在于，所述利用预先训练的对象识别模型，对所述目标书页图像进行对象识别处理，确定所述学习对象的第一类型，包括：基于所述对象识别模型中的自注意力网络，按照目标系数对所述目标书页图像进行自注意力处理，得到第一自注意力特征；基于所述对象识别模型中的分类网络对所述第一自注意力特征进行分类处理，得到所述第一类型。3.根据权利要求1所述的方法，其特征在于，所述利用预先训练的特征向量提取模型，对所述目标书页图像进行特征提取处理，得到目标特征向量和所述学习对象的第二类型，包括：基于所述特征向量提取模型中的自注意力网络，按照目标系数对所述目标书页图像进行自注意力处理，得到第二自注意力特征；基于所述特征向量提取模型中的分类网络对所述第二自注意力特征进行分类处理，得到所述目标特征向量和所述第二类型。4.根据权利要求2或3所述的方法，其特征在于，所述目标系数为Y＝f(W/(max(SUM(W)
‑
W,W))*X+b)，Y是所述自注意力网络的神经元的输出值，f(*)是激活函数，W是所述自注意力网络的神经元与所述分类网络的神经元连接的权值，X是所述自注意力网络的神经元的输入值，b是偏置值。5.根据权利要求1所述的方法，其特征在于，所述基于所述第一类型、所述目标特征向量以及所述第二类型，确定所述目标书页图像中学习对象的目标类型，包括：从预先构建的特征向量搜索库中搜索出与所述目标特征向量之间的相似度满足第一相似度条件的多个待遍历向量；基于所述多个待遍历向量分别携带的标签类型、所述第一类型以及所述第二类型，确定所述目标类型。6.根据权利要求5所述的方法，其特征在于，所述基于所述多个待遍历向量分别携带的标签类型、所述第一类型以及所述第二类型，确定所述目标类型，包括：判断所述第一类型与所述第二类型是否一致；若所述第一类型与所述第二类型一致，则将所述第一类型作为所述目标类型；若所述第一类型与所述第二类型不一致，则从所述多个待遍历向量中选择相似度最高的向量，作为所述目标特征向量的目标相似变量；判断所述第一类型与所述目标相似向量携带的标签类型是否一致；若所述第一类型与所述目标相似向量携带的标签类型一致，则将所述第一类型作为所
述目标类型。7.根据权利要求6所述的方法，其特征在于，还包括：若所述第一类型与所述目标相似向量携带的标签类型不一致，则判断所述目标相似变量携带的标签类型与所述第二类型是否一致；若所述目标相似变量携带的标签类型与所述第二类型一致，则将所述目标相似变量携带的标签类型作为所述目标类型。8.根据权利要求7所述的方法，其特征在于，还包括：若所述目标相似变量携带的标签类型与所述第二类型不一致，从所述多个待遍历向量中搜索出与所述目标特征向量携带的标签类型一致的多个第一候选特征向量，以及，从所述多个待遍历向量中搜索出与所述第一类型一致的多个第二候选特征向量；将每个所述第一候选特...

【专利技术属性】
技术研发人员：兴百桥，
申请(专利权)人：深圳市星桐科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人