【技术实现步骤摘要】
一种图像内容识别方法、装置、设备及存储介质
[0001]本专利技术涉及计算机
,具体涉及一种图像内容识别方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]随着计算机技术的不断发展,点读设备应运而生。点读设备是基于光学图像识别技术和先进的数码语音技术开发而成的新一代智能阅读和学习工具。它实现了电子产品与教育行业的融合,为人们的生活和学习提供了便捷。实践发现,受周围环境及设备性能等因素的影响,点读设备的正确识别率较低。
技术实现思路
[0003]本专利技术实施例提供了一种图像内容识别方法、装置、设备及存储介质,能够较好地提高点读设备的正确识别率。
[0004]一方面,本申请实施例提供了一种图像内容识别方法,该方法包括:
[0005]获取待识别图像帧,并确定所述待识别图像帧的状态;
[0006]若确定所述待识别图像帧的状态为静止状态,则调用对象定位模型对所述待识别图像帧进行处理,并根据对象定位模型的处理结果得到区域图像;
[0007]调用局部定位模型对所述区域图像进 ...
【技术保护点】
【技术特征摘要】
1.一种图像内容识别方法,其特征在于,所述方法包括:获取待识别图像帧,并确定所述待识别图像帧的状态;若确定所述待识别图像帧的状态为静止状态,则调用对象定位模型对所述待识别图像帧进行处理,并根据对象定位模型的处理结果得到区域图像;调用局部定位模型对所述区域图像进行处理,并根据局部定位模型的处理结果得到热点图像,所述热点图像中包括热点区域;根据所述热点区域在热点图像中的图像位置,从所述待识别图像帧中确定出关联图像;对所述待识别图像帧中的关联图像进行多媒体处理,并输出所述关联图像的多媒体处理结果。2.如权利要求1所述的方法,其特征在于,所述获取待识别图像帧,包括:获取光线传感器对环境进行检测后输出的检测数据;若检测数据满足补光条件,则调用光线传感器进行补光辅助处理,并获取拍摄装置拍摄得到的待识别图像帧;若检测数据不满足补光条件,则获取拍摄装置拍摄得到的待识别图像帧。3.如权利要求1所述的方法,其特征在于,所述确定所述待识别图像帧的状态,包括:获取所述待识别图像帧所在的图像帧集合,该图像帧集合中包括按照时间先后顺序拍摄得到的N个图像帧;通过帧间差异算法分别计算所述图像帧集合中相邻图像帧的帧间差异信息;若根据所述图像帧集合中相邻图像帧的帧间差异信息确定所述待识别图像帧满足静止条件,则判定所述待识别图像帧为静止状态;若图像帧集合中相邻图像帧的帧间差异信息确定所述待识别图像帧不满足静止条件,则将获取到的下一图像帧作为新的待识别图像帧。4.如权利要求3所述的方法,其特征在于,所述通过帧间差异算法分别计算所述图像帧集合中相邻图像帧的帧间差异信息,包括:计算所述图像帧集合中第i+1个图像帧与第i个图像帧之间匹配像素点之间的像素差异值,i为正整数,且i小于N;根据所述像素差异值进行二值化处理,得到所述第i+1个图像帧与第i个图像帧之间的帧间差异二值图,所述帧间差异二值图上的像素值包括第一数值和第二数值,在所述第i+1个图像帧与第i个图像帧的匹配像素点的像素值差值大于预设阈值,则所述帧间差异二值图上相应位置处的像素值为第一数值,否则为第二数值;其中,当对各个帧间差异二值图中值为第一数值的数量进行统计得到的数量值小于数量阈值,则确定所述待识别图像帧满足静止条件。5.如权利要求1所述的方法,其特征在于,所述对象定位模型用于从输入的待识别图像帧中确定目标对象的图像位置,该图像位置用于确定所述区域图像,所述对象定位模型包括主干网络层、分类检测层及预测层;所述主干网络层用于提取所述待识别图像帧在M个不同尺度下的特征子图,M为大于1的整数,M个特征子图的通道数也不相同;所述分类检测层用于确定所述M个不同尺度下的特征子图中的目标对象区域;所述预
测层用于根据各个目标对象区域预测所述目标对象在所述待识别图像帧中的位置及概率。6.如权利要求1或5所述的方法,其特征在于,所述局部定位模型用于从输入的区域图像中确定目标对象的局部对象的图像位置,所述局部定位模型包括特征提取层,特征融合层,反卷积层和像素回归层;所述特征提取层用于提取所述区域图像在P个不同尺度下的特征子图,第j个特征子图的尺度是第j+1个特征子图的尺度的两倍,P为大于1的整数,j为正整数,且j小于P;所述特征融合层用于对第P个特征子图和第P
‑
1个特征子图进行特征融合得到特征图;所述反卷积层用于对所述特征图进行反卷积处理...
【专利技术属性】
技术研发人员:陈柱,项小明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。