基于AI检测或分类结果改变音频或视频压缩制造技术

技术编号:28430466 阅读:35 留言:0更新日期:2021-05-11 18:40
本公开涉及基于AI检测或分类结果改变音频或视频压缩。在一个实施方案中,计算设备从一个或多个相机接收包括多个帧的视频流,其中该视频流以第一质量被接收。该计算设备使用机器学习模型来分析帧中的图像,其中该机器学习模型已被训练以检测图像中的一个或多个感兴趣对象。该计算设备识别包括视频流的连续帧的感兴趣序列,其中在该连续帧中的至少一个帧中检测到至少一个感兴趣对象。该计算设备生成包括该感兴趣序列的视频包。

【技术实现步骤摘要】
基于AI检测或分类结果改变音频或视频压缩
本公开整体涉及机器学习任务,并且更具体地涉及由机器学习任务执行的活动的指示。
技术介绍
包括神经网络的机器学习技术可应用于计算机视觉、音频处理和其他领域中的问题。神经网络可用于执行诸如图像分类、对象检测、图像分割和语音识别等任务。神经网络已被训练成使用大型数据集对图像进行分类,该大型数据集包括例如具有地面实况标签的数百万个图像。可对从传感器诸如相机、麦克风等接收的输入执行机器学习技术。传感器可附接到用户的计算设备,诸如膝上型电脑或移动电话。例如,网络摄像头可以捕获用户的视频,并且麦克风可以捕获用户的语音。
技术实现思路
在特定实施方案中,包括相机的计算设备可用于网络环境中以监测场景。相机可用于捕获场景内的活动的细节。一般来讲,相机可用作安全措施,以在用户需要查看由相机捕获的录像素材的情况下提供材料。然而,该录像素材通常可能不是最佳质量。这可能是需要为一整天、一整周等时间采集的所有材料节省储存空间的结果。如今使用的相机可能能够产生高质量视频,但在许多情况下,出于存储目的的考虑,保持这种本文档来自技高网...

【技术保护点】
1.一种方法,所述方法包括由一个或多个计算设备:/n从一个或多个相机接收包括多个帧的视频流,其中所述视频流以第一质量被接收;/n使用机器学习模型来分析所述帧中的图像,其中所述机器学习模型已被训练以检测所述图像中的一个或多个感兴趣对象;/n识别包括所述视频流的第一多个连续帧的感兴趣序列,其中在所述连续帧中的至少一个帧中检测到至少一个感兴趣对象;并且/n生成包括所述感兴趣序列的视频包。/n

【技术特征摘要】
20191101 US 16/672,3571.一种方法,所述方法包括由一个或多个计算设备:
从一个或多个相机接收包括多个帧的视频流,其中所述视频流以第一质量被接收;
使用机器学习模型来分析所述帧中的图像,其中所述机器学习模型已被训练以检测所述图像中的一个或多个感兴趣对象;
识别包括所述视频流的第一多个连续帧的感兴趣序列,其中在所述连续帧中的至少一个帧中检测到至少一个感兴趣对象;并且
生成包括所述感兴趣序列的视频包。


2.根据权利要求1所述的方法,还包括:
响应于确定在所述感兴趣序列之后的所述帧中的最小数量的图像中未检测到所述一个或多个感兴趣对象,传输所述视频包。


3.根据权利要求1所述的方法,还包括:
响应于确定在所述感兴趣序列之后的所述帧中的最小数量的图像中未检测到所述一个或多个感兴趣对象,存储所述视频包。


4.根据权利要求1所述的方法,还包括:
在所述分析期间,响应于在所述图像中检测到所述一个或多个感兴趣对象,开始在缓冲器中与所述感兴趣序列对应的所述视频流的帧存储。


5.根据权利要求4所述的方法,还包括:
响应于确定在所述感兴趣序列之后的所述帧中的最小数量的图像中未检测到所述一个或多个感兴趣对象,结束所述缓冲器中的所述帧存储。


6.根据权利要求5所述的方法,其中所述视频包是在结束所述缓冲器中的所述帧存储之后生成的。


7.根据权利要求4所述的方法,其中所述视频包是响应于确定所述缓冲器已降至低于可用容量的最小阈值而生成的。


8.根据权利要求1所述的方法,还包括:
确定在包括在所述感兴趣序列之前或之后接收的所述视频流的第二多个连续帧的连续视频帧序列的图像中未检测到所述感兴趣对象;
响应于确定在所述连续视频帧序列的图像中未检测到所述感兴趣对象,将所述连续视频帧序列压缩至第二质量,其中所述压缩...

【专利技术属性】
技术研发人员:P·扎特卢卡尔
申请(专利权)人:希侬人工智能公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1