【技术实现步骤摘要】
视频的处理方法、装置及系统
[0001]本申请涉及互联网领域,具体而言,涉及一种视频的处理方法、装置及系统。
技术介绍
[0002]目前在直播过程中,主播往往会依次向观众展示多款商品,而且,在同一时刻主播仅推荐一个产品,其余产品虽然会显示在直播视频中,但属于直播间的背景商品,也即,在同一时刻直播视频中仅有一个产品作为显示对象进行展示。
[0003]为了能够从直播视频中识别出主播主推的商品,需要对直播视频进行目标检测。现有检测方法是基于对候选框进行分类实现的,对于同一类别的产品均可以检测出来,如图1所示的方框,均属于服饰类别。但是,在直播视频中,上述检测方法不仅仅可以识别出主播当前主推的产品(如图1中所示的第1类产品),而且会识别出其他属于背景产品的产品(如图1中所示的第2类产品),导致识别结果存在干扰,准确率较低。
[0004]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本申请实施例提供了一种视频的处理方法、装置及系统,以至少解决相关技术中的图像识别方法对直播视频中主推产品的识别准确度较低的技术问题。
[0006]根据本申请实施例的一个方面,提供了一种视频的处理方法,包括:获取直播视频中显示的不同类型的对象,其中,对象包括:推荐的前景对象,以及在直播视频中展现的除前景对象之外的备选对象;基于筛选条件,从不同类型的对象中识别出直播视频中展示的前景对象,其中,筛选条件由至少一个用于表征具有前景对象特点的特征参数构成;输出前景对象。
[0007]根 ...
【技术保护点】
【技术特征摘要】
1.一种视频的处理方法,其特征在于,包括:获取直播视频中显示的不同类型的对象,其中,所述对象包括:推荐的前景对象,以及在所述直播视频中展现的除所述前景对象之外的备选对象;基于筛选条件,从所述不同类型的对象中识别出所述直播视频中展示的所述前景对象,其中,所述筛选条件由至少一个用于表征具有所述前景对象特点的特征参数构成;输出所述前景对象。2.根据权利要求1所述的方法,其特征在于,所述特征参数包括如下至少之一:所述对象在所述直播视频中的显示位置、显示时长、运动信息和与推荐信息的匹配结果,其中,所述推荐信息包括所述直播视频中同步输出的文字信息和主播输出的语音信息。3.根据权利要求2所述的方法,其特征在于,所述筛选条件由如下至少一个特征参数确定的条件构成:在所述直播视频中的显示位置位于关键位置,其中,所述关键位置包括:所述直播视频的中心位置、与主播间距最小的位置和预定的固定位置;在所述直播视频中的显示时长超过预定时长;在所述直播视频中的预定时间段内产生的移动频率最高;在所述直播视频中展示的所有对象中发生移动的时间最长;与所述直播视频中显示的对象特征与所述推荐信息匹配度最高。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:解析所述推荐信息,生成关键特征信息,其中,所述关键特征信息包括如下至少之一:从所述文字信息中解析到的关键词句和从所述语音信息中解析到的关键词句;将所述直播视频中显示的每个对象的对象特征分别与所述关键特征信息比对,获取比对结果,其中,所述比对结果用于表征每个对象分别与所述推荐信息的匹配度。5.根据权利要求1至4中任意一项所述的方法,其特征在于,获取直播视频中显示的不同类型的对象,包括:获取待检测的所述直播视频;采用预测模型识别所述待检测的直播视频,从所述直播视频的直播画面中检测出不同类型的对象,其中,采用检测框来标识识别到的对象。6.根据权利要求5所述的方法,其特征在于,在采用预测模型识别所述待检测的直播视频之前,所述方法还包括:获取历史直播视频中的多帧历史图片;对每帧历史图片进行标注,标注出所述历史图片中的前景对象和备选对象,其中,所述历史图片中的前景对象和备选对象采用不同的检测框进行标识;基于标注了前景对象和备选对象的历史图片来训练神经网络模型,生成所述预测模型。7.根据权利要求6所述的方法,其特征在于,获取历史直播视频中的多帧历史图片,包括:获取待识别的所述历史直播视频,获取每帧视频帧对应的运动历史图,以及所述视频帧中每个像素对应的坐标;基于所述视频帧中每个像素对应的坐标,沿通道维度进行图像拼接,得到所述多帧历
史图片。8.一种视频的处理方法,其特征在于,包括:在显示界面中播放直播视频;在所述显示界面中显示所述直播视频中播放的不同类型的对象,其中,所述对象包括:推荐的前景对象,以及在所述直播视频中展现的除所述前景对象之外的备选对象;在所述直播视频中标注出所述前景对象,其中,所述前景对象为所述直播视频播放的对象中满足筛选条件的对象,其中,所述筛选条件由至少一个用于表征具有所述前景对象特点的特征参数构成。9.根据权利要求8所述的方法,其特征在于,所述特征参数包括如下至少之一:所述对象在所述直播视频中的显示位置、显示时长、运动信息和与推荐信息的匹配结果,其中,所述推荐信息包括所述直播视频中同步输出的文字信息和主播输出的语音信息。10.根据权...
【专利技术属性】
技术研发人员:谢晨伟,张严浩,熊雄,郑赟,潘攀,徐盈辉,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。