音频和视频多媒体的修改和呈现制造技术

技术编号:26734717 阅读:45 留言:0更新日期:2020-12-15 14:43
提供了一种用于改进音频和视频多媒体修改和呈现的方法和系统。方法包括:接收音频/视频流;以及分析音频/视频流的对象,以针对对象生成预测。针对音频/视频流执行组件分析代码,并且从音频/视频流中移除对象从而生成修改后的音频/视频流,从而减少了音频/视频流的硬件存储和传输大小要求。修改的音频/视频流通过图形用户界面呈现给用户。

【技术实现步骤摘要】
【国外来华专利技术】音频和视频多媒体的修改和呈现
本专利技术总体上涉及一种用于修改音频和视频多媒体的方法,尤其涉及一种用于改进与从音频/视频流中移除对象的硬件设备相关联的音频和视频多媒体技术的方法和相关系统,从而减少了音频/视频流的硬件存储和传输大小要求。
技术介绍
通常在给定的一天中观看多个小时的广播视频流与众所周知的过程相关联。同样,移动设备市场的增长与互联网对移动设备的当前访问可用性相结合,使得可以在任何时间,任何位置轻松访问多媒体内容。当前的预测估计,未来多媒体内容的水平将增长到数百万兆兆字节。当前存在关于减小多媒体的大小以解决传输的大量数据的大量解决方案。与基于整个视觉场景中的对象运动确定的捕获或帧速率相关的过程可能会导致使用较少的带宽。在多媒体数据传输期间分配网络资源或压缩图像可以实现视频信号的更快传输。类似地,用于检测运动图像中的像素的过程可以使用户能够查看某些对象。然而,前述解决方案可能需要使用不准确且复杂的系统来传输多媒体流。另外,前述解决方案可能导致较慢的数据传输速率。结果,当前的解决方案不包括减小传输大小要求的有效手段。因此,在本领域中需要实现一种用于发送多媒体内容的有效手段。
技术实现思路
本专利技术的第一方面提供了一种基于音频和视频多媒体部分移除的修改和呈现改进方法,包括:硬件设备的处理器从本地或远程源接收音频/视频流;执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测,从而通过检测主要关注对象相对于非主要关注对象的运动来标识和标记主要和非主要关注对象并确定相关联的交互;处理器针对音频/视频流执行分量分析代码,从而导致根据指定时间段针对音频/视频流的各个帧解析每个对象的过程,从而基于主要关注对象的改变来预测非主要关注对象的改变;处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象,从而导致生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;和处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。本专利技术的一些实施例还提供了一种用于:确定附加对象比原始对象更位于GUI内的中央;检索音频/视频流的其他视图;向修改后的音频/视频流添加一个附加对象;和通过GUI呈现包括附加对象的修改的音频/视频流。这些实施例有利地提供了一种有效的手段,用于基于图像内音频/视频对象之间的交互来隔离音频和视频馈送的主要成分,以针对(在多媒体流内)视觉核心动作集中用户的注意力。另外,本专利技术的这些实施例有利地使得能够基于音频/视频对象运动来实现语义修剪过程,并且可以被配置通过平滑相邻像素使用户专注于每个音频/视频帧内的高潮动作而不是围绕核心对象的多余对象来减小多媒体流的大小。本专利技术的第二方面提供了一种计算机程序产品,包括存储计算机可读程序代码的计算机可读硬件存储设备,计算机可读程序代码包括算法,在由硬件设备的处理器执行时实现基于音频和视频多媒体部分移除的修改和呈现改进方法,方法包括:硬件设备的处理器从本地或远程源接收音频/视频流;执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测,从而通过检测主要关注对象相对于非主要关注对象的运动来标识和标记主要和非主要关注对象并确定相关联的交互;处理器针对音频/视频流执行分量分析代码,从而导致根据指定时间段针对音频/视频流的各个帧解析每个对象的过程,从而基于主要关注对象的改变来预测非主要关注对象的改变;处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象,从而导致生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;和处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。本专利技术的一些实施例还提供了一种用于:确定附加对象比原始对象更位于GUI内的中央;检索音频/视频流的其他视图;向修改后的音频/视频流添加一个附加对象;和通过GUI呈现包括附加对象的修改的音频/视频流。这些实施例有利地提供了一种有效的手段,用于基于图像内音频/视频对象之间的交互来隔离音频和视频馈送的主要成分,以针对(在多媒体流内)视觉核心动作集中用户的注意力。另外,本专利技术的这些实施例有利地使得能够基于音频/视频对象运动来实现语义修剪过程,并且可以被配置通过平滑相邻像素使用户专注于每个音频/视频帧内的高潮动作而不是围绕核心对象的多余对象来减小多媒体流的大小。本专利技术的第三方面提供了一种硬件设备,包括耦合至计算机可读存储单元的处理器,存储单元包括指令,指令在由处理器执行时实现基于音频和视频多媒体部分移除的修改和呈现改进方法,方法包括:硬件设备的处理器从本地或远程源接收音频/视频流;执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测,从而通过检测主要关注对象相对于非主要关注对象的运动来标识和标记主要和非主要关注对象并确定相关联的交互;处理器针对音频/视频流执行分量分析代码,从而导致根据指定时间段针对音频/视频流的各个帧解析每个对象的过程,从而基于主要关注对象的改变来预测非主要关注对象的改变;处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象,从而导致生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;和处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。本专利技术的一些实施例还提供了一种用于:确定附加对象比原始对象更位于GUI内的中央;检索音频/视频流的其他视图;向修改后的音频/视频流添加一个附加对象;和通过GUI呈现包括附加对象的修改的音频/视频流。这些实施例有利地提供了一种有效的手段,用于基于图像内音频/视频对象之间的交互来隔离音频和视频馈送的主要成分,以针对(在多媒体流内)视觉核心动作集中用户的注意力。另外,这些实施例有利地使得能够基于音频/视频对象运动来实现语义修剪过程,并且可以被配置通过平滑相邻像素使用户专注于每个音频/视频帧内的高潮动作而不是围绕核心对象的多余对象来减小多媒体流的大小。本专利技术的第四方面提供了一种音频和视频多媒体的修改和呈现改进方法,包括:硬件设备的处理器从本地或远程源接收音频/视频流;执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测;处理器针对音频/视频流执行分量分析代码;处理器响应于分量分析代码的执行针对对象的至少一个附加对象修改对象的一个对象从而生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;以及处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。本专利技术的一些实施例还提供一种方法,使得修改视频对象可以包括减小对象的尺寸、模糊对象的视图或增强对象的视图。本专利技术的另一方面提供了一种方法,使得修改音频对象可以包括增加或减少对象的可听水平。这些实施例有利地提供了一种有效的手段,用于基于图像内音频/视频对象之间的交互来隔离音频和视频馈送的主要成分,以针对(在多媒体流内)视觉核心动作集中用户的注意力。另外,本专利技术的这些实施例有利地使得能够基于音频/视频对象运动来实现语义修剪过程,并且可以被配置为通过使相邻像素平本文档来自技高网...

【技术保护点】
1.一种基于音频和视频多媒体部分移除的修改和呈现改进方法,包括:/n硬件设备的处理器从本地或远程源接收音频/视频流;/n执行R

【技术特征摘要】
【国外来华专利技术】20180619 US 16/011,9051.一种基于音频和视频多媒体部分移除的修改和呈现改进方法,包括:
硬件设备的处理器从本地或远程源接收音频/视频流;
执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测;
处理器针对音频/视频流执行分量分析代码;
处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象从而生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;以及
处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。


2.根据权利要求1所述的方法,其中所述分析音频/视频流的对象包括:
识别对象的主要关注对象;
识别对象的非主要关注对象;
标记主要关注对象和非主要关注对象;以及
基于标记的结果,相对于音频/视频流的各个帧确定主要关注和非主要关注对象之间的交互,其中基于所述交互执行所述移除,并且其中所述移除导致将用户的关注指向所述主要关注对象。


3.根据权利要求2所述的方法,其中确定所述交互包括检测在各个帧内主要关注对象相对于非主要关注对象的运动。


4.根据权利要求1所述的方法,其中所述对象包括视频对象。


5.根据权利要求1所述的方法,其中所述对象包括音频对象。


6.根据权利要求1所述的方法,其中所述对象包括视频对象和相关的音频对象。


7.根据权利要求1所述的方法,还包括:
处理器在远程数据库中存储修改后的音频/视频流。


8.根据权利要求1所述的方法,其中,针对音频/视频流执行所述分量分析代码导致根据指定的时间段针对音频/视频流的各个帧解析每个所述对象。


9.根据权利要求1所述的方法,还包括:
处理器响应于分量分析代码的执行确定所述对象的附加对象比所述对象更位于所述GUI内的中央,其中,所述移除还基于所述确定的结果。


10.根据权利要求1所述的方法,针对音频/视频流执行分量分析代码:
确定主要关注对象;
识别非主要关注对象;
确定主要关注对象与非主要关注对象之间的交互;以及
基于对主要关注对象的变化,预测对非主要关注对象的变化。


11.根据权利要求1所述的方法,还包括:
处理器从本地或远程源检索音频/视频流的其他视图;
处理器响应于分量分析代码的执行向修改后的音频/视频流添加一个附加对象;以及
处理器和通过GUI呈现包括附加对象的修改的音频/视频流。


12.根据权利要求1所述的方法,还包括:
为在控制硬件中创建、集成、托管、维护和部署计算机可读代码中的至少一项提供至少一种支持服务,所述代码由计算机处理器执行以实现:所述接收、所述分析、所述执行、所述移除和所述呈现。


13.一种计算机程序产品,包括存储计算机可读程序代码的计算机可读硬件存储设备,计算机可读程序代码包括算法,在由硬件设备的处理器执行时实现基于音频和视频多媒体部分移除的修改和呈现改进方法,方法包括:
硬件设备的处理器从本地或远程源接收音频/视频流;
执行R2统计回归代码的处理器分析音频/视频流的对象,以针对音频/视频流的对象生成预测;
处理器针对音频/视频流执行分量分析代码;
处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象从而生成修改的音频/视频流,使得音频/视频流的硬件存储和传输大小要求降低;以及
处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。


14.一种硬件设备,包括耦合至计算...

【专利技术属性】
技术研发人员:T·R·惠特曼A·鲍格曼D·巴斯蒂安N·迈克罗里
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1