音频和视频多媒体的修改和呈现制造技术

技术编号：26734717 阅读：45 留言：0更新日期：2020-12-15 14:43

提供了一种用于改进音频和视频多媒体修改和呈现的方法和系统。方法包括：接收音频/视频流；以及分析音频/视频流的对象，以针对对象生成预测。针对音频/视频流执行组件分析代码，并且从音频/视频流中移除对象从而生成修改后的音频/视频流，从而减少了音频/视频流的硬件存储和传输大小要求。修改的音频/视频流通过图形用户界面呈现给用户。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】音频和视频多媒体的修改和呈现
本专利技术总体上涉及一种用于修改音频和视频多媒体的方法，尤其涉及一种用于改进与从音频/视频流中移除对象的硬件设备相关联的音频和视频多媒体技术的方法和相关系统，从而减少了音频/视频流的硬件存储和传输大小要求。
技术介绍
通常在给定的一天中观看多个小时的广播视频流与众所周知的过程相关联。同样，移动设备市场的增长与互联网对移动设备的当前访问可用性相结合，使得可以在任何时间，任何位置轻松访问多媒体内容。当前的预测估计，未来多媒体内容的水平将增长到数百万兆兆字节。当前存在关于减小多媒体的大小以解决传输的大量数据的大量解决方案。与基于整个视觉场景中的对象运动确定的捕获或帧速率相关的过程可能会导致使用较少的带宽。在多媒体数据传输期间分配网络资源或压缩图像可以实现视频信号的更快传输。类似地，用于检测运动图像中的像素的过程可以使用户能够查看某些对象。然而，前述解决方案可能需要使用不准确且复杂的系统来传输多媒体流。另外，前述解决方案可能导致较慢的数据传输速率。结果，当前的解决方案不包括减小传输大小要求的有效手段。因此，在本领域中需要实现一种用于发送多媒体内容的有效手段。
技术实现思路
本专利技术的第一方面提供了一种基于音频和视频多媒体部分移除的修改和呈现改进方法，包括：硬件设备的处理器从本地或远程源接收音频/视频流；执行R2统计回归代码的处理器分析音频/视频流的对象，以针对音频/视频流的对象生成预测，从而通过检测主要关注对象相对于非主要关注对象的运动来标识和标记主要和非主...

【技术保护点】
1.一种基于音频和视频多媒体部分移除的修改和呈现改进方法，包括：/n硬件设备的处理器从本地或远程源接收音频/视频流；/n执行R

【技术特征摘要】
【国外来华专利技术】20180619 US 16/011,9051.一种基于音频和视频多媒体部分移除的修改和呈现改进方法，包括：
硬件设备的处理器从本地或远程源接收音频/视频流；
执行R2统计回归代码的处理器分析音频/视频流的对象，以针对音频/视频流的对象生成预测；
处理器针对音频/视频流执行分量分析代码；
处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象从而生成修改的音频/视频流，使得音频/视频流的硬件存储和传输大小要求降低；以及
处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。

2.根据权利要求1所述的方法，其中所述分析音频/视频流的对象包括：
识别对象的主要关注对象；
识别对象的非主要关注对象；
标记主要关注对象和非主要关注对象；以及
基于标记的结果，相对于音频/视频流的各个帧确定主要关注和非主要关注对象之间的交互，其中基于所述交互执行所述移除，并且其中所述移除导致将用户的关注指向所述主要关注对象。

3.根据权利要求2所述的方法，其中确定所述交互包括检测在各个帧内主要关注对象相对于非主要关注对象的运动。

4.根据权利要求1所述的方法，其中所述对象包括视频对象。

5.根据权利要求1所述的方法，其中所述对象包括音频对象。

6.根据权利要求1所述的方法，其中所述对象包括视频对象和相关的音频对象。

7.根据权利要求1所述的方法，还包括：
处理器在远程数据库中存储修改后的音频/视频流。

8.根据权利要求1所述的方法，其中，针对音频/视频流执行所述分量分析代码导致根据指定的时间段针对音频/视频流的各个帧解析每个所述对象。

9.根据权利要求1所述的方法，还包括：
处理器响应于分量分析代码的执行确定所述对象的附加对象比所述对象更位于所述GUI内的中央，其中，所述移除还基于所述确定的结果。

10.根据权利要求1所述的方法，针对音频/视频流执行分量分析代码：
确定主要关注对象；
识别非主要关注对象；
确定主要关注对象与非主要关注对象之间的交互；以及
基于对主要关注对象的变化，预测对非主要关注对象的变化。

11.根据权利要求1所述的方法，还包括：
处理器从本地或远程源检索音频/视频流的其他视图；
处理器响应于分量分析代码的执行向修改后的音频/视频流添加一个附加对象；以及
处理器和通过GUI呈现包括附加对象的修改的音频/视频流。

12.根据权利要求1所述的方法，还包括：
为在控制硬件中创建、集成、托管、维护和部署计算机可读代码中的至少一项提供至少一种支持服务，所述代码由计算机处理器执行以实现：所述接收、所述分析、所述执行、所述移除和所述呈现。

13.一种计算机程序产品，包括存储计算机可读程序代码的计算机可读硬件存储设备，计算机可读程序代码包括算法，在由硬件设备的处理器执行时实现基于音频和视频多媒体部分移除的修改和呈现改进方法，方法包括：
硬件设备的处理器从本地或远程源接收音频/视频流；
执行R2统计回归代码的处理器分析音频/视频流的对象，以针对音频/视频流的对象生成预测；
处理器针对音频/视频流执行分量分析代码；
处理器响应于分量分析代码的执行从音频/视频流中移除所述对象的一个对象从而生成修改的音频/视频流，使得音频/视频流的硬件存储和传输大小要求降低；以及
处理器通过图形用户界面(GUI)呈现修改后的音频/视频流。

14.一种硬件设备，包括耦合至计算...

【专利技术属性】
技术研发人员：T·R·惠特曼，A·鲍格曼，D·巴斯蒂安，N·迈克罗里，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人