用认知洞察力导航视频场景制造技术

技术编号:23563939 阅读:28 留言:0更新日期:2020-03-25 08:22
本发明专利技术的实施例包括用于从数据库获取场景的方法、系统和计算机程序产品。本发明专利技术的各方面包括接收对存储在包括带注释的视频内容的数据库中的场景的搜索请求。从搜索请求中提取一个或多个关键词。为每个关键词生成扩展关键词。将扩展关键词和关键词与带注释的视频内容进行比较,识别出包含目标场景注释的目标场景。至少部分地根据每个目标场景的目标场景注释与扩展关键词和关键词之间的相关性,为每个目标场景分配置信度等级。以及向用户显示至少一个目标场景,其中,基于置信度等级确定所述至少一个目标场景。

Navigating video scenes with cognitive insight

【技术实现步骤摘要】
【国外来华专利技术】用认知洞察力导航视频场景
本专利技术涉及导航视频场景,更具体地说,涉及使用认知洞察力导航视频场景的方法和系统。
技术介绍
随着计算机性能的不断提升,数字视频的使用变得越来越普遍。观看视频已经成为我们日常生活中最受欢迎的娱乐活动之一,正如研究表明的那样,超过50%的互联网带宽消耗于视频服务。有了现成的摄像机、智能手机和其他手持设备,人们正在记录越来越多的旅行、重要的庆祝活动和家庭时光。此外,数字视频技术在大多数监控系统中都得到了应用。然而,使用和管理这些海量视频数据确实会出现问题。人们可能希望观看电影或家庭视频的特定场景,而不是整个视频。同样,警察或安全人员可能希望从大量的视频数据中找到并收集证据。在一个或多个视频文件中查找和导航到特定场景通常非常耗时且困难。使用现有技术,用户必须通过使用快进模式观看视频,或者反复拖动滑块,直到找到期望的场景为止。此外,一些视频按章节进行分解,用户可以导航到场景可能位于的特定章节。这些技术需要从用户的视频内存中进行大量导航才能找到场景。此外,用户可能以前没有观看过视频,可能在基于来自另一个观看者的建议来搜索场景。这一领域有一些解决方案,但它们并不能直接满足需求。例如,许多现代视频播放器“记住”播放电影的上一个断点,以便下一次从其停止的位置自动恢复电影。但是这个解决方案是基于历史记录的,并且是为单个用户和客户机设计的,因此,如果没有给定用户的以前的记录,或者在多用户的情况下,该解决方案不会很好地工作。其他系统采用面部识别来在视频流中查找特定的人;然而,这并不能解决使用一般描述来查找特定场景的问题,也不能解决在多个场景中查找特定场景的问题。在这种情况下使用这种技术将是一个问题,因为提供给用户的大量结果将需要额外的手工过滤。因此,需要一种据以能够从单个视频或大量视频数据中快速、准确地发现所需场景的新方法。
技术实现思路
实施例包括一种用于从数据库获取场景的计算机实现的方法。该计算机实现的方法的非限制性示例包括接收对存储在数据库中的场景的搜索请求,该数据库中存储有带注释的视频内容。从搜索请求中提取一个或多个关键词。为每个关键词生成扩展关键词。将扩展关键词和关键词与带注释的视频内容进行比较,识别出包含目标场景注释的目标场景。至少部分地根据每个目标场景的目标场景注释与扩展关键词和关键词之间的相关性,为每个目标场景分配置信度等级。以及向用户显示至少一个目标场景,其中,基于置信度等级确定所述至少一个目标场景。实施例包括一种用于从数据库获取场景的计算机系统,该计算机系统具有处理器,处理器被配置为执行一种方法。该系统的非限制性示例包括接收对存储在数据库中的场景的搜索请求,该数据库中存储有带注释的视频内容。从搜索请求中提取一个或多个关键词。为每个关键词生成扩展关键词。将扩展关键词和关键词与带注释的视频内容进行比较,识别出包含目标场景注释的目标场景。至少部分地根据每个目标场景的目标场景注释与扩展关键词和关键词之间的相关性,为每个目标场景分配置信度等级。以及向用户显示至少一个目标场景,其中,基于置信度等级确定所述至少一个目标场景。实施例还包括一种用于从数据库获取场景的计算机程序产品,该计算机程序产品包括具有计算机可读程序代码的非暂时性计算机可读存储介质。计算机可读程序代码包括被配置成执行一种方法的程序指令。该方法的非限制性示例包括接收对存储在数据库中的场景的搜索请求,该数据库中存储有带注释的视频内容。从搜索请求中提取一个或多个关键词。为每个关键词生成扩展关键词。将扩展关键词和关键词与带注释的视频内容进行比较,识别出包含目标场景注释的目标场景。至少部分地根据每个目标场景的目标场景注释与扩展关键词和关键词之间的相关性,为每个目标场景分配置信度等级。以及向用户显示至少一个目标场景,其中,基于置信度等级确定所述至少一个目标场景。实施例包括一种用于注释视频场景的计算机实现方法。计算机实现方法的非限制性示例包括由处理器接收一个或多个视频。将该一个或多个视频分割成场景集合。分析该场景集合中的第一场景以确定第一场景的标签集合。用该标签集合注释第一场景并将其存储在数据库中。实施例包括一种用于注释视频场景的计算机系统,该计算机系统具有处理器,该处理被配置为执行一种方法。该系统的非限制性示例包括由处理器接收一个或多个视频。将该一个或多个视频分割成场景集合。分析该场景集合中的第一场景以确定第一场景的标签集合。用该标签集合注释第一场景并将其存储在数据库中。通过本专利技术的技术实现了其它特征和优点。本文中详细描述了本专利技术的其他实施例和各个方面,它们被认为是所要求保护的本专利技术的一部分。为了更好地理解,请参阅说明和附图。附图说明结尾处的权利要求书中特别指出并明确声明了本文所述专有权利的具体内容。以下结合附图的详细描述清楚地表明了本专利技术实施例的上述和其他特点和优点,其中:图1描绘根据本专利技术的一个或多个实施例的云计算环境;图2描绘根据本专利技术的一个或多个实施例的抽象模型层;图3示出了用于实践本文中的教导的计算机系统的框图;图4描绘了根据一个或多个实施例的用于导航数字视频的系统的框图;图5描绘了根据一个或多个实施例的用于导航数字视频的系统的示例;图6描绘了根据一个或多个实施例的用于从数据库获取场景的方法的流程图;图7描绘了根据一个或多个实施例的用于注释视频场景的方法的流程图。本文中所示的附图是说明性的。在不脱离本专利技术精神的情况下,附图或附图中描述的操作可以有许多变化。例如,可以按不同的顺序执行操作,也可以添加、删除或修改操作。此外,术语“耦合”及其变体描述了在两个元件之间具有通信路径,并且不意味着元件之间的没有介于它们之间的中间元件/连接的直接连接。所有这些变化都被视为说明书的一部分。在附图以及以下对所公开的实施例的详细描述中,附图中所示的各种元件具有两位或三位数字的标记号。除了一些小的例外,每个标记号的最左边数字对应于其元素首次被示出的图。具体实施方式本文参考相关附图描述本专利技术的各种实施例。在不脱离本专利技术范围的情况下,可以设计本专利技术的替代实施例。在以下描述和附图中的元素之间列出各种连接和位置关系(例如,上方、下方、相邻等)。除非另有规定,否则这些连接和/或位置关系可以是直接的或间接的,并且本专利技术并不旨在对这方面进行限制。因此,实体的耦合可以指直接或间接的耦合,实体之间的位置关系可以是直接或间接的位置关系。此外,本文所描述的各种任务和过程步骤可以并入具有本文未详细描述的其它步骤或功能的更全面的程序或过程。以下定义和缩写用于解释权利要求和说明书。如本文所使用的,术语“包括”、“包含”、“具有”、“有”、“带有”“含”或其任何其他变体旨在涵盖非排他性的包含。例如,包含一系列元素的成分、混合物、工艺、方法、物品或装置不一定仅限于这些元素,而是可以包括未明确列出或此类成分、混合物、工艺、方法、物品或装置固有的其他元素。此外,本文中的术本文档来自技高网
...

【技术保护点】
1.一种用于从数据库获取场景的计算机实现的方法,该方法包括:/n从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;/n从搜索请求中提取一个或多个关键词;/n为所述一个或多个关键词中的每一个生成一个或多个扩展关键词;/n将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较,以识别一个或多个目标场景,所述一个或多个目标场景各自包括目标场景注释;/n至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性,为所述一个或多个目标场景的每个指定置信度等级;以及/n向用户显示所述一个或多个目标场景中的至少一个,其中,基于所述置信度等级确定所述一个或多个目标场景中的所述至少一个。/n

【技术特征摘要】
【国外来华专利技术】20170724 US 15/657,6261.一种用于从数据库获取场景的计算机实现的方法,该方法包括:
从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;
从搜索请求中提取一个或多个关键词;
为所述一个或多个关键词中的每一个生成一个或多个扩展关键词;
将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较,以识别一个或多个目标场景,所述一个或多个目标场景各自包括目标场景注释;
至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性,为所述一个或多个目标场景的每个指定置信度等级;以及
向用户显示所述一个或多个目标场景中的至少一个,其中,基于所述置信度等级确定所述一个或多个目标场景中的所述至少一个。


2.根据权利要求1所述的方法,还包括:
从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示;以及
至少部分基于所述选择更新所述目标场景注释。


3.根据权利要求1所述的方法,还包括:
向用户显示所述一个或多个目标场景;
从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示;以及
至少部分基于所述拒绝更新所述目标场景注释。


4.根据权利要求2所述的方法,还包括:
监视用户以确定用户在观看目标场景时的情绪反应;
将用户的情绪反应与所述目标场景注释进行比较,以确定情绪反应与目标场景注释之间的相关性;以及
至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。


5.根据权利要求1所述的方法,其中所述搜索请求是用户音频输入,所述提取一个或多个关键词包括:
对所述搜索请求执行自然语言处理,以将用户音频输入转换为文本;
将文本分割成一个或多个单独的短语;以及
分析所述一个或多个单独的短语以确定关键词。


6.根据权利要求1所述的方法,还包括:
向用户显示所述一个或多个目标场景;以及
按照所述置信度等级排定显示所述一个或多个目标场景的顺序。


7.一种用于从数据库获取场景的计算机系统,所述计算机系统包括与存储器可通信地耦合的处理器,所述处理器被配置为:
从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;
从搜索请求中提取一个或多个关键词;
为所述一个或多个关键词中的每一个生成一个或多个扩展关键词;
将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较,以识别一个或多个目标场景,所述一个或多个目标场景各自包括目标场景注释;以及
至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性,为所述一个或多个目标场景的每个指定置信度等级。


8.根据权利要求7所述的计算机系统,其中,所述处理器被进一步配置为:
向用户显示所述一个或多个目标场景;
从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示;以及
至少部分基于所述选择更新所述目标场景注释。


9.根据权利要求7所述的计算机系统,其中,所述处理器被进一步配置为:
向用户显示所述一个或多个目标场景;
从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示;以及
至少部分基于所述拒绝更新所述目标场景注释。


10.根据权利要求8所述的计算机系统,其中,所述处理器被进一步配置为:
监视用户以确定用户在观看目标场景时的情绪反应;
将用户的情绪反应与所述目标场景注释进行比较,以确定情绪反应与目标场景注释之间的相关性;以及
至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。


11.一种用于从数据库获取场景的计算机程序产品,所述计算机程序产品包括具有其中体现程序指令的计算机可读存储介质,所述程序指令可由处理器执行以使所述处理执行:
从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;
从搜索请求中提取一个或多个关键词;...

【专利技术属性】
技术研发人员:R·汉密尔顿二世夏音翟毓琳G·博斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1