【技术实现步骤摘要】
【国外来华专利技术】用认知洞察力导航视频场景
本专利技术涉及导航视频场景,更具体地说,涉及使用认知洞察力导航视频场景的方法和系统。
技术介绍
随着计算机性能的不断提升,数字视频的使用变得越来越普遍。观看视频已经成为我们日常生活中最受欢迎的娱乐活动之一,正如研究表明的那样,超过50%的互联网带宽消耗于视频服务。有了现成的摄像机、智能手机和其他手持设备,人们正在记录越来越多的旅行、重要的庆祝活动和家庭时光。此外,数字视频技术在大多数监控系统中都得到了应用。然而,使用和管理这些海量视频数据确实会出现问题。人们可能希望观看电影或家庭视频的特定场景,而不是整个视频。同样,警察或安全人员可能希望从大量的视频数据中找到并收集证据。在一个或多个视频文件中查找和导航到特定场景通常非常耗时且困难。使用现有技术,用户必须通过使用快进模式观看视频,或者反复拖动滑块,直到找到期望的场景为止。此外,一些视频按章节进行分解,用户可以导航到场景可能位于的特定章节。这些技术需要从用户的视频内存中进行大量导航才能找到场景。此外,用户可能以前没有观看过视频,可能在基于来自另一个观看者的建议来搜索场景。这一领域有一些解决方案,但它们并不能直接满足需求。例如,许多现代视频播放器“记住”播放电影的上一个断点,以便下一次从其停止的位置自动恢复电影。但是这个解决方案是基于历史记录的,并且是为单个用户和客户机设计的,因此,如果没有给定用户的以前的记录,或者在多用户的情况下,该解决方案不会很好地工作。其他系统采用面部识别来在视频流中查找特定的人;然而,这并 ...
【技术保护点】
1.一种用于从数据库获取场景的计算机实现的方法,该方法包括:/n从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;/n从搜索请求中提取一个或多个关键词;/n为所述一个或多个关键词中的每一个生成一个或多个扩展关键词;/n将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较,以识别一个或多个目标场景,所述一个或多个目标场景各自包括目标场景注释;/n至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性,为所述一个或多个目标场景的每个指定置信度等级;以及/n向用户显示所述一个或多个目标场景中的至少一个,其中,基于所述置信度等级确定所述一个或多个目标场景中的所述至少一个。/n
【技术特征摘要】
【国外来华专利技术】20170724 US 15/657,6261.一种用于从数据库获取场景的计算机实现的方法,该方法包括:
从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;
从搜索请求中提取一个或多个关键词;
为所述一个或多个关键词中的每一个生成一个或多个扩展关键词;
将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较,以识别一个或多个目标场景,所述一个或多个目标场景各自包括目标场景注释;
至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性,为所述一个或多个目标场景的每个指定置信度等级;以及
向用户显示所述一个或多个目标场景中的至少一个,其中,基于所述置信度等级确定所述一个或多个目标场景中的所述至少一个。
2.根据权利要求1所述的方法,还包括:
从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示;以及
至少部分基于所述选择更新所述目标场景注释。
3.根据权利要求1所述的方法,还包括:
向用户显示所述一个或多个目标场景;
从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示;以及
至少部分基于所述拒绝更新所述目标场景注释。
4.根据权利要求2所述的方法,还包括:
监视用户以确定用户在观看目标场景时的情绪反应;
将用户的情绪反应与所述目标场景注释进行比较,以确定情绪反应与目标场景注释之间的相关性;以及
至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。
5.根据权利要求1所述的方法,其中所述搜索请求是用户音频输入,所述提取一个或多个关键词包括:
对所述搜索请求执行自然语言处理,以将用户音频输入转换为文本;
将文本分割成一个或多个单独的短语;以及
分析所述一个或多个单独的短语以确定关键词。
6.根据权利要求1所述的方法,还包括:
向用户显示所述一个或多个目标场景;以及
按照所述置信度等级排定显示所述一个或多个目标场景的顺序。
7.一种用于从数据库获取场景的计算机系统,所述计算机系统包括与存储器可通信地耦合的处理器,所述处理器被配置为:
从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;
从搜索请求中提取一个或多个关键词;
为所述一个或多个关键词中的每一个生成一个或多个扩展关键词;
将所述一个或多个扩展关键词和所述一个或多个关键词与所述带注释的视频内容进行比较,以识别一个或多个目标场景,所述一个或多个目标场景各自包括目标场景注释;以及
至少部分基于一个或多个目标场景的每个的目标场景注释与所述一个或多个扩展关键词和一个或多个关键词之间的相关性,为所述一个或多个目标场景的每个指定置信度等级。
8.根据权利要求7所述的计算机系统,其中,所述处理器被进一步配置为:
向用户显示所述一个或多个目标场景;
从用户接收对所述一个或多个目标场景中的一个目标场景的选择的指示;以及
至少部分基于所述选择更新所述目标场景注释。
9.根据权利要求7所述的计算机系统,其中,所述处理器被进一步配置为:
向用户显示所述一个或多个目标场景;
从用户接收对所述一个或多个目标场景中的一个目标场景的拒绝的指示;以及
至少部分基于所述拒绝更新所述目标场景注释。
10.根据权利要求8所述的计算机系统,其中,所述处理器被进一步配置为:
监视用户以确定用户在观看目标场景时的情绪反应;
将用户的情绪反应与所述目标场景注释进行比较,以确定情绪反应与目标场景注释之间的相关性;以及
至少部分基于所述情绪反应与所述目标场景注释之间的相关性更新所述目标场景注释。
11.一种用于从数据库获取场景的计算机程序产品,所述计算机程序产品包括具有其中体现程序指令的计算机可读存储介质,所述程序指令可由处理器执行以使所述处理执行:
从用户接收对存储在数据库中的场景的搜索请求,该数据库包括带注释的视频内容;
从搜索请求中提取一个或多个关键词;...
【专利技术属性】
技术研发人员:R·汉密尔顿二世,夏音,翟毓琳,G·博斯,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。