当前位置: 首页 > 专利查询>脸谱公司专利>正文

在在线社交网络上多样化媒体搜索结果制造技术

技术编号:21554059 阅读:28 留言:0更新日期:2019-07-07 01:36
在一个实施方式中,一种方法包括:接收第一用户的查询;检索与查询匹配的视频;确定视频的过滤集,其中,过滤包括基于具有与模态视频的数字指纹在相同性的阈值程度内的数字指纹的重复视频来移除该重复视频;对于每个视频,计算与视频和过滤集中的另一个视频之间的相似度相对应的相似性分数;将视频分组成集群,集群包括相对于集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频;以及向第一用户发送搜索结果界面,搜索结果界面包括基于其对应视频的相应集群而在界面内编排的视频的搜索结果。

Diversified Media Search Results on Online Social Networks

【技术实现步骤摘要】
【国外来华专利技术】在在线社交网络上多样化媒体搜索结果
本公开大体上涉及社交图谱并执行对社交网络环境内的对象的搜索。
技术介绍
可以包括社交网络网站的社交网络系统可以使其用户(诸如个人或组织)能够与其交互并通过其彼此交互。社交网络系统可以利用来自用户的输入,在社交网络系统中创建并存储与用户相关联的用户简档。用户简档可以包括人口统计信息、通信信道信息和关于用户的个人兴趣的信息。社交网络系统还可以利用来自用户的输入,创建并存储用户与社交网络系统的其他用户的关系的记录,以及提供服务(例如,涂鸦墙、照片共享、事件组织、消息收发、游戏或广告)以推广用户之间的社交交互。社交网络系统可以通过一个或多个网络向用户的移动或其他计算设备发送与其服务相关的内容或消息。用户还可以在用户的移动或其他计算设备上安装软件应用程序,以用于访问用户的用户简档和社交网络系统内的其他数据。社交网络系统可以生成个性化的内容对象集合(诸如连接到用户的其他用户的聚集故事的新闻馈送)以显示给用户。社交图谱分析在节点和边线构成的网络理论的角度来查看社交关系。节点表示网络中的各个参与者,并且边线表示参与者之间的关系。由此产生的基于图谱的结构通常非常复杂。连接节点可以有多种类型的节点和多种类型的边线。以其最简单的形式,社交图谱是所有被研究节点之间的所有相关边线的映射。
技术实现思路
允许上传、托管或共享视频内容的诸如社交网络系统的平台常常被仅仅是复制品的视频内容的多个实例(即,相同的副本或经过微小修改的几乎相同的副本)所阻碍。这种复制品的存在可以归因于上传者希望建立他们自己的关注者,而不是为视频的原始上传者或创建者提升关注者。这样的上传者可以按原样或通过微小的修改(例如,试图避免版权检测,以某种方式个性化视频)重新上传已经存在于社交网络系统上的视频。复制品出现的原因还可能是用户希望根据个人喜好进行微小的更改或者对视频添加微小的注释,而不需要对视频进行太多的更改。社交网络系统上存在这些复制品所引起的一个问题是,指定一组搜索项(例如,“猫机器人真空视频”)的搜索查询可能返回充满这些相同副本(例如,自主机器人真空吸尘器上的猫的特定视频的相同副本)和微小修改(例如,相同视频的副本但在视频上的信箱的顶部衬边中显示文本“lol”)的一组搜索结果,从而导致搜索结果集中缺乏多样性。缺乏多样性可能导致查询用户的负面搜索体验,并且可能降低查询用户找到其他感兴趣的视频的机会。出于相同的原因,对应于彼此非常相似的视频(例如,逐镜头再现原始“吸尘器上的猫”视频的视频)的一组搜索结果也可能是次优的。本文描述的方法试图通过推广视频内容的唯一实例(例如,原始实例、非常相似的视频中最感兴趣的视频等)并抑制作为复制品的视频或与唯一实例太相似的视频来减少搜索结果中缺乏多样性。尽管本公开侧重于多样化视频搜索结果,但它也考虑多样化其他类型的媒体搜索结果(例如,新闻搜索结果、音频搜索结果等)。此外,尽管本公开侧重于在社交网络系统的上下文中应用本文所描述的方法,但本公开也考虑在任何其他合适的上下文中(例如,在具有媒体上传、媒体托管或媒体共享能力的任何其他系统或平台的上下文中)应用相同或类似的方法。在特定实施方式中,社交网络系统可以接收由查询用户输入的搜索查询(例如,从查询用户的客户端系统)。社交网络系统可以检索与搜索查询相匹配的初始视频集。社交网络系统可以过滤初始视频集以确定视频的过滤集。过滤可包括从初始集中移除作为初始视频集中的“模态”视频(例如,原始视频、视频的最佳实例)的“复制品”的一个或多个视频。重复视频可以包括作为相同副本或几乎相同副本的视频。视频可基于其具有与模态视频的数字指纹在相同性的阈值程度内的数字指纹而被识别为重复视频。社交网络系统可针对过滤集中的每个视频分别计算相对于过滤集中的一个或多个其他视频的一个或多个相似性分数。每个相似性分数可以对应于视频的特征与相应的其他视频的相似度。社交网络系统可以将过滤集中的视频分组到多个集群中。每个集群可以包括相对于集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频。社交网络系统可以将搜索结果界面发送到第一用户的客户端系统以供显示,该搜索结果界面包括分别针对过滤集中的一个或多个视频的一个或多个搜索结果。搜索结果可以基于其对应视频的相应集群而在搜索结果界面内被编排。本文公开的实施方式仅仅是示例,并且本公开的范围不限于这些实施方式。特定实施方式可包括以上公开的实施方式的组件、元件、特征、功能、操作或步骤中的全部、部分或全部不包括。根据本专利技术的实施方式在针对方法、存储介质、系统和计算机程序产品的所附权利要求中特别公开,其中在一个权利要求类别中提及的任何特征(例如方法)也可以在另一个权利要求类别(例如系统)中要求保护。所附权利要求中的从属关系或后向引用仅出于形式上的原因被选择。然而,也可以要求保护由对任何先前权利要求的有意引用而产生的任何主题(特别是多项从属),使得公开并要求保护了权利要求及其特征的任何组合,而不管所附权利要求中选择的从属关系如何。可要求保护的主题不仅包括如所附权利要求中所阐述的特征的组合,而且还包括权利要求中的特征的任何其他组合,其中,权利要求中提及的每个特征可以与权利要求中的任何其他特征或其他特征的组合相结合。此外,本文描述或描绘的任何实施方式和特征可在单独的权利要求中要求保护,和/或在与本文描述或描绘的任何实施方式或特征或与所附权利要求的任何特征的任何组合中要求保护。在根据本专利技术的实施方式中,一种方法包括:通过一个或多个计算系统:从第一用户的客户端系统接收由第一用户输入的搜索查询;检索与搜索查询匹配的初始视频集;过滤初始视频集进行以确定视频的过滤集,其中,过滤包括针对初始视频集中的一个或多个模态视频中的每一个,基于具有与模态视频的数字指纹在相同性的阈值程度内的数字指纹的一个或多个重复视频而从该初始视频集中移除该一个或多个重复视频;针对过滤集中的每个视频,分别计算相对于过滤集中的一个或多个其他视频的一个或多个相似性分数,其中,每个相似性分数对应于该视频的特征与相应的其他视频的相似度;将过滤集中的视频分组为多个集群,每个集群包括相对于集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频;以及向第一用户的客户端系统发送搜索结果界面以供显示,搜索结果界面包括分别针对过滤集中的一个或多个视频的一个或多个搜索结果,其中,该搜索结果是基于其对应视频的相应集群而在搜索结果界面内被编排的。在根据本专利技术的实施方式中,一种方法,可包括:访问社交图谱,社交图谱包括多个节点和连接节点的多条边线,两个节点之间的每条边线表示节点之间的单个分离程度,节点包括:对应于与在线社交网络相关联的第一用户的第一节点;以及多个第二节点,每个第二节点对应于与在线社交网络相关联的概念或第二用户。相应视频的数字指纹可以基于相应音频数字指纹和相应视频数字指纹中的一者或多者。过滤可包括执行模糊指纹匹配算法以识别模态视频的一个或多个失真或有噪声版本,以从初始视频集中移除。过滤可以包括检测在一个或多个重复视频上的水印的存在。相对于一个或多个其他视频计算一个或多个相似性分数可包括:针对过滤集中的每个视频,基于图像识别处理识别视频的一个或多个视觉特征;基于视频的视觉特征来确定与视频相关本文档来自技高网...

【技术保护点】
1.一种方法,包括:通过一个或多个计算系统,从第一用户的客户端系统接收由所述第一用户输入的搜索查询;检索匹配所述搜索查询的初始视频集;过滤所述初始视频集以确定视频的过滤集,其中,所述过滤包括针对所述初始视频集中的一个或多个模态视频中的每一个,基于具有与所述模态视频的数字指纹在相同性的阈值程度内的数字指纹的一个或多个重复视频而从所述初始视频集中移除所述一个或多个重复视频;针对所述过滤集中的每个视频,分别计算相对于所述过滤集中的一个或多个其他视频的一个或多个相似性分数,其中,每个相似性分数对应于所述视频的特征与相应的其他视频的相似度;将所述过滤集中的视频分组为多个集群,每个集群包括相对于所述集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频;以及向所述第一用户的所述客户端系统发送搜索结果界面以供显示,所述搜索结果界面包括分别针对所述过滤集中的一个或多个视频的一个或多个搜索结果,其中,所述搜索结果是基于所述搜索结果的对应视频的相应集群而在所述搜索结果界面内被编排的。

【技术特征摘要】
【国外来华专利技术】2016.10.10 US 15/289,5321.一种方法,包括:通过一个或多个计算系统,从第一用户的客户端系统接收由所述第一用户输入的搜索查询;检索匹配所述搜索查询的初始视频集;过滤所述初始视频集以确定视频的过滤集,其中,所述过滤包括针对所述初始视频集中的一个或多个模态视频中的每一个,基于具有与所述模态视频的数字指纹在相同性的阈值程度内的数字指纹的一个或多个重复视频而从所述初始视频集中移除所述一个或多个重复视频;针对所述过滤集中的每个视频,分别计算相对于所述过滤集中的一个或多个其他视频的一个或多个相似性分数,其中,每个相似性分数对应于所述视频的特征与相应的其他视频的相似度;将所述过滤集中的视频分组为多个集群,每个集群包括相对于所述集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频;以及向所述第一用户的所述客户端系统发送搜索结果界面以供显示,所述搜索结果界面包括分别针对所述过滤集中的一个或多个视频的一个或多个搜索结果,其中,所述搜索结果是基于所述搜索结果的对应视频的相应集群而在所述搜索结果界面内被编排的。2.根据权利要求1所述的方法,还包括:访问社交图谱,所述社交图谱包括多个节点和连接所述节点的多条边线,两个所述节点之间的每条边线表示它们之间的单个分离程度,所述节点包括:对应于与在线社交网络相关联的所述第一用户的第一节点;以及多个第二节点,每个第二节点对应于与所述在线社交网络相关联的概念或第二用户。3.根据权利要求1所述的方法,其中,相应视频的所述数字指纹基于相应音频数字指纹和相应视频数字指纹中的一者或多者。4.根据权利要求1所述的方法,其中,所述过滤还包括执行模糊指纹匹配算法以识别所述模态视频的一个或多个失真或有噪声版本,以从所述初始视频集中进行移除。5.根据权利要求1所述的方法,其中,所述过滤还包括检测所述一个或多个重复视频上的水印的存在。6.根据权利要求1所述的方法,其中,计算相对于一个或多个所述其他视频的所述一个或多个相似性分数还包括:针对所述过滤集中的每个视频,基于图像识别处理识别所述视频的一个或多个视觉特征;基于所述视频的视觉特征来确定与所述视频相关联的一个或多个概念;基于所述视频的相关联的概念在d维空间中生成所述视频的嵌入;针对所述过滤集中的一个或多个所述其他视频中的每一个,基于所述其他视频的视觉特征来确定与所述其他视频相关联的一个或多个概念;基于所述其他视频的相应相关联的概念,在所述d维空间中生成所述其他视频的一个或多个嵌入;以及在所述d维空间中,计算所述视频的所述嵌入与所述其他视频的相应嵌入之间的一个或多个距离。7.根据权利要求6所述的方法,其中,与所述视频相关联的所述一个或多个概念还基于所述视频的一个或多个所识别的音频特征来确定。8.根据权利要求6所述的方法,其中,与所述视频相关联的所述一个或多个概念还基于与所述视频相关联的文本来确定,所述文本是从与所述视频相关联的一个或多个通信中提取的、或者是从与所述视频相关联的元数据中提取的。9.根据权利要求1所述的方法,其中,计算相对于一个或多个所述其他视频的所述一个或多个相似性分数还包括:针对所述过滤集中的每个视频,生成所述视频的二进制表示;针对所述过滤集中的一个或多个所述其他视频中的每一个,生成所述其他视频的一个或多个二进制表示;并且确定所述视频的所述二进制表示与所述其他视频的相应二进制表示之间的一个或多个汉明距离。10.根据权利要求1所述的方法,还包括针对多个所述集群中的每个集群计算所述集群中的每个视频的视频分数,其中,所述视频分数预测所述第一用户对所述视频的兴趣水平,并且其中,所述视频分数基于所述第一用户和与所述视频相关联的第二用户之间的亲和力、与所述视频相关联的社交信号的数量、所述视频的年龄以及所述视频的视听质量中的一项或多项。11.根据权利要求10所述的方法,其中,所述搜索结果显示在所述搜索结果界面上的一个或多个模块内,其中,每个模块对应于多个所述集群中的一个集群,并且其中,每个模块显示与具有大于阈值视频分数的视频分数的一个或多个相应视频相关联的一个或多个搜索结果。12.根据权利要求11所述的方法,还包括:在交互元素处从所述第一用户接收对应于特定集群的输入;以及分别发送与所述特定集群的一个或多个视频相对应的一个或多个附加搜索结果以供显示。13.根据权利要求10所述的方法,其中,所述搜索结果显示在视频搜索结果模块内,其中,所述视频搜索结果模块是显示在所述搜索结果界面上的多个模块中的一个,其中,所述多个模块中的每个模块包括与单个对象类型的对象相对应的搜索结果,并且其中,所述视频搜索结果模块显示与具有大于阈值视频分数的视频分数的一个或多个相应视频相关联的一个或多个搜索结果。14.根据权利要求10所述的方法,其中,所述搜索结果被显示为搜索结果的列表,所述搜索结果基于搜索结果的相应集群内的对应视频的相应视频分数并还基于集群多样性算法以排名顺序列出,其中,所述集群多样性算法要求来自每个集群的多个搜索结果出现在所述搜索结果的最高排名组中。15.根据权利要求14所述的方法,其中,与特定集群的第一视频相对应的第一搜索结果在所述列表上排名上升,并且与所述特定集群的第二视频相对应的第二搜索结果在所述列表上排名下降,其中,所述第一视频具有比所述第二视频更高的视频分数,并且其中,所述第二视频具有高于上阈值相似性分数的相似性分数。16.根据权利要求1所述的方法,还包括在所述搜索结果界面内编排所述搜索结果,其中,所述编排包括:针对多个所述集群中的每个集群,基于与所述集群的视频相关联的一个或多个概念的相关性来计算集群分数;以及基于搜索结果的相应集群的集群分数对搜索结果进行排序。17.根据权利要求16所述的方法,其中,每个集群的所述集群分数还基于所述第一用户和与所述集群的视频相关联的所述一个或多个概念之间的亲和力。18.根据权利要求1所述的方法,其中,计算相对于一个或多个所述其他视频的所述一个或多个相似性分数还包括:针对所述过滤集中的每个视频,将所述视频划分成一个或多个第一视频片段;将所述过滤集中的一个或多个所述其他视频中的每一个划分为一个或多个相应的第二视频片段;以及分别确定所述第一视频片段中的一个或多个中的每一个与所述第二视频片段中的一个或多个中的每一个之间的相似度。19.一个或多个包含软件的计算机可读非暂时性存储介质,所述软件在执行时可操作以:从第一用户的客户端系统接收由所述第一用户输入的搜索查询;检索匹配所述搜索查询的初始视频集;过滤所述初始视频集以确定视频的过滤集,其中,所述过滤包括针对所述初始视频集中的一个或多个模态视频中的每一个,基于具有与所述模态视频的数字指纹在相同性的阈值程度内的数字指纹的一个或多个重复视频而从所述初始视频集中移除所述一个或多个重复视频;针对所述过滤集中的每个视频,分别计算相对于所述过滤集中的一个或多个其他视频的一个或多个相似性分数,其中,每个相似性分数对应于所述视频的特征与相应的其他视频的相似度;将所述过滤集中的视频分组为多个集群,每个集群包括相对于所述集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频;以及向所述第一用户的所述客户端系统发送搜索结果界面以供显示,所述搜索结果界面包括分别针对所述过滤集中的一个或多个视频的一个或多个搜索结果,其中,所述搜索结果是基于所述搜索结果的对应视频的相应集群而在所述搜索结果界面内被编排的。20.一种系统,包括:一个或多个处理器;以及耦接到所述处理器的非暂时性存储器,所述非暂时性存储器包括能够由所述处理器执行的指令,所述处理器在执行所述指令时可操作以:从第一用户的客户端系统接收由所述第一用户输入的搜索查询;检索匹配所述搜索查询的初始视频集;过滤所述初始视频集以确定视频的过滤集,其中,所述过滤包括针对所述初始视频集中的一个或多个模态视频中的每一个,基于具有与所述模态视频的数字指纹在相同性的阈值程度内的数字指纹的一个或多个重复视频而从所述初始视频集中移除所述一个或多个重复视频;针对所述过滤集中的每个视频,分别计算相对于所述过滤集中的一个或多个其他视频的一个或多个相似性分数,其中,每个相似性分数对应于所述视频的特征与相应的其他视频的相似度;将所述过滤集中的视频分组为多个集群,每个集群包括相对于所述集群中的每个其他视频具有大于阈值相似性分数的相似性分数的视频;以及向所述第一用户的所述客户端系统发送搜索结果界面以供显示,所述搜索结果界面包括分别针对所述过滤集中的一个或多个视频的一个或多个搜索结果,其中,所述搜索结果是基于所述搜索结果的对应视频的相应集群而在所述搜索结果界面内被编排的。2...

【专利技术属性】
技术研发人员:迪尔克·约翰·斯托普巴尔马诺哈尔·帕卢里
申请(专利权)人:脸谱公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1