当前位置: 首页 > 专利查询>韦利通公司专利>正文

用于搜索引擎的选择和优化的方法和系统技术方案

技术编号:20596326 阅读:37 留言:0更新日期:2019-03-16 11:58
提供了一种用于进行认知搜索的方法。该方法包括:在服务器处接收包括嵌入数据特征的搜索简档,使用处理器向搜索引擎的数据库发送搜索请求,基于搜索简档从数据库中选择搜索引擎的定义子集,请求搜索引擎的定义子集基于搜索简档进行实时搜索,从搜索引擎的定义子集请求实时搜索进展数据,从搜索引擎的定义子集中收集实时搜索进展数据,以及基于来自搜索引擎的定义子集的实时搜索进展数据来选取至少一个最佳选择的搜索引擎。

Methods and Systems for Selection and Optimization of Search Engines

A method for cognitive search is provided. The method includes: receiving search profiles including embedded data features at the server, sending search requests to search engine databases using processors, selecting definition subsets of search engines from databases based on search profiles, requesting real-time search of definition subsets of search engines based on search profiles, and requesting real-time search progress data from definition subsets of search engines. Collect real-time search progress data from the definition subset of search engines, and select at least one search engine with the best choice based on the real-time search progress data from the definition subset of search engines.

【技术实现步骤摘要】
【国外来华专利技术】用于搜索引擎的选择和优化的方法和系统
技术介绍
自互联网出现以来,我们的社会处于一个不断增长的互联世界。这种互联世界导致了每天都在生成海量的多媒体。例如,利用改进的智能手机技术,它允许个人轻松简单地亲自录制实况事件,不断生成视频和音乐。还有瞬间媒体,诸如无线电广播。一旦创建了这些媒体,就没有现有技术能索引所有内容并允许它同步到媒体内的确切时间片,例如当事件发生时。另一示例是:具有存储在硬盘驱动器上的数千个个人视频的一个人,其希望找出与这个人的祖母和父亲相关的视频,其可能希望创建蒙太奇。又另一示例是:一个人希望在热门电影系列中找出一个角色说“我非常想念你”的确切时间。又另一示例是:一个人希望以编程方式审核来自一组织的所有已记录的电话呼叫,以便找出正泄露公司机密的人。考虑到当前技术的限制,这些示例强调了音频和视频媒体内的特定内容如何固有地难以访问。已经存在提供围绕媒体的有限信息的解决方案,所述有限信息诸如文件名或标题、时间戳、媒体文件记录的长度等,但是目前没有任何解决方案分析和索引媒体内包含的数据。传统的解决方案是要使用专用的搜索引擎,诸如必应、谷歌、雅虎或IBMWatson。这些专用搜索引擎被构建成基于字串输入来执行搜索,这对于简单搜索能够非常有效。然而,对于更复杂的多变量搜索,传统搜索引擎大多数时候不准确且不起作用。
技术实现思路
本文提供了用于使用认知数据识别的媒体文件内的数据内容的改进的搜索和分析以及与其相关联的简档的创建的设备、方法和系统的实施例。这样的设备、方法和系统包括以下能力:经由搜索引擎处理媒体文件以理解和识别媒体文件内包含的数据内容、将媒体文件及其数据内容与存储在搜索引擎或其他数据库中的其他媒体文件和数据内容进行关联、生成输出、并且如果需要的话预测结果。例如,这样的设备、方法和系统允许个人确定并识别在以正常速度播放的视频文件的时间1:57时说出了什么特定单词、那些单词的情感或其他曲折变化以及识别当时视频中播放的特定音乐或示出的面孔。本文还提供了为用户或个人提供创建认知简档的能力的设备、方法和系统的实施例。照此,这为用户提供了跨认知引擎类型来预定义和保存个人多方面搜索参数的能力。这些认知简档可以是独立的对象,其可以用于运行实时搜索、创建监视列表(诸如程序化且自动化的搜索)以及基于所保存的搜索参数标准进行过滤。可以将认知简档添加到一起,堆叠或以其他方式进行组合,以提供甚至更全面的搜索功能。因此,认知简档可以提供“一键”功能性或其他简单功能性,以生成、过滤或生成和过滤多方面搜索结果。在实施例中,提供了一种用于进行认知搜索的方法。所述方法包括:在服务器或计算设备处接收包括嵌入数据特征的搜索简档,基于所述搜索简档从数据库中选择搜索引擎的定义子集,请求所述搜索引擎的定义子集基于所述搜索简档进行实时搜索,从所述搜索引擎的定义子集请求实时搜索进展数据,从所述搜索引擎的定义子集中收集实时搜索进展数据,以及基于来自所述搜索引擎的定义子集的所述实时搜索进展数据来选取至少一个最佳选择的搜索引擎。在实施例中,提供了一种非暂时性处理器可读介质。所述非暂时性处理器可读介质具有可在计算设备上操作的一个或多个指令,所述指令当由处理器执行时使得所述处理器:命令具有来自搜索引擎的定义数据库的嵌入数据特征的搜索简档的实时搜索,分析来自所述搜索引擎的定义数据库的实时搜索进展数据,基于来自所述搜索引擎的定义数据库的所述实时搜索进展数据来选取至少一个最佳选择的搜索引擎,以及使用至少一个最佳选择的搜索引擎来生成实时结果。在查看以下附图和详细描述之后,本文描述的主题的其他系统、设备、方法、特征和优点将会或者将变得对于本领域技术人员显而易见。旨在将所有这些附加设备、方法、特征和优点包括在本描述内、在本文描述的主题的范围内并且由所附权利要求保护。在没有在权利要求中明确阐述示例实施例的特征的情况下,绝不应该将那些特征解释为限制所附权利要求。附图说明当结合附图阅读时,可更好地理解前述
技术实现思路
以及以下具体实施方式。被并入在本文中并形成说明书的一部分的附图例示了多个实施例,并且与该描述一起进一步用于解释所涉及到的原理并使(一个或多个)相关领域的技术人员能够制造和使用所公开的技术。图1例示了根据本公开的实施例的示例性环境。图2例示了根据本公开的实施例的示例性用户界面。图3例示了根据本公开的实施例的用于搜索引擎选择和优化的示例性过程。图4例示了根据本公开的实施例的用于使用链认知进行搜索的示例性过程。图5-6例示了根据本公开的实施例的用于选择主搜索引擎的示例性过程。图7例示了根据本公开的实施例的用于基于训练数据的搜索引擎选择的示例性过程。图8是根据本公开的一些实施例的示例性多变量搜索系统的框图。图9是例示针对一种装置的硬件实现的示例的框图,所述装置采用了可以利用根据本公开的一些实施例的图3-8的系统和方法的处理系统。具体实施方式概览如上所述,尽管存在用于创建和记录各种媒体文件的技术,但是没有现有技术便于容易地分析和搜索存储在媒体文件内的内容。具体而言,没有现有技术可以对所有内容进行索引、将其与媒体内的确切时间片进行同步(例如事件何时发生)以及分析那些片。存在提供围绕媒体的有限信息的解决方案,所述信息诸如文件名或标题、时间戳、媒体文件记录的长度等,但是目前没有任何解决方案对媒体内包含的数据内容进行索引、同步和分析。此外,目前没有任何技术在仅仅分析媒体文件内的数据内容之外更进一步。具体而言,没有任何技术采用了用户查询;在所记录和存储的媒体文件中进行搜索;对媒体文件内的数据内容进行索引、同步和分析;以及在分析媒体文件内的数据内容之后进行外推以基于用户的查询生成预测结果。本文提供了用于改进搜索的设备、方法和系统的实施例。在一些实施例中,设备、方法和系统包括以下能力:经由搜索引擎处理媒体文件以理解和识别媒体文件内包含的数据内容、将媒体文件及其数据内容与存储在搜索引擎或其他数据库中的其他媒体文件和数据内容进行关联、生成输出、并且如果需要的话预测结果。图1例示了环境100,根据本公开的一些实施例的用于多变量搜索以及搜索引擎选择和优化过程的系统和方法可以在其中操作。环境100可以包括客户端设备105和服务器110。客户端设备105和服务器110二者可以在同一局域网(LAN)或广域网(WAN)上。在一些实施例中,客户端设备105和服务器110位于诸如商店、超市、体育场、电影院或餐馆等的销售点(POS)115处。替换地,POS115可以驻留在家庭、企业或公司办公室中。客户端设备105和服务器110都通信耦合到网络110,网络110可以是互联网。环境100还可以包括远程服务器130和多个搜索引擎142a到142n。远程服务器130可以维护搜索引擎的数据库,该数据库可以包括搜索引擎142a-n的集合140。远程服务器130本身可以是服务器的集合,并且可以包括类似于集合140中的一个或多个搜索引擎的一个或多个搜索引擎。搜索引擎142a-n可以包括多个搜索引擎,诸如但不限于转录引擎、面部识别引擎、对象识别引擎、语音识别引擎、情感分析引擎、音频识别引擎等。在一些实施例中,搜索引擎选择和优化过程由进行器(conductor)模块150执行,进行器模块150可以驻留在服务器130处本文档来自技高网
...

【技术保护点】
1.一种用于进行搜索的方法,所述方法包括:在计算设备处接收具有一个或多个搜索参数的搜索简档,其中,所述计算设备包含搜索引擎的数据库;基于所述一个或多个搜索参数从所述搜索引擎的数据库中选择搜索引擎的子集;请求所选择的搜索引擎子集基于所述一个或多个搜索参数进行搜索;以及接收来自所选择的搜索引擎子集的搜索结果。

【技术特征摘要】
【国外来华专利技术】2016.01.12 US 62/277,9441.一种用于进行搜索的方法,所述方法包括:在计算设备处接收具有一个或多个搜索参数的搜索简档,其中,所述计算设备包含搜索引擎的数据库;基于所述一个或多个搜索参数从所述搜索引擎的数据库中选择搜索引擎的子集;请求所选择的搜索引擎子集基于所述一个或多个搜索参数进行搜索;以及接收来自所选择的搜索引擎子集的搜索结果。2.根据权利要求1所述的方法,其中,请求所选择的搜索引擎子集还包括:响应于所述请求,从所选择的搜索引擎子集接收实时搜索进展数据;以及基于所述实时搜索进展数据从所选择的搜索引擎子集中选择至少一个搜索引擎作为主搜索引擎。3.根据权利要求2所述的方法,其中,实时搜索进展数据包括选自包括以下的组的一个或多个:置信度评级、搜索进展指示符、已第三方验证指示符、已人类验证指示符、质量指示符、趋势指示符和总观看指示符。4.根据权利要求1所述的方法,其中,请求所选择的搜索引擎子集还包括:接收来自所选择的搜索引擎子集的部分搜索结果;基于所接收的部分结果确定针对所选择的搜索引擎子集中的每一个的信任评级;以及基于所确定的信任评级从所选择的搜索引擎子集中选择至少一个搜索引擎作为主搜索引擎,其中,所述信任评级是基于以下中的一个或多个:置信度评级、搜索进展指示符、已第三方验证指示符、已人类验证指示符、质量指示符、趋势指示符和总观看指示符。5.根据权利要求4所述的方法,其中,所述部分搜索结果包括基本上所有的结果。6.根据权利要求1所述的方法,其中,所述一个或多个搜索参数中的每一个包括搜索串和搜索类型指示符,其中,基于所述搜索类型指示符来选择所述搜索引擎的子集。7.根据权利要求6所述的方法,其中,所述搜索类型指示符包括选自包括以下的组的一个或多个:转录搜索、面部识别搜索、语音识别搜索、音频搜索、对象搜索、情感搜索和关键字搜索。8.根据权利要求1所述的方法,还包括:基于训练数据集的属性与所述搜索简档的所述一个或多个搜索参数的属性之间的相似性来匹配所述搜索简档的属性与所述训练数据集的属性;以及基于所匹配的训练数据来选择所述搜索引擎的子集。9.根据权利要求1所述的方法,其中,所选择的搜索引擎子集包括至少一个搜索引擎。10.根据权利要求9所述的方法,还包括同时运行至少一个主搜索引擎和至少一个辅助搜索引擎。11.根据权利要求1所述的方法,其中,所述搜索引擎的数据库包括一个或多个转录引擎、面部识别引擎、对象识别引擎、语音识别引擎、情感分析引擎和关键字搜索引擎。12.根据权利要求1所述的方法,还包括向未被选择为主搜索引擎或辅助处理引擎的搜索引擎发送搜索终止请求。13.一种非暂时性处理器可读介质,其具有可在计算设备上操作的一个或多个指令,所述指令当由处理器执行时使得所述处...

【专利技术属性】
技术研发人员:C斯蒂尔伯格N加拉利J贝利B雷耶斯J威廉斯E金R斯丁森
申请(专利权)人:韦利通公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1