搜索系统和相应方法技术方案

技术编号：11980503 阅读：113 留言：0更新日期：2015-09-02 10:52

本发明专利技术提供一种搜索系统，其包括在与一段内容相关联的文本上训练的统计模型。与该段内容相关联的所述文本是从多个不同的数据源中提取的。所述系统用于接收文本输入，并生成该段内容与给定的文本输入之间存在相关性的似然性估计。本发明专利技术还提供了相应的方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术设及电子捜索系统，例如电子捜索引擎，化及用于电子捜索的相应的方法。技术背景传统上，捜索引擎已被设计成返回相关文件（例如网页）来响应用户查询。要做到该一点，捜索引擎将用户查询（包括关键字）与分配给特定网页的索引项或标签进行比较。如果用户输入的关键字和网页索引项匹配，则该捜索引擎会返回与用户查询相关的网页。然而，该方法存在一些缺点。为了使用传统捜索引擎，用户必须将他的捜索查询提炼成若干相关的关键字，或短问题，并且，在一般情况下，该捜索的结果高度取决于用户对于关键字的选择。传统捜索引擎并不能处理大量输入文本或自然语言文本。此外，传统捜索引擎局限于返回一个或多个特定文件作为结果。此外，如果与特定网页相关联的索引项集不包括其中的一个关键字，那么传统捜索引擎可化会错误地把网页作为不相关的网页丢弃。
技术实现思路
本专利技术提供可W解决传统捜索引擎的弊端的一些捜索系统和捜索方法。本专利技术设及概率驱动捜索系统，该系统可W考虑到一系列证据源，来将相关的内容提供给用户。基于明确的捜索查询或某些其它文本输入，本专利技术的系统和方法使用统计模型来将相关的内容建议提供给用户，所述统计模型由与可识别的多段内容相关联的数据集推导出。本专利技术的第一个方面在于提供了一种捜索系统。所述捜索系统用于：接收文本输入，针对多段内容中的每一段生成该段内容与给定的文本输入之间存在相关性的似然性的估计，并选择性地输出作为内容建议的一段或多段最相关的内容。所述捜索系统的优选实施例包括统计模型。所述统计模型在与一段内容相关联的文本上进行训练...

【技术保护点】
一种搜索系统，其包括：在与一段内容相关联的文本上训练的统计模型，其中，与该段内容相关联的所述文本是从多个不同的数据源中提取的，所述系统用于接收文本输入；以及通过所述统计模型，生成该段内容与给定的所述文本输入之间存在的相关性的似然性估计。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：本杰明·麦德洛克，大卫·保罗·威廉姆斯，
申请(专利权)人：触摸式有限公司，
类型：发明
国别省市：英国;GB

全部详细技术资料下载我是这个专利的主人