当前位置: 首页 > 专利查询>谷歌公司专利>正文

对在线问题的自动回答制造技术

技术编号:9521493 阅读:128 留言:0更新日期:2014-01-01 19:00
用于提供对问题的自动回答的方法、系统和装置。在一个方面中,方法包括从客户端接收问题,并且对第一储存库查询对应于该问题的回答。如果从第一储存库没有返回结果,则该方法将该问题解析成关键词集,并且对第二储存库查询对应于该关键词集的回答,以及根据排名标准对从第一储存库或第二储存库返回的回答进行排序,并且最后向客户端提供排序的回答的至少子集。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】用于提供对问题的自动回答的方法、系统和装置。在一个方面中,方法包括从客户端接收问题,并且对第一储存库查询对应于该问题的回答。如果从第一储存库没有返回结果,则该方法将该问题解析成关键词集,并且对第二储存库查询对应于该关键词集的回答,以及根据排名标准对从第一储存库或第二储存库返回的回答进行排序,并且最后向客户端提供排序的回答的至少子集。【专利说明】对在线问题的自动回答
技术介绍
本公开涉及自动提供对通过网络提供的问题的回答,以及具体地涉及根据通过网络提供的现有回答提供对问题的回答。在因特网上的即时聊天和电子布告栏系统(BBS)发帖已在因特网中变得广泛。许多用户将聊天工具或在线电子布告栏用作为与其他用户社交并且通信信息的方式。可以在这些在线工具的不同用户之间迅速交换信息。另外,搜索引擎还通过提供引用在Web上可用的资源的搜索结果来帮助人们找到他们想要的信息。尽管有这些许多不同的工具和格式,用户仍然可能没有接收到对其问题的回答、或可能没有以及时方式接收到回答。例如,对于特定问题,用户可以在在线聊天室中对问题进行发帖并且等待看该聊天室中的任何其他人是否提供对该问题的回答。用户还可以将问题发帖到电子布告栏并且在数小时或数天后回来看是否任何人已发帖了对该问题的回答。同样地,用户还可以向搜索引擎提交查询,并且查阅搜索结果和搜索结果引用的网页,以试图搜集对问题的任何有价值的信息。类似地,用户可以向询问用户问题并且提供其他人发帖的对问题的回答的专用在线平台提交回答。这些平台允许用户对问题进行发帖并且从不同背景的宽泛用户群接收响应。然而,如果其他用户尚未提供类似问题,则用户典型地并不以及时方式接收回答。
技术实现思路
总的来说,在本说明书中描述的主题的一个创新方面涉及提供对问题的自动回答的方法。该方法可以包括从客户端接收问题,并且对第一储存库查询对应于该问题的回答。如果从第一储存库没有返回结果,则该方法将该问题解析成关键词集,并且对第二储存库查询对应于该关键词集的回答。该方法根据排名标准对从第一储存库或第二储存库返回的回答进行排序,并且向客户端提供排序的回答的至少子集。替选地,将问题解析成关键词集并且对第二储存库查询对应于该关键词集的回答的步骤可以与查询第一储存库的步骤同时发生。在另一个方面中,该方法可以进一步包括通过以下的至少一个使接收的问题规范化的步骤:移除多余的词;校正拼写错误;移除不必要的标点符号;校正不正确的标点符号;以及移除多余的空格。这些方面中的每一个的其他实施例可以包括对应的系统、装置和记录在计算机存储设备上的计算机程序,其每一个被配置成执行这些方法的动作。在附图和下面的描述中阐述了一个或多个实施例的细节。根据描述和附图以及权利要求,其他的特征、目的和优势将是显而易见的。【专利附图】【附图说明】图1是用于提供对在线问题的自动回答的系统的图。图2是图示对用于存储问题回答对和关键词集回答对的数据储存库的创建和维护的流程图。图3A-3B是问题回答对和关键词集回答对的示例性储存库。图4是图示提供对在线问题的回答的过程的流程图。在各附图中相同的参考符号指示相同的元素。【具体实施方式】图1是提供对在线问题的自动回答的系统的图。在该系统中,客户端101可以是桌面应用或呈现用于在线聊天的web应用的web浏览器。该web浏览器或桌面应用从登录用户接收输入,并且将该输入作为消息通信给另一个用户或将该消息广播给登录入同一服务的用户组。客户端还可以是向用户供给与其他用户的异步交互的电子布告栏应用。替选地,客户端101还可以是接受来自用户的问题并且提供对问题的回答的web门户接口。服务器111位于另一个网络位置处并且通过其处理器115处理来自客户端101的请求。文档语料库114、第一储存库112和第二储存库113与服务器111数据通信。文档语料库114是搜索引擎通过因特网爬取的文档集合。第一储存库112存储问题以及其对应的回答,而第二储存库113被配置成存储从特定问题获取的关键词集以及对应于问题的回答。在一些实施方式中,服务器111在其存储器116中包括储存库维护模块117和问题处理模块118。问题处理模块118对来自客户端101的与特定问题有关的请求进行处理。储存库维护模块117通过从文档语料库114提取问题和回答数据,对第一储存库112和第二储存库113中的数据进行维护和更新。在替选实施方式中,可以将储存库维护模块117部署在独立于服务器111的服务器上。在该独立服务器上的储存库维护模块117与第一储存库113和第二储存库114进行通信,并且周期性或持续使用从文档语料库114获取的新的问题和回答数据来对两个储存库中的数据进行更新。替选地,第一储存库112和第二储存库113以及文档语料库114可以位于不同的网络位置处,并且例如通过诸如LAN或因特网的网络与托管储存库维护模块117的服务器进行通信。图2是图示对用于存储问题回答对和关键词集回答对的数据储存库的创建和维护的流程图。储存库维护模块117,例如,运行用于维护在两个储存库中的问题回答对和关键词集对的数据的程序,负责从文档语料库114识别问题-回答对。文档语料库可以包括已由搜索引擎爬取并且被存储在索引数据库中的聊天室消息的可用记录文件、网页的内容等。如在此所使用的,用语“聊天室记录文件”包括聊天室记录、记录被存储在其上的网页、以及通过聊天会话提供的数据被存储的其他文件和存储方案。文档语料库114还可以是接收各种用户提交的内容的数据存储。储存库维护模块117可以持续或周期性对文档语料库114查询任何新近添加的数据,并且对这些数据进行分析来识别用户所提交的问题以及其可能的回答。在一些实施方式中,移除用户的个人识别信息以处理回答,以使问题和对应的回答与用户没有关联。例如,在存储或使用问题和回答之前,可以以一个或多个方式使问题和回答匿名,以使移除个人可识别的信息。同样地,可以使用户的身份匿名,以使不能为用户确定个人可识别的信息,并且使用户问题或回答的任何可识别信息一般化(例如,基于用户人口特征来一般化),而不是与特定用户相关联。可以使获取了位置信息的用户的地理位置一般化(诸如到城市、邮编或州/省份级),以使不能确定用户的特定位置。下面的示例说明了对数据储存库的创建和维护。假设用户已在在线聊天室中输入了问题“where is world exposition20IOheId?(在哪里举行世界博览会2010 ?)”,并且其他人已给出了回答“Shanghai (上海)”,以及搜索引擎已爬取了整个对话的内容。储存库维护模块117可以通过使用一个或多个文本分析例程和/或语言分析例程来识别问题和回答。例如,储存库维护模块117可以通过辨识问号“? ”或关键词“where (在哪里)”来识别问题,并且将例如来自另一个用户的在该问题之后的紧邻消息确定为对该问题的回答。储存库维护模块117还可以使用字段分类,诸如“Q”和“A”分类符,例如“Q:where isworldexposition2010held?” 和 “A:Shanghai”。在一些实施方式中,可以从现有web文档进一步爬取问题回答对。Web文档可以包括如“问题”和“回答”这样的独特关键词、或诸如字母“Q”和“A”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:周欣
申请(专利权)人:谷歌公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1