用于查询信息的方法和装置制造方法及图纸

技术编号:19903743 阅读:18 留言:0更新日期:2018-12-26 03:00
本申请实施例公开了用于查询信息的方法和装置。该方法的一具体实施方式包括:获取目标查询问题文本;从该目标查询问题文本中提取实体,生成该目标查询问题文本的实体集合;将该目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到该目标查询问题文本的查询实体集合;对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与该查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,输出该问题文本。

【技术实现步骤摘要】
用于查询信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于查询信息的方法和装置。
技术介绍
计算机辅助技术目前已经渗透到医疗、制造、金融等各个领域,加速了各行各业的发展。在问答领域,从问答数据库中提取实体以及从问答数据库中查出与用户的问题相关的问题和答案,可以为用户提供很大的便利。
技术实现思路
本申请实施例提出了用于查询信息的方法和装置。第一方面,本申请实施例提供了一种用于查询信息的方法,该方法包括:获取目标查询问题文本,从上述目标查询问题文本中提取实体,生成上述目标查询问题文本的实体集合;将上述目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到上述目标查询问题文本的查询实体集合;对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与上述查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,输出该问题文本。在一些实施例中,上述预设的实体集合通过以下步骤获得:对于预设的问题文本集合中的问题文本,从该问题文本中提取实体,生成该问题文本的实体集合;对于该问题文本的实体集合中的实体,确定该实体在上述问题文本集合中出现的次数与该实体在预设的答案文本集合中出现的次数的比值;从该问题文本的实体集合中筛选出比值大于第一预设阈值的实体;将筛选出的实体组成的实体集合确定为预设的实体集合。在一些实施例中,上述预先提取的问题实体集合组中的问题实体集合通过以下步骤获得:对于预设的问题文本集合中的问题文本,从该问题文本中提取实体,生成该问题文本的实体集合;将该问题文本的实体集合中属于上述预设的实体集合的实体,添加到该问题文本的问题实体集合。在一些实施例中,上述预设的匹配条件包括:问题实体集合与查询实体集合的余弦相似度大于第二预设阈值。在一些实施例中,上述方法还包括:确定输出的问题文本与上述查询问题文本之间的相似度,将输出的问题文本按照相似度从大到小进行排序。第二方面,本申请实施例提供了一种用于查询信息的装置,该装置包括:获取单元,被配置成获取目标查询问题文本;提取单元,被配置成从上述目标查询问题文本中提取实体,生成上述目标查询问题文本的实体集合;添加单元,被配置成将上述目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到上述目标查询问题文本的查询实体集合;匹配单元,被配置成对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与上述查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,输出该问题文本。在一些实施例中,上述预设的实体集合通过以下步骤获得:对于预设的问题文本集合中的问题文本,从该问题文本中提取实体,生成该问题文本的实体集合;对于该问题文本的实体集合中的实体,确定该实体在上述问题文本集合中出现的次数与该实体在预设的答案文本集合中出现的次数的比值;从该问题文本的实体集合中筛选出比值大于第一预设阈值的实体;将筛选出的实体组成的实体集合确定为预设的实体集合。在一些实施例中,上述预先提取的问题实体集合组中的问题实体集合通过以下步骤获得:对于预设的问题文本集合中的问题文本,从该问题文本中提取实体,生成该问题文本的实体集合;将该问题文本的实体集合中属于上述预设的实体集合的实体,添加到该问题文本的问题实体集合。在一些实施例中,上述预设的匹配条件包括:问题实体集合与查询实体集合的余弦相似度大于第二预设阈值。在一些实施例中,该装置还包括:确定单元,被配置成确定输出的问题文本与上述查询问题文本之间的相似度;排序单元,被配置成将输出的问题文本按照相似度从大到小进行排序。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如用于查询信息的方法中任一实施例的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如用于查询信息的方法中任一实施例的方法。本申请实施例提供的用于查询信息的方法和装置,获取目标查询问题文本;然后,从该目标查询问题文本中提取实体,生成该目标查询问题文本的实体集合;之后,将该目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到该目标查询问题文本的查询实体集合;对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与该查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,最后,输出该问题文本。提高了信息查询的灵活性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于查询信息的方法的一个实施例的流程图;图3是根据本申请实施例的用于查询信息的方法的一个应用场景的示意图;图4是根据本申请的用于查询信息的方法的又一个实施例的流程图;图5是根据本申请的用于查询信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于查询信息的方法或用于查询信息的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持信息查询的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。服务器105可以是提供各种服务的服务器,例如对获取的目标查询问题文本进行信息挖掘的后台服务器。需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。需要说明的是,本申请实施例所提供的用于查询信息的方法可以通过终端设备101、1本文档来自技高网...

【技术保护点】
1.一种用于查询信息的方法,包括:获取目标查询问题文本;从所述目标查询问题文本中提取实体,生成所述目标查询问题文本的实体集合;将所述目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到所述目标查询问题文本的查询实体集合;对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与所述查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,输出该问题文本。

【技术特征摘要】
1.一种用于查询信息的方法,包括:获取目标查询问题文本;从所述目标查询问题文本中提取实体,生成所述目标查询问题文本的实体集合;将所述目标查询问题文本的实体集合中属于预设的实体集合的实体,添加到所述目标查询问题文本的查询实体集合;对于预先提取的问题实体集合组中的问题实体集合,响应于确定该问题实体集合与所述查询实体集合满足预设的匹配条件,从预设的问题文本集合中确定该问题实体集合对应的问题文本,输出该问题文本。2.根据权利要求1所述的方法,其中,所述预设的实体集合通过以下步骤获得:对于预设的问题文本集合中的问题文本,从该问题文本中提取实体,生成该问题文本的实体集合;对于该问题文本的实体集合中的实体,确定该实体在所述问题文本集合中出现的次数与该实体在预设的答案文本集合中出现的次数的比值;从该问题文本的实体集合中筛选出比值大于第一预设阈值的实体;将筛选出的实体组成的实体集合确定为预设的实体集合。3.根据权利要求1所述的方法,其中,所述预先提取的问题实体集合组中的问题实体集合通过以下步骤获得:对于预设的问题文本集合中的问题文本,从该问题文本中提取实体,生成该问题文本的实体集合;将该问题文本的实体集合中属于所述预设的实体集合的实体,添加到该问题文本的问题实体集合。4.根据权利要求1所述的方法,其中,所述预设的匹配条件包括:问题实体集合与查询实体集合的余弦相似度大于第二预设阈值。5.根据权利要求1-4之一所述的方法,其中,所述方法还包括:确定输出的问题文本与所述查询问题文本之间的相似度;将输出的问题文本按照相似度从大到小进行排序。6.一种用于查询信息的装置,包括:获取单元,被配置成获取目标查询问题文本;提取单元,被配置成从所述目标查询问题文本中提取实体,生成所述目标查询问题文本的实体集合;添加单元,被配置成将所述目标查询问题文本的...

【专利技术属性】
技术研发人员:周景博陈俊施振辉范斌罗程亮
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1