用于处理信息的系统、方法和装置制造方法及图纸

技术编号:21628965 阅读:44 留言:0更新日期:2019-07-17 11:06
本申请实施例公开了用于处理信息的系统、方法和装置。该系统的一具体实施方式包括:第一终端设备,用于接收第一用户上传的至少一个词汇集合,将至少一个词汇集合发送至服务器;第二终端设备,用于接收第二用户输入的搜索信息,将搜索信息发送至服务器;服务器,用于响应于接收到至少一个词汇集合,存储至少一个词汇集合,响应于接收到搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对搜索信息进行文本处理,其中,文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别。该实施方式提高了用于处理信息的灵活性。

Systems, methods and devices for processing information

【技术实现步骤摘要】
用于处理信息的系统、方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及用于处理信息的系统、方法和装置。
技术介绍
现有的自然语言处理(例如分词处理、命名实体识别等)技术,往往依赖于很多的词典(例如包括品牌词和/或产品词的词汇集合)。当前,部分自然语言处理开源项目通常是采用静态的方式加载词典。即一旦程序启动、加载完成,就无法修改词典内容。然而,当时间等因素发生变化时,为了能够正确理解用户输入的语句,需要对词典进行更新。此外,同一份词典往往会在自然语言处理中被多次使用到,可能需要多次加载。
技术实现思路
本申请实施例提出了用于处理信息的系统、方法和装置。第一方面,本申请实施例提供了一种用于处理信息的系统,该系统包括:第一终端设备,用于接收第一用户上传的至少一个词汇集合,将至少一个词汇集合发送至服务器;第二终端设备,用于接收第二用户输入的搜索信息,将搜索信息发送至服务器;服务器,用于响应于接收到至少一个词汇集合,存储至少一个词汇集合,响应于接收到搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对搜索信息进行文本处理,其中,文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别。在一些实施例中,第一终端设备还用于:针对至少一个词汇集合中的每个词汇集合,生成该词汇集合的集合标识。在一些实施例中,服务器还用于:针对所存储的词汇集合中的每个词汇集合,生成该词汇集合的集合标识;将所生成的集合标识发送至第一终端设备。在一些实施例中,第一终端设备还用于:向服务器发送第一状态信息,其中,第一状态信息用于允许或禁止服务器所存储的词汇集合的加载。在一些实施例中,服务器还用于:将所存储的词汇集合的第二状态信息发送至第一终端设备,其中,第二状态信息用于表征以下之一:可加载状态,不可加载状态,正在加载状态,当第一状态信息是表征允许加载的信息时,第二状态信息表征可加载状态或正在加载状态,当第一状态信息是表征禁止加载的信息时,第二状态信息表征不可加载状态。在一些实施例中,第一终端设备还用于:关联显示服务器所存储的每个词汇集合的集合标识以及该词汇集合的第二状态信息。在一些实施例中,预设条件包括以下至少一项:词汇集合所占用的存储空间的大小小于第一预设阈值;词汇集合所包括的词汇的数量小于第二预设阈值;词汇集合的第一状态信息表征允许加载。第二方面,本申请实施例提供了一种用于处理信息的方法,该方法包括:响应于接收到第一终端设备发送的至少一个词汇集合,存储至少一个词汇集合;响应于接收到第二终端设备发送的搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对搜索信息进行文本处理,其中,文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别;接收第一终端设备发送的第一状态信息,其中,第一状态信息用于允许或禁止服务器所存储的词汇集合的加载。在一些实施例中,上述方法还包括:将所存储的词汇集合的第二状态信息发送至第一终端设备,其中,第二状态信息用于表征以下之一:可加载状态,不可加载状态,正在加载状态,当第一状态信息是表征允许加载的信息时,第二状态信息表征可加载状态或正在加载状态,当第一状态信息是表征禁止加载的信息时,第二状态信息表征不可加载状态。在一些实施例中,预设条件包括以下至少一项:词汇集合所占用的存储空间的大小小于第一预设阈值;词汇集合所包括的词汇的数量小于第二预设阈值;词汇集合的第一状态信息表征允许加载。在一些实施例中,上述方法还包括:针对所存储的词汇集合中的每个词汇集合,生成该词汇集合的集合标识;将所生成的集合标识发送至第一终端设备。第三方面,本申请实施例提供了一种用于处理信息的装置,该装置包括:存储单元,配置用于响应于接收到第一终端设备发送的至少一个词汇集合,存储至少一个词汇集合;处理单元,配置用于响应于接收到第二终端设备发送的搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对搜索信息进行文本处理,其中,文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别;接收单元,配置用于接收第一终端设备发送的第一状态信息,其中,第一状态信息用于允许或禁止服务器所存储的词汇集合的加载。在一些实施例中,上述装置还包括:第一发送单元,配置用于将所存储的词汇集合的第二状态信息发送至第一终端设备,其中,第二状态信息用于表征以下之一:可加载状态,不可加载状态,正在加载状态,当第一状态信息是表征允许加载的信息时,第二状态信息表征可加载状态或正在加载状态,当第一状态信息是表征禁止加载的信息时,第二状态信息表征不可加载状态。在一些实施例中,预设条件包括以下至少一项:词汇集合所占用的存储空间的大小小于第一预设阈值;词汇集合所包括的词汇的数量小于第二预设阈值;词汇集合的第一状态信息表征允许加载。在一些实施例中,上述装置还包括:生成单元,配置用于针对所存储的词汇集合中的每个词汇集合,生成该词汇集合的集合标识;第二发送单元,配置用于将所生成的集合标识发送至第一终端设备。第四方面,本申请实施例提供了一种用于处理信息的服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得该一个或多个处理器实现如上述用于处理信息的方法中任一实施例的方法。第五方面,本申请实施例提供了一种用于处理信息的计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述用于处理信息的方法中任一实施例的方法。本申请实施例提供的用于处理信息的系统、方法和装置,通过第一终端设备接收第一用户上传的至少一个词汇集合,将至少一个词汇集合发送至服务器,然后第二终端设备接收第二用户输入的搜索信息,将搜索信息发送至服务器,最后服务器响应于接收到至少一个词汇集合,存储至少一个词汇集合,响应于接收到搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对搜索信息进行文本处理,其中,文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别,从而实现了词汇集合的动态加载,提高了信息处理的灵活性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于处理信息的系统的一个实施例的信令图;图3A是根据本申请的用于处理信息的系统的一个应用场景的示意图;图3B是根据本申请的用于处理信息的系统的一个服务器架构示意图;图4是根据本申请的用于处理信息的方法的一个实施例的流程图;图5是根据本申请的用于处理信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于处理信息的系统、用于处理信息的方法或用于处本文档来自技高网...

【技术保护点】
1.一种用于处理信息的系统,包括:第一终端设备,用于接收第一用户上传的至少一个词汇集合,将所述至少一个词汇集合发送至服务器;第二终端设备,用于接收第二用户输入的搜索信息,将所述搜索信息发送至所述服务器;所述服务器,用于响应于接收到所述至少一个词汇集合,存储所述至少一个词汇集合,响应于接收到所述搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对所述搜索信息进行文本处理,其中,所述文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别。

【技术特征摘要】
1.一种用于处理信息的系统,包括:第一终端设备,用于接收第一用户上传的至少一个词汇集合,将所述至少一个词汇集合发送至服务器;第二终端设备,用于接收第二用户输入的搜索信息,将所述搜索信息发送至所述服务器;所述服务器,用于响应于接收到所述至少一个词汇集合,存储所述至少一个词汇集合,响应于接收到所述搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对所述搜索信息进行文本处理,其中,所述文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别。2.根据权利要求1所述的系统,其中,所述第一终端设备还用于:针对所述至少一个词汇集合中的每个词汇集合,生成该词汇集合的集合标识。3.根据权利要求1所述的系统,其中,所述服务器还用于:针对所存储的词汇集合中的每个词汇集合,生成该词汇集合的集合标识;将所生成的集合标识发送至所述第一终端设备。4.根据权利要求2或3所述的系统,其中,所述第一终端设备还用于:向所述服务器发送第一状态信息,其中,第一状态信息用于允许或禁止所述服务器所存储的词汇集合的加载。5.根据权利要求4所述的系统,其中,所述服务器还用于:将所存储的词汇集合的第二状态信息发送至所述第一终端设备,其中,第二状态信息用于表征以下之一:可加载状态,不可加载状态,正在加载状态,当第一状态信息是表征允许加载的信息时,第二状态信息表征可加载状态或正在加载状态,当第一状态信息是表征禁止加载的信息时,第二状态信息表征不可加载状态。6.根据权利要求5所述的系统,其中,所述第一终端设备还用于:关联显示所述服务器所存储的每个词汇集合的集合标识以及该词汇集合的第二状态信息。7.根据权利要求1-3、5、6之一所述的系统,其中,所述预设条件包括以下至少一项:词汇集合所占用的存储空间的大小小于第一预设阈值;词汇集合所包括的词汇的数量小于第二预设阈值;词汇集合的第一状态信息表征允许加载。8.一种用于处理信息的方法,包括:响应于接收到第一终端设备发送的至少一个词汇集合,存储所述至少一个词汇集合;响应于接收到第二终端设备发送的搜索信息,加载所存储的词汇集合中符合预设条件的词汇集合,基于所加载的词汇集合,对所述搜索信息进行文本处理,其中,所述文本处理包括以下至少一项:分词处理、关键词提取、命名实体识别;接收所述第一终端设备发送的第一状态信息,其中,第一状态信息用于允许或禁止所述所存储的词汇集合的加载。9.根据权利要求8所述的方法,其中,所述方法还包括:将所存储的词汇集合的第二状态信息发送至所述第一终端设备,其...

【专利技术属性】
技术研发人员:张振庭柳少华陈本才高志群罗辉申林
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1