本公开的实施例公开了生成关键词的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:响应于关键词获取请求,确定当前用户的用户特征向量;基于用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词;将候选关键词输入预先训练的关键词鉴别模型,关键词鉴别模型用于鉴别关键词是否符合预设条件,得到符合预设条件的关键词。该实施方式实现了关键词的自动生成。
Methods, devices, electronic devices and computer-readable media for generating keywords
【技术实现步骤摘要】
生成关键词的方法、装置、电子设备和计算机可读介质
本公开的实施例涉及计算机
,具体涉及生成关键词的方法、装置、电子设备和计算机可读介质。
技术介绍
随着互联网技术的发展,人们经常需要从海量的信息中搜索到需要的信息。常用的搜索方式为通过输入关键词的方式进行搜索。在这过程中,往往需要用户通过勾选等方式手动选择关键词。
技术实现思路
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了生成关键词的方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题。第一方面,本公开的一些实施例提供了一种生成关键词的方法,包括:响应于关键词获取请求,确定当前用户的用户特征向量;基于用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词;将候选关键词输入预先训练的关键词鉴别模型,关键词鉴别模型用于鉴别关键词是否符合预设条件,得到符合预设条件的关键词。第二方面,本公开的一些实施例提供了一种生成关键词的装置,包括:确定单元,被配置成响应于关键词获取请求,确定当前用户的用户特征向量;选取单元,被配置成基于用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词;生成单元,被配置成将候选关键词输入预先训练的关键词鉴别模型,关键词鉴别模型用于鉴别关键词是否符合预设条件,得到符合预设条件的关键词。第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任一的方法。第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述任一的方法。本公开的上述各个实施例中的一个实施例具有如下有益效果:实现了关键词的自动生成。其中,通过确定当前用户的用户特征向量以及根据用户特征向量,从关键词库中选取候选关键词,使最后得到的关键词更具针对性,与用户的关联性更强。此外,通过关键词鉴别模型对候选关键词进行鉴别,使得最后得到的关键词符合预设条件。实践中,通过设置合适的预设条件,可以实现不同的功能。例如,关键词鉴别模型可以对候选关键词的合法性进行鉴别,以避免在后续的关键词展示过程中展示不合法的关键词。附图说明结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。图1是根据本公开的一些实施例的生成关键词的方法的一个应用场景的示意图;图2是根据本公开的生成关键词的方法的一些实施例的流程图;图3是根据本公开的生成关键词的方法的另一些实施例的流程图;图4是根据本公开的生成关键词的装置的一些实施例的结构示意图;图5是适于用来实现本公开的一些实施例的电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。下面将参考附图并结合实施例来详细说明本公开。图1是根据本公开一些实施例的生成关键词的方法的一个应用场景的示意图。本公开的一些实施例提供的生成关键词的方法一般由服务器执行。需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。在本应用场景下,生成关键词的方法的执行主体可以是服务器100。用户A可以通过终端基于关键词进行相关内容的搜索。从而终端可以发起关键词获取请求。响应于关键词获取请求,服务器100可以确定当前用户A的用户特征向量101。作为示例,可以将用户信息(例如用户性别、用户年龄等)输入特征向量生成网络,得到用户特征向量101。在此基础上,可以基于用户特征向量101,从关键词库102中选取第一预设数量的关键词作为候选关键词。例如,可以分别计算用户特征向量101与关键词库102中各个关键词的特征向量的相似度。进而选取相似度大于预设相似度阈值的关键词作为候选关键词103。接着,可以将候选关键词103输入预先训练的关键词鉴别模型104,关键词鉴别模型104用于鉴别关键词是否符合预设条件,从而得到符合预设条件的关键词105。继续参考图2,示出了根据本公开的生成关键词的方法的一些实施例的流程图200。该生成关键词的方法,包括以下步骤:步骤201,响应于关键词获取请求,确定当前用户的用户特征向量。在一些实施例中,作为示例,当用户通过终端进行相关内容的搜索时,可以通过点击虚拟按钮以获取关键词。响应于关键词获请求,生成关键词的方法的执行主体可以确定当前用户的用户特征向量。其中,关键词可以是任意的字、词、短语、句子及其之间的组合等等。作为示例,可以将用户信息(例如用户性别、用户年龄等)输入特征向量生成网络,得到用户特征向量。实践中,作为示例,可以采用现有的文本生成网络的嵌入层或编码层作为特征向量生成网络。在一些实施例的可选的实现方式中,确定当前用户的用户特征向量,包括:确定当前用户是否存在对应的用户历史发布信息;响应于确定当前用户存在对应的用户历史发布信息,提取用户历史发布信息的关键词;确定用户历史发布信息的关键词的特征向量以及作为当前用户的用户特征向量。步骤202,基于用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词。在一些实施例中,上述执行主体可以基于用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词。其中,关键词库中可以包括多个关键词。关键词库中的词可以是预先设定的,也可以是根据一定的条件动态更新本文档来自技高网...
【技术保护点】
1.一种生成关键词的方法,包括:/n响应于关键词获取请求,确定当前用户的用户特征向量;/n基于所述用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词;/n将所述候选关键词输入预先训练的关键词鉴别模型,所述关键词鉴别模型用于鉴别关键词是否符合预设条件,得到符合所述预设条件的关键词。/n
【技术特征摘要】
1.一种生成关键词的方法,包括:
响应于关键词获取请求,确定当前用户的用户特征向量;
基于所述用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词;
将所述候选关键词输入预先训练的关键词鉴别模型,所述关键词鉴别模型用于鉴别关键词是否符合预设条件,得到符合所述预设条件的关键词。
2.根据权利要求1所述的方法,其中,所述确定当前用户的用户特征向量,包括:
确定当前用户是否存在对应的用户历史发布信息;
响应于确定当前用户存在对应的用户历史发布信息,提取所述用户历史发布信息的关键词;
确定所述用户历史发布信息的关键词的特征向量以及作为当前用户的用户特征向量。
3.根据权利要求2所述的方法,其中,所述确定当前用户的用户特征向量,还包括:
响应于确定当前用户不存在对应的用户历史发布信息,确定当前用户对应的类别;
确定所述类别对应的关键词的特征向量以及作为当前用户的用户特征向量。
4.根据权利要求3所述的方法,其中,所述类别对应的关键词通过以下步骤确定:
获取目标历史发布信息集合;
对于所述目标历史发布信息集合中的历史发布信息,将所述历史发布信息输入分类器,得到所述历史发布信息对应的类别信息;
对于所述目标历史发布信息集合中的各个历史发布信息,抽取关键词;
对于每个类别信息所表征的类别,按照词频由大到小的顺序,选取所述类别下第二预设数量的关键词作为所述类别对应的关键词。
5.根据权利要求1所述的方法,其中,所述基于所述用户特征向量,从关键词库中选取第一预设数量的关键词作为候选关键词,包括:
确定所述关键词库中的各个关键词的关键词特征向量;
基于所述用户特征向量与所述各个关键词的关键词特征向量,从所述关键词库中选取第一预设数量的关键词作为候...
【专利技术属性】
技术研发人员:邓江东,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。