The embodiment of this application discloses methods and devices for generating information. One specific embodiment of the method includes: acquiring the target search word set; determining whether the preset set of words includes the corresponding words that have a pre-established correspondence with the target search word for the target search word set; and determining at least one corresponding word in the corresponding word and the target search in response to determining that at least one corresponding word is included. The similarity of words; according to the order of similarity, the target number of corresponding words is extracted from at least one corresponding word as the corresponding set of words corresponding to the target search word; based on the corresponding set of words obtained, at least one search word set is generated. The implementation method is helpful to improve the comprehensiveness and pertinence of information search.
【技术实现步骤摘要】
用于生成信息的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
目前,当用户在网络中搜索信息时,通常利用用户输入的搜索词进行搜索,搜索结果中包含与搜索词相同或相近的词语。搜索结果的准确性依赖于将用户输入的搜索词与网络中的信息进行匹配时的匹配规则。
技术实现思路
本申请实施例提出了用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:获取目标搜索词集合;对于目标搜索词集合中的目标搜索词,确定预设的词语集合是否包括与该目标搜索词具有预先建立的对应关系的对应词语;响应于确定包括至少一个对应词语,确定至少一个对应词语中的对应词语与该目标搜索词的相似度;按照相似度的大小顺序,从至少一个对应词语中提取目标数量个对应词语作为与该目标搜索词对应的对应词语集合;基于所得到的对应词语集合,生成至少一个搜索词集合。在一些实施例中,基于所得到的对应词语集合,生成至少一个搜索词集合之后,该方法还包括:对于至少一个搜索词集合中的搜索词集合,利用该搜索词集合包括的搜索词进行信息搜索,得到搜索结果及输出。在一些实施例中,目标 ...
【技术保护点】
1.一种用于生成信息的方法,包括:获取目标搜索词集合;对于所述目标搜索词集合中的目标搜索词,确定预设的词语集合是否包括与该目标搜索词具有预先建立的对应关系的对应词语;响应于确定包括至少一个对应词语,确定至少一个对应词语中的对应词语与该目标搜索词的相似度;按照相似度的大小顺序,从至少一个对应词语中提取目标数量个对应词语作为与该目标搜索词对应的对应词语集合;基于所得到的对应词语集合,生成至少一个搜索词集合。
【技术特征摘要】
1.一种用于生成信息的方法,包括:获取目标搜索词集合;对于所述目标搜索词集合中的目标搜索词,确定预设的词语集合是否包括与该目标搜索词具有预先建立的对应关系的对应词语;响应于确定包括至少一个对应词语,确定至少一个对应词语中的对应词语与该目标搜索词的相似度;按照相似度的大小顺序,从至少一个对应词语中提取目标数量个对应词语作为与该目标搜索词对应的对应词语集合;基于所得到的对应词语集合,生成至少一个搜索词集合。2.根据权利要求1所述的方法,其中,在所述基于所得到的对应词语集合,生成至少一个搜索词集合之后,所述方法还包括:对于所述至少一个搜索词集合中的搜索词集合,利用该搜索词集合包括的搜索词进行信息搜索,得到搜索结果及输出。3.根据权利要求1所述的方法,其中,所述目标搜索词集合是对用户输入的搜索语句进行切词后得到的词语的集合。4.根据权利要求1-3之一所述的方法,其中,所述预设的词语集合包括至少一个子集合;以及所述确定预设的词语集合是否包括与该目标搜索词具有预先建立的对应关系的对应词语,包括:确定所述至少一个子集合中是否存在包括该目标搜索词的子集合;响应于确定存在,确定包括该目标搜索词的子集合中的、除该目标搜索词以外的其他词语为与该目标搜索词对应的对应词语。5.根据权利要求4所述的方法,其中,所述预设的词语集合包括的至少一个子集合预先按照如下步骤得到:获取目标文本集合;对所述目标文本集合中的目标文本进行切词,得到词语集合;对切词后得到的词语集合中的词语进行近义词聚类,得到至少一个子集合,其中,对于所述至少一个子集合中的子集合,该子集合包括的词语两两之间的相似度大于等于预设的相似度阈值。6.根据权利要求4所述的方法,其中,所述预设的词语集合包括的至少一个子集合预先按照如下步骤得到:获取原始搜索词集合;对于所述原始搜索词集合中的原始搜索词,将该原始搜索词输入预设的搜索引擎,得到至少一条搜索结果;从所述至少一条搜索结果中,提取具有设定特征的词语作为目标词语;基于所提取的目标词语和该原始搜索词,生成所述词语集合包括的子集合。7.一种用于生成信息的装置,包括:获取单元,被配置成获取目标搜索词集合;提取单元,被配置成对于所述目标搜索词集合中的目标搜索词,确定预设的词语集合是否...
【专利技术属性】
技术研发人员:邓江东,李磊,马维英,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。