搜索相关词的方法及装置、存储介质和终端设备制造方法及图纸

技术编号:16605564 阅读:41 留言:0更新日期:2017-11-22 15:22
本发明专利技术公开了一种搜索相关词的方法、装置、存储介质及终端设备,所述方法包括:接收键入的关键词,从词条数据库中获取所述关键词的第一相关词集;所述第一相关词集中的相关词包括所述关键词;将所述第一相关词集中的每一个相关词的第二相关词集的并集作为第三相关词集;对所述第一相关词集中的每一个相关词,根据所述第三相关词集中的每一个词在所述相关词的第二相关词集中记载的词频,构建所述相关词的向量;根据所述第一相关词集中的每一个相关词的向量,获取所述关键词与所述第一相关词集中的每一个相关词的相似度,并选取所述关键词的相关词。采用本发明专利技术实施例,能够同时提高搜索相关词的准确度和搜索效率。

Method and device for searching related words, storage medium and terminal equipment

The invention discloses a method for search related words device, storage medium and terminal device, the method includes: receiving type keywords, acquiring the keywords from entry in the database first related word set related words; the first related word set contains the keywords to every relevant Union; the second of the first related word as a subset of the third word set; for each of the first related word set, according to the second Related words every word of the third word set in the record of the word frequency, vector construction related words; according to the first related word from each related word vector, obtaining the key words and the first related word from each related word similarity, and selects the keywords Related words. By adopting the embodiment of the invention, the accuracy and efficiency of searching relevant words can be improved simultaneously.

【技术实现步骤摘要】
搜索相关词的方法及装置、存储介质和终端设备
本专利技术涉及计算机搜索
,尤其涉及一种搜索相关词的方法及装置、存储介质和终端设备。
技术介绍
目前,购物网站以及搜索引擎服务网站都提供的关键词搜索的功能,即用户输入想要搜索的商品或技术的关键词,服务器则根据该关键词搜索出相应的结果并返回给用户。服务器为了提供准确的搜索结果,服务器一般会对关键词进行扩展,即根据用户输入的关键词,查找出关键词对应的相关词,并提供查找到的相关词给用户,在用户通过关键词搜索而未能得到满意的搜索结果时,就根据相关词进行搜索。但现有的相关词扩展是通过已有词典进行扩展,例如WordNet、《同义词林》,而这种方式所获得的相关词在数量上相当有限,而且所获得的相关词有可能跟不上语言的发展变化,不能满足相关词对时效性的要求。以及,即使通过扩展使得获取到的相关词更多,但是获取的过程效率低下。
技术实现思路
本专利技术实施例的目的是提出的一种搜索相关词的方法及装置、存储介质和终端设备,能够同时提高搜索相关词的准确度和搜索效率。为实现上述目的,本专利技术实施例提供一种搜索相关词的方法,包括:接收键入的关键词,从词条数据库中获取所本文档来自技高网...
搜索相关词的方法及装置、存储介质和终端设备

【技术保护点】
一种搜索相关词的方法,其特征在于,包括:接收键入的关键词,从词条数据库中获取所述关键词的第一相关词集;所述第一相关词集中的相关词包括所述关键词;将所述第一相关词集中的每一个相关词的第二相关词集的并集作为第三相关词集;其中,所述每一个相关词的第二相关词集是从所述词条数据库中获取的;对所述第一相关词集中的每一个相关词,根据所述第三相关词集中的每一个词在所述相关词的第二相关词集中记载的词频,构建所述相关词的向量;根据所述第一相关词集中的每一个相关词的向量,获取所述关键词与所述第一相关词集中的与所述关键词不相同的每一个相关词的相似度,并根据所获取到的相似度选取所述关键词的相关词。

【技术特征摘要】
1.一种搜索相关词的方法,其特征在于,包括:接收键入的关键词,从词条数据库中获取所述关键词的第一相关词集;所述第一相关词集中的相关词包括所述关键词;将所述第一相关词集中的每一个相关词的第二相关词集的并集作为第三相关词集;其中,所述每一个相关词的第二相关词集是从所述词条数据库中获取的;对所述第一相关词集中的每一个相关词,根据所述第三相关词集中的每一个词在所述相关词的第二相关词集中记载的词频,构建所述相关词的向量;根据所述第一相关词集中的每一个相关词的向量,获取所述关键词与所述第一相关词集中的与所述关键词不相同的每一个相关词的相似度,并根据所获取到的相似度选取所述关键词的相关词。2.如权利要求1所述的搜索相关词的方法,其特征在于,所述第一相关词集中的第i个相关词为bi,则所述第i个相关词bi的向量为其中,m为所述第三相关词集的词的个数,cx为所述第三相关词集中的第x个词;为所述第三相关词集中的第x个词cx在所述第i个相关词bi的第二相关词集中记载的词频。3.如权利要求2所述的搜索相关词的方法,其特征在于,所述关键词为a,则所述关键词a与所述第一相关词集中的第i个相关词为bi的相似度为:其中,为所述第三相关词集中的第x个词cx在以所述关键词a为相关词的第二相关词集中记载的词频。4.如权利要求2所述的搜索相关词的方法,其特征在于,所述关键词为a,则所述关键词a与所述第一相关词集中的第i个相关词为bi的相似度为:其中,为所述第三相关词集中的第x个词cx在以所述关键词a为相关词的第二相关词集中记载的词频。5.如权利要求2所述的搜索相关词的方法,其特征在于,所述关键词为a,则所述关键词a与所述第一相关词集中的第i个相关词为bi的相似度为:其中,为所述关键词a的向量。6.如权利要求1至5任一项所述的搜索相关词的方法,其特征在于,所述根据所述第一相关词集中的每一个相关词的向量,获取所述关键词与所述第一相关词集中的与所述关键词不相同的每一个相关词的相似度,并选取所述关键词的相关词,具体为:根据所述第一相关词集中的每一个相关词的向量,计算所述第一相关词集中任意两个相关词之间的相似度;根据所述关键词与所述第一相关词集中的与所述关键词不相同的每一个相关...

【专利技术属性】
技术研发人员:李贤
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1