一种搜索方法技术

技术编号:38096619 阅读:13 留言:0更新日期:2023-07-06 09:11
本发明专利技术实施例公开了一种搜索方法,包括:获取当前用户输入的至少一个当前搜索词及当前用户的出口企业信息,确定每个当前搜索词对应的至少一个目标扩展词以及每个目标扩展词与对应的当前搜索词之间的相似度,然后基于至少一个当前搜索词及每个当前搜索词对应的至少一个目标扩展词进行搜索得到多个候选搜索结果,将每个候选搜索结果中的采购企业信息和出口企业信息输入至预设深度学习模型中,得到每个候选搜索结果与出口企业信息之间的关联度,接着根据相似度和关联度计算每个候选搜索结果的搜索得分,最后根据搜索得分对多个候选搜索结果进行排序得到目标搜索结果,可以使得用户快速、准确的搜索到合适的采购商进行贸易。易。易。

【技术实现步骤摘要】
一种搜索方法


[0001]本专利技术涉及搜索
,尤其涉及一种搜索方法。

技术介绍

[0002]全球贸易时代,外贸商机越来越多,但出口商如何在海量信息里搜索到合适的采购商(也称供应商)进行贸易反而越来越难,其主要原因包括采购商信息失效或有误、出口商与采购商的贸易商品不匹配、采购商暂无采购意向等等,而且不同出口商对不同采购商的采购规模的倾向性也不一样,因此,为了使得出口商能够搜索到合适的采购商进行贸易,避免出口商浪费大量的精力和成本,急需一种搜索采购商的搜索引擎。
[0003]目前,出口商所用的搜索采购商的搜索引擎一般是根据用户(即出口商的业务员)输入的搜索词进行精确匹配或分词匹配得到搜索结果,通过计算搜索结果与命中关键词的相关性,以将搜索结果按相关性从高到低进行排序展示,以便于用户根据搜索结果找到合适的采购商进行贸易,但该种方式只考虑了表面信息的搜索,使得搜索结果仅仅只是表面的命中,实际上用户难以根据搜索结果找到合适的采购商进行贸易。
[0004]另外,还有一些搜索采购商的搜索引擎是根据内容热度(例如,推荐搜索、点击浏览量、点击浏览频率等)对搜索结果从高到低进行排序展示,但该方式看似热门,实际上排前的搜索结果大多是无效的搜索结果,使得用户更难以根据搜索结果找到合适的采购商进行贸易。

技术实现思路

[0005]基于此,有必要针对上述问题,提出了一种搜索方法,使得用户可以快速、准确的搜索到合适的采购商进行贸易。
[0006]为实现上述目的,本专利技术提供了一种搜索方法,所述方法包括:
[0007]获取当前用户输入的至少一个当前搜索词及所述当前用户的出口企业信息;
[0008]确定每个当前搜索词对应的至少一个目标扩展词以及每个目标扩展词与对应的当前搜索词之间的相似度;
[0009]基于至少一个当前搜索词及每个当前搜索词对应的至少一个目标扩展词进行搜索得到多个候选搜索结果,将每个候选搜索结果中的采购企业信息和所述出口企业信息输入至预设深度学习模型中,得到每个候选搜索结果与所述出口企业信息之间的关联度;
[0010]根据每个目标扩展词与对应的当前搜索词之间的相似度和每个候选搜索结果与所述出口企业信息之间的关联度计算每个候选搜索结果的搜索得分;
[0011]根据每个候选搜索结果的搜索得分对多个候选搜索结果进行排序得到目标搜索结果。
[0012]可选地,所述根据每个候选搜索结果的搜索得分对多个候选搜索结果进行排序得到目标搜索结果之前,所述方法还包括:
[0013]确定每个目标扩展词与对应的当前搜索词之间的相关度补偿量;
[0014]根据每个目标扩展词与对应的当前搜索词之间的相似度、每个目标扩展词与对应的当前搜索词之间的相关度补偿量和每个候选搜索结果与所述出口企业信息之间的关联度计算每个候选搜索结果的搜索得分。
[0015]可选地,所述根据每个候选搜索结果的搜索得分对多个候选搜索结果进行排序得到目标搜索结果之前,所述方法还包括:
[0016]确定每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分;
[0017]根据每个目标扩展词与对应的当前搜索词之间的相似度、每个目标扩展词与对应的当前搜索词之间的相关度补偿量、每个候选搜索结果与所述出口企业信息之间的关联度和每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分计算每个候选搜索结果的搜索得分。
[0018]可选地,所述根据每个目标扩展词与对应的当前搜索词之间的相似度、每个目标扩展词与对应的当前搜索词之间的相关度补偿量、每个候选搜索结果与所述出口企业信息之间的关联度和每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分计算每个候选搜索结果的搜索得分,包括:
[0019]利用如下公式计算每个候选搜索结果的搜索得分:
[0020][0021][0022]其中,Score(q)为第q个候选搜索结果的搜索得分,R(q)为第q个候选搜索结果与所述出口企业信息之间的关联度,m为所述当前用户输入的至少一个当前搜索词的总个数,n为第i个当前搜索词对应的至少一个目标扩展词的总个数,Searchwords(i)为第i个当前搜索词与第i个当前搜索词对应的n个目标扩展词的总值,SIM_keyword(j)为第j个目标扩展词与对应的第i个当前搜索词之间的相似度,SearchScore(j)为第j个目标扩展词与对应的第i个当前搜索词之间的相关性得分,C(j)为第j个目标扩展词与对应的第i个当前搜索词之间的相关度补偿量。
[0023]可选地,所述确定每个当前搜索词对应的至少一个目标扩展词以及每个目标扩展词与对应的当前搜索词之间的相似度,包括:
[0024]确定每个当前搜索词对应的至少一个候选扩展词;
[0025]将每个当前搜索词依次输入至预设Word2vec模型中,得到每个当前搜索词的第一词向量,以及将每个候选扩展词输入至所述预设Word2vec模型中,得到每个候选扩展词的第二词向量;
[0026]确定每个候选扩展词的第二词向量与对应的当前搜索词的第一词向量之间的相似度,并将相似度大于或等于相似度阈值的候选扩展词作为对应的当前搜索词的目标扩展词,且将该相似度作为该目标扩展词与对应的当前搜索词之间的相似度。
[0027]可选地,所述确定每个目标扩展词与对应的当前搜索词之间的相关度补偿量,包括:
[0028]在每个目标扩展词与对应的当前搜索词被历史用户搜索过的情况下,将搜索过每个目标扩展词与对应的当前搜索词的历史用户作为目标用户;
[0029]获取所有目标用户的企业信息;
[0030]将任意两个目标用户构成目标用户组,得到多组目标用户组;
[0031]计算各组目标用户组中的两个目标用户之间的用户信息的相同维度,得到多个相同维度;
[0032]计算多个相同维度的加权平均值,并将所述加权平均值作为每个目标扩展词与对应的当前搜索词之间的相关度补偿量。
[0033]可选地,所述确定每个目标扩展词与对应的当前搜索词之间的相关度补偿量,包括:
[0034]在每个目标扩展词与对应的当前搜索词没被历史用户搜索过的情况下,按阈值范围初始化设置每个目标扩展词与对应的当前搜索词之间的相关度补偿量。
[0035]可选地,所述确定每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分,包括:
[0036]基于TF/IDF模型,计算每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的词频率,并将所述词频率作为每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分。
[0037]可选地,所述基于至少一个当前搜索词及每个当前搜索词对应的至少一个目标扩展词进行搜索得到多个候选搜索结果,将每个候选搜索结果中的采购企业信息和所述出口企业信息输入至预设深度学习模型中,得到每个候选搜索结果与所述出口企业信息之间的关联度之前,所述方法还包括:
[0038]收集历史出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种搜索方法,特征在于,所述方法包括:获取当前用户输入的至少一个当前搜索词及所述当前用户的出口企业信息;确定每个当前搜索词对应的至少一个目标扩展词以及每个目标扩展词与对应的当前搜索词之间的相似度;基于至少一个当前搜索词及每个当前搜索词对应的至少一个目标扩展词进行搜索得到多个候选搜索结果,将每个候选搜索结果中的采购企业信息和所述出口企业信息输入至预设深度学习模型中,得到每个候选搜索结果与所述出口企业信息之间的关联度;根据每个目标扩展词与对应的当前搜索词之间的相似度和每个候选搜索结果与所述出口企业信息之间的关联度计算每个候选搜索结果的搜索得分;根据每个候选搜索结果的搜索得分对多个候选搜索结果进行排序得到目标搜索结果。2.根据权利要求1所述的方法,其特征在于,所述根据每个候选搜索结果的搜索得分对多个候选搜索结果进行排序得到目标搜索结果之前,所述方法还包括:确定每个目标扩展词与对应的当前搜索词之间的相关度补偿量;根据每个目标扩展词与对应的当前搜索词之间的相似度、每个目标扩展词与对应的当前搜索词之间的相关度补偿量和每个候选搜索结果与所述出口企业信息之间的关联度计算每个候选搜索结果的搜索得分。3.根据权利要求2所述的方法,其特征在于,所述根据每个候选搜索结果的搜索得分对多个候选搜索结果进行排序得到目标搜索结果之前,所述方法还包括:确定每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分;根据每个目标扩展词与对应的当前搜索词之间的相似度、每个目标扩展词与对应的当前搜索词之间的相关度补偿量、每个候选搜索结果与所述出口企业信息之间的关联度和每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分计算每个候选搜索结果的搜索得分。4.根据权利要求3所述的方法,其特征在于,所述根据每个目标扩展词与对应的当前搜索词之间的相似度、每个目标扩展词与对应的当前搜索词之间的相关度补偿量、每个候选搜索结果与所述出口企业信息之间的关联度和每个目标扩展词与对应的当前搜索词在每个候选搜索结果中的相关性得分计算每个候选搜索结果的搜索得分,包括:利用如下公式计算每个候选搜索结果的搜索得分:利用如下公式计算每个候选搜索结果的搜索得分:其中,Score(q)为第q个候选搜索结果的搜索得分,R(q)为第q个候选搜索结果与所述出口企业信息之间的关联度,m为所述当前用户输入的至少一个当前搜索词的总个数,n为第i个当前搜索词对应的至少一个目标扩展词的总个数,Searchwords(i)为第i个当前搜索词与第i个当前搜索词对应的n个目标扩展词的总值,SIM_keyword(j)为第j个目标扩展词与对应的第i个当前搜索词之间的相似度,SearchScore(j)为第j个目标扩展词与对应的第i个当前搜索词之间的相关性得分,C(j)为第j个目标扩展词与对应的第i个当前搜索词之间的相关度补偿量。5.根据权利要求1所述的方法,其特征在于,所述确定每个当前搜索词对应的至少一个
目标扩展词以及每个目标扩展词与对应的当前搜索词之间的相似度,包括:确定每个当...

【专利技术属性】
技术研发人员:张玉君
申请(专利权)人:深圳市小满科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1