企业名称检索方法、企业名称检索装置及终端设备制造方法及图纸

技术编号:27935430 阅读:30 留言:0更新日期:2021-04-02 14:15
本申请适用于数据处理技术领域,提供了一种企业名称检索方法、企业名称检索装置及终端设备,方法包括:根据训练后的句向量生成模型获取第一检索语句的第一句向量;获取多个候选企业名称各自的第二句向量;根据所述第一句向量和所述第二句向量之间的距离,从所述多个候选企业名称中确定出多个召回企业名称;根据训练后的排序模型,从所述多个召回企业名称中确定出所述第一检索语句对应的目标企业名称。通过上述方法,能够有效提高企业名称检索的准确度,同时提高检索效率。

【技术实现步骤摘要】
企业名称检索方法、企业名称检索装置及终端设备
本申请属于数据处理
,尤其涉及一种企业名称检索方法、企业名称检索装置及终端设备。
技术介绍
随着经济的快速增长,注册企业的数量呈逐年上升的趋势。许多企业的名称全称较长,对于用户而言,可能只记住了企业名称的简称、或其中几个词语。这种情况下,从大量的企业名称中很难查找到目标名称。现有的企业名称检索方法中,通常是将检索语句划分为字或词,然后以字或词为单位进行检索。现有方法仅考虑了词之间或字之间的匹配度,但是并未考虑检索语句的语义信息,导致检索结果并不准确。
技术实现思路
本申请实施例提供了一种企业名称检索方法、企业名称检索装置及终端设备,可以提高企业名称检索的准确度。第一方面,本申请实施例提供了一种企业名称检索方法,包括:根据训练后的句向量生成模型获取第一检索语句的第一句向量;获取多个候选企业名称各自的第二句向量;根据所述第一句向量和所述第二句向量之间的距离,从所述多个候选企业名称中确定出多个召回企业名称;根据训练后的排序模型,从所本文档来自技高网...

【技术保护点】
1.一种企业名称检索方法,其特征在于,包括:/n根据训练后的句向量生成模型获取第一检索语句的第一句向量;/n获取多个候选企业名称各自的第二句向量;/n根据所述第一句向量和所述第二句向量之间的距离,从所述多个候选企业名称中确定出多个召回企业名称;/n根据训练后的排序模型,从所述多个召回企业名称中确定出所述第一检索语句对应的目标企业名称。/n

【技术特征摘要】
1.一种企业名称检索方法,其特征在于,包括:
根据训练后的句向量生成模型获取第一检索语句的第一句向量;
获取多个候选企业名称各自的第二句向量;
根据所述第一句向量和所述第二句向量之间的距离,从所述多个候选企业名称中确定出多个召回企业名称;
根据训练后的排序模型,从所述多个召回企业名称中确定出所述第一检索语句对应的目标企业名称。


2.如权利要求1所述的企业名称检索方法,其特征在于,所述根据所述第一句向量和所述第二句向量之间的距离,从所述多个候选企业名称中确定出多个召回企业名称,包括:
计算所述第一句向量与每个所述第二句向量之间的欧式距离;
将计算出的所述欧式距离按照从小到大的顺序排序,获得距离队列;
将所述距离队列中前M个所述欧式距离各自对应的所述候选企业名称确定为所述召回企业名称,其中,所述M为正整数。


3.如权利要求1所述的企业名称检索方法,其特征在于,所述根据训练后的排序模型,从所述多个召回企业名称中确定出所述第一检索语句对应的目标企业名称,包括:
将所述第一句向量和所述多个召回企业名称各自的所述第二句向量输入到所述训练后的排序模型中,输出所述多个召回企业名称各自的匹配概率;
将所述匹配概率按照从大到小的顺序排序,获得概率队列;
将所述概率队列中前N个所述匹配概率各自对应的所述召回企业名称确定为所述目标企业名称,其中,所述N为正整数,且N小于或等于所述召回企业名称的数量。


4.如权利要求1所述的企业名称检索方法,其特征在于,所述方法还包括:
获取多组第一训练数据,其中,每组所述第一训练数据中包括第二检索语句、第一正例名称、第一反例名称和第二反例名称,所述第一正例名称用于表示与所述第二检索语句相匹配的企业名称,所述第一反例名称和所述第二反例名称用于表示与所述第二检索语句不匹配的企业名称;
分别将每组所述第一训练数据输入到所述句向量生成模型中,输出每组所述第一训练数据的向量数据组,其中,每组所述第一训练数据的向量数据组中包括所述第二检索语句的第三句向量、所述第一正例名称的第四句向量、所述第一反例名称的第五句向量和所述第二反例名称的第六句向量;
根据所述多组第一训练数据各自的所述向量数据组计算第一误差值;
利用所述第一误差值更新所述句向量生成模型的模型参数,获得所述训练后的句向量生成模型。


5.如权利要求4所述的企业名称检索方法,其特征在于,所述根据所述多组第一训练数据各自的所述向量数据组计算第一误差值,包括:
通过预设公式...

【专利技术属性】
技术研发人员:赵洋朱继刚包荣鑫王瑗梅金芳
申请(专利权)人:深圳价值在线信息科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1