【技术实现步骤摘要】
本申请涉及计算机,具体而言,涉及一种实体链接处理方法、设备、存储介质及程序产品。
技术介绍
1、在金融领域中,存在公司名称实体链接的需求。公司名称实体链接是指,将从网络资讯等渠道获取到的实体信息与标准的公司编码表中的公司标准名称关联起来,以用于后续的业务中。例如,对包含该实体信息的信息进行分析,以得到该实体信息关联的公司标准名称对应的公司的相关分析结果。其中,实体信息也可以称为实体提及,具体可以是公司的简称、别名等。
2、现有技术中,可以构建别名库来记录实体提及与公司标准名称之间的映射关系,进而可以利用别名库进行结果召回,并根据召回的结果返回实体提及对应的标准公司名称。
3、但是,使用现有技术的方法存在召回结果召回率不高的问题,难以保证公司实体名称链接的结果的准确性。
技术实现思路
1、本申请的目的在于,针对上述现有技术中的不足,提供一种实体链接处理方法、设备、存储介质及程序产品,以解决现有技术中召回结果召回率不高、难以保证公司实体名称链接的结果的准确性的问题。
...【技术保护点】
1.一种实体链接处理方法,其特征在于,包括:
2.根据权利要求1所述的实体链接处理方法,其特征在于,训练得到所述深度双向自然语言处理模型的过程包括:
3.根据权利要求2所述的实体链接处理方法,其特征在于,所述标注头向量的长度、所述标注尾向量的长度、所述训练头向量的长度以及所述训练尾向量的长度均与所述样本标准名称的长度相同;
4.根据权利要求2所述的实体链接处理方法,其特征在于,所述根据别名的头部在标准名称中的位置与别名的尾部在标准名称中的位置之间的约束关系以及所述训练头向量,生成训练尾向量,包括:
5.根据权利要求4所述
...【技术特征摘要】
1.一种实体链接处理方法,其特征在于,包括:
2.根据权利要求1所述的实体链接处理方法,其特征在于,训练得到所述深度双向自然语言处理模型的过程包括:
3.根据权利要求2所述的实体链接处理方法,其特征在于,所述标注头向量的长度、所述标注尾向量的长度、所述训练头向量的长度以及所述训练尾向量的长度均与所述样本标准名称的长度相同;
4.根据权利要求2所述的实体链接处理方法,其特征在于,所述根据别名的头部在标准名称中的位置与别名的尾部在标准名称中的位置之间的约束关系以及所述训练头向量,生成训练尾向量,包括:
5.根据权利要求4所述的实体链接处理方法,其特征在于,所述根据所述第一间隔以及第二间隔,生成所述训练尾向量,包括:
6.根据权利要求1所述的实体链接处理方法,其特征在于,基于所述深度双向自然语言处理模型构建所述别名库的过程包括:
7.根据权利要求1所述的实体链接处理方法,其特征在于,所述根据预设的标准名称库以及已构建的别名库,确定所述实体提及对应的召回结果集合,包括:
8.根据权利要求1所述的实体链接处理方法,其特征在于,所述根据所述实体提及与所述召回结果集合中各召回结果的文本相似度或语义相似度,确定所述召回结果集合中的目标召回结果,包括:
9.根据权利...
【专利技术属性】
技术研发人员:杨祎聪,李晓平,李杨,孙勇,
申请(专利权)人:杭州恒生聚源信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。