【技术实现步骤摘要】
产品名称识别方法、装置、电子设备和介质
本公开涉及文本识别
,尤其涉及一种产品名称识别方法、装置、电子设备和存储介质。
技术介绍
在保险行业中,保险产品名称识别广泛应用于保险领域的诸多业务场景。相关技术中,对于保险产品名称的识别,主要采用序列标注或文本检索的方式进行。其中,针对基于序列标注的名称识别方案,在较短的名称识别上较为有效,如果保险名称较长,且名称的开头和结尾没有明显特征,对保险名识别的效果就不够理想,针对基于文本检索的名称识别方案,由于只能够进行字符匹配,而缺少语义匹配,导致识别结果的语义相似度比较低。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种产品名称识别方法、装置、存储介质及电子设备,至少在一定程度上克服由于相关技术中的保险名称识别的效果就不够理想的问题。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的 ...
【技术保护点】
1.一种产品名称识别方法,其特征在于,包括:/n获取待识别文本,并获取与所述待识别文本的字符匹配的候选产品名称;/n基于深度神经网络模型和预设的权重表对所述待识别文本进行编码,生成第一编码向量,基于所述深度神经网络模型和所述权重表对所述候选产品名称进行编码,生成第二编码向量,所述权重表包括预存产品名称中每个文字的文本语义权重和/或位置权重;/n检测所述第一编码向量和所述第二编码向量之间的语义相似度;/n基于所述语义相似度在所述候选产品名称中选取与所述待识别文本对应的所述产品名称。/n
【技术特征摘要】
1.一种产品名称识别方法,其特征在于,包括:
获取待识别文本,并获取与所述待识别文本的字符匹配的候选产品名称;
基于深度神经网络模型和预设的权重表对所述待识别文本进行编码,生成第一编码向量,基于所述深度神经网络模型和所述权重表对所述候选产品名称进行编码,生成第二编码向量,所述权重表包括预存产品名称中每个文字的文本语义权重和/或位置权重;
检测所述第一编码向量和所述第二编码向量之间的语义相似度;
基于所述语义相似度在所述候选产品名称中选取与所述待识别文本对应的所述产品名称。
2.根据权利要求1所述的产品名称识别方法,其特征在于,所述深度神经网络模型包括BERT模型,所述基于深度神经网络模型和预设的权重表对所述待识别文本进行编码,生成第一编码向量,基于所述深度神经网络模型和所述权重表对所述候选产品名称进行编码,生成第二编码向量包括:
将所述待识别文本输入BERT模型,得到第一词向量,将所述候选产品名称输入所述BERT模型,得到第二词向量;
基于注意力机制模型生成初始化权重矩阵;
基于所述初始化权重矩阵和所述权重表得到所述第一词向量的第一权重,基于所述初始化权重矩阵和所述权重表得到所述第二词向量的第二权重;
基于所述第一权重生成所述第一编码向量,基于所述第二权重生成所述第二编码向量。
3.根据权利要求2所述的产品名称识别方法,其特征在于,所述基于所述初始化权重矩阵和所述权重表得到所述第一词向量的第一权重,基于所述初始化权重矩阵和所述权重表得到所述第二词向量的第二权重包括:
所述初始化权重矩阵包括第一初始化权重矩阵和第二初始化权重矩阵,所述第一初始化权重矩阵包括第一查询权重矩阵、第一关键权重矩阵和第一数值权重矩阵,所述第二初始化权重矩阵包括第二查询权重矩阵、第二关键权重矩阵和第二数值权重矩阵,基于所述第一查询权重矩阵和所述第一词向量生成第一查询向量,基于所述第一关键权重矩阵和所述第一词向量生成第一关键向量,基于所述第二查询权重矩阵和所述第二词向量生成第二查询向量,基于所述第二关键权重矩阵和所述第二词向量生成第二关键向量;
基于所述第一查询向量和所述第一关键向量生成所述第一词向量中每个文字的第一初始权重,基于所述第二查询向量和所述第二关键向量生成所述第一词向量中每个文字的第二初始权重;
基于所述文本语义权重和/或所述位置权重更新所述第一初始权重,得到所述第一权重,基于所述文本语义权重和/或所述位置权重更新所述第二初始权重,得到所述第二权重。
4.根据权利要求3所述的产品名称识别方法,其特征在于,所述基于所述第一权重生成所述第一编码向量,基于所述第二权重生成所述第二编码向量包括:
对所述第一权重进行归一化处理,得到第一归一化权重,对所述第二权重进行归一化处理,得到第二归...
【专利技术属性】
技术研发人员:邓晓雨,李钊,赵凯,宋慧驹,刘岩,
申请(专利权)人:泰康保险集团股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。