结合深度卷积网络和注意力机制的地址匹配方法以及装置制造方法及图纸

技术编号:34570165 阅读:19 留言:0更新日期:2022-08-17 13:01
本申请公开了一种结合深度卷积网络和注意力机制的地址匹配方法以及地址匹配装置,属于人工智能技术领域,方法包括:输入待匹配的第一地址文本和第二地址文本;训练地址语义提取模型;通过地址语义提取模型,将地址文本逐字转化为文本向量;训练包括输入层、卷积层、池化层和输出层深度卷积神经网络模型;将文本向量输入至输入层,在输入层中引入注意力机制,获取交互关系特征矩阵,对文本向量和关系特征矩阵进行叠加;在卷积层中定义卷积核,对文本向量沿文本方向进行卷积;在池化层中引入注意力机制,对卷积后的向量进行池化处理,输出输出向量;在输出层中,建立逻辑回归模型,判断两个输出向量是否匹配,输出两个地址文本是否匹配的结果。配的结果。配的结果。

【技术实现步骤摘要】
结合深度卷积网络和注意力机制的地址匹配方法以及装置


[0001]本申请属于人工智能
,具体涉及一种结合深度卷积网络和注意力机制的地址匹配方法以及地址匹配装置。

技术介绍

[0002]地址匹配作为地址解析研究方向的重要部分,其基本任务形式就是在输入两条地址文本时,判断两者描述的是否为同一地点。地址的描述性文本具有表达多样化、不规范、字符串长度不固定等特征,在不考虑模糊地址、错误地址的情况下,每一条地址文本都应对应到地图上一个确定的空间位置,然而同一个空间位置却有可能对应多种不同的地址描述。因此,进行地址匹配通常是地址数据预处理、地点关联查询、推荐、以及其他空间数据挖掘任务的基础技术。目前主流的地址匹配技术,包括基于文本相似性、基于地址要素解析、基于深度学习三大类。
[0003]当出现字面几乎没有重叠、但是指向同一地点的地址文本时,上述的基于文本相似性和基于地址要素解析的方法基本都无法正确识别。随着城市大数据的快速发展,可以看到越来越多地出现没有标准结构、表达方式各异的地址数据。为了解决上述问题,近年来的相关研究开始考虑地址语义,并引入深度学习的方法进行地址匹配。
[0004]但是目前的相关研究主要还是依靠自然语言分词+词嵌入提取语义+输出模型的流程,在有限的训练数据内,地址文本的语义信息难以得到充分的挖掘利用,地址语义理解和匹配能力不足。另外,简单通用的输出模型对于地址匹配的准确性不足,还需要通过建立针对性的深度神经网络结构进行提升。

技术实现思路

[0005]本申请实施例的目的是提供一种结合深度卷积网络和注意力机制的地址匹配方法及地址匹配装置,能够解决现有的地址匹配方法在有限的训练数据内,地址文本的语义信息难以得到充分的挖掘利用,存在地址语义理解能力和匹配能力不足的问题。
[0006]为了解决上述技术问题,本申请是这样实现的:
[0007]第一方面,本申请实施例提供了一种结合深度卷积网络和注意力机制的地址匹配方法,包括:
[0008]输入待匹配的第一地址文本和第二地址文本;
[0009]训练地址语义提取模型;
[0010]通过地址语义提取模型,将第一地址文本逐字转化为第一文本向量,将第二地址文本逐字转化为第二文本向量;
[0011]训练结合注意力机制的深度卷积神经网络模型,其中,深度卷积神经网络模型包括输入层、卷积层、池化层和输出层;
[0012]将第一文本向量和第二文本向量输入至输入层,在输入层中引入注意力机制,获取第一文本向量和第二文本向量之间的交互关系特征矩阵,对第一文本向量和第一关系特
征矩阵、第二文本向量和第二关系特征矩阵进行叠加,进入卷积层;
[0013]在卷积层中定义卷积核,对第一文本向量和第二文本向量沿文本方向进行卷积,在文本两侧分别使用0做填充处理,进入池化层;
[0014]在池化层中引入注意力机制,对卷积后的向量进行池化处理,输出第一输出向量和第二输出向量,进入输出层;
[0015]在输出层中,建立逻辑回归模型,判断第一输出向量和第二输出向量是否匹配,输出第一地址文本和第二地址文本是否匹配的结果。
[0016]可选地,训练地址语义提取模型,具体包括:
[0017]收集地址文本语料库;
[0018]利用地址文本语料库,对BERT预训练模型进行微调训练,得到地址语义提取模型。
[0019]可选地,对BERT预训练模型进行微调训练,具体为:
[0020]利用逐层解冻策略、逐层衰减学习率策略和倾斜三角学习率策略对BERT预训练模型进行微调训练。
[0021]可选地,训练结合注意力机制的深度卷积神经网络模型,具体包括:
[0022]搭建结合注意力机制的深度卷积神经网络模型;
[0023]构建地址匹配样本库,地址匹配样本库包括多个地址匹配样本,每个地址匹配样本包括两条地址文本和两条地址文本是否指向同一地点的标记;
[0024]利用地址匹配样本库对深度卷积神经网络模型进行训练。
[0025]可选地,在输入层中引入注意力机制,获取第一文本向量和第二文本向量之间的交互关系特征矩阵,包括:
[0026]定义输入注意力矩阵,其中,输入注意力矩阵用于表示第一地址文本中的各个文字与第二地址文本中的各个文字之间的相似程度;
[0027]定义权重矩阵;
[0028]根据输入注意力矩阵和权重矩阵得到交互关系特征矩阵。
[0029]可选地,对卷积后的向量进行池化处理,包括:
[0030]定义与卷积后的向量相关的池化注意力矩阵;
[0031]根据池化注意力矩阵得到权重特征;
[0032]根据权重特征对卷积后的向量对进行池化计算。
[0033]第二方面,本申请实施例提供了一种结合深度卷积网络和注意力机制的地址匹配装置,包括:
[0034]第一输入模块,用于输入待匹配的第一地址文本和第二地址文本;
[0035]第一训练模块,用于训练地址语义提取模型;
[0036]提取模块,用于通过地址语义提取模型,将第一地址文本逐字转化为第一文本向量,将第二地址文本逐字转化为第二文本向量;
[0037]第二训练模块,用于训练结合注意力机制的深度卷积神经网络模型,其中,深度卷积神经网络模型包括输入层、卷积层、池化层和输出层;
[0038]第二输入模块,用于将第一文本向量和第二文本向量输入至输入层,在输入层中引入注意力机制,获取第一文本向量和第二文本向量之间的交互关系特征矩阵,对第一文本向量和第一关系特征矩阵、第二文本向量和第二关系特征矩阵进行叠加,进入卷积层;
[0039]卷积模块,用于在卷积层中定义卷积核,对第一文本向量和第二文本向量沿文本方向进行卷积,在文本两侧分别使用0做填充处理,进入池化层;
[0040]池化模块,用于在池化层中引入注意力机制,对卷积后的向量进行池化处理,输出第一输出向量和第二输出向量,进入输出层;
[0041]输出模块,用于在输出层中,建立逻辑回归模型,判断第一输出向量和第二输出向量是否匹配,输出第一地址文本和第二地址文本是否匹配的结果。
[0042]可选地,第一训练模块具体包括:
[0043]收集子模块,用于收集地址文本语料库;
[0044]微调子模块,用于利用地址文本语料库,对BERT预训练模型进行微调训练,得到地址语义提取模型。
[0045]可选地,微调子模块具体用于:
[0046]利用逐层解冻策略、逐层衰减学习率策略和倾斜三角学习率策略对BERT预训练模型进行微调训练。
[0047]可选地,第二训练模块具体包括:
[0048]搭建子模块,用于搭建结合注意力机制的深度卷积神经网络模型;
[0049]样本子模块,用于构建地址匹配样本库,地址匹配样本库包括多个地址匹配样本,每个地址匹配样本包括两条地址文本和两条地址文本是否指向同一地点的标记;
[0050]训练本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合深度卷积网络和注意力机制的地址匹配方法,其特征在于,包括:输入待匹配的第一地址文本和第二地址文本;训练地址语义提取模型;通过所述地址语义提取模型,将所述第一地址文本逐字转化为第一文本向量,将所述第二地址文本逐字转化为第二文本向量;训练结合注意力机制的深度卷积神经网络模型,其中,所述深度卷积神经网络模型包括输入层、卷积层、池化层和输出层;将所述第一文本向量和所述第二文本向量输入至所述输入层,在所述输入层中引入注意力机制,获取所述第一文本向量和所述第二文本向量之间的交互关系特征矩阵,对所述第一文本向量和第一关系特征矩阵、所述第二文本向量和第二关系特征矩阵进行叠加,进入所述卷积层;在所述卷积层中定义卷积核,对所述第一文本向量和所述第二文本向量沿文本方向进行卷积,在文本两侧分别使用0做填充处理,进入所述池化层;在所述池化层中引入注意力机制,对卷积后的向量进行池化处理,输出第一输出向量和第二输出向量,进入所述输出层;在所述输出层中,建立逻辑回归模型,判断所述第一输出向量和所述第二输出向量是否匹配,输出所述第一地址文本和所述第二地址文本是否匹配的结果。2.根据权利要求1所述的地址匹配方法,其特征在于,所述训练地址语义提取模型,具体包括:收集地址文本语料库;利用所述地址文本语料库,对BERT预训练模型进行微调训练,得到所述地址语义提取模型。3.根据权利要求2所述的地址匹配方法,其特征在于,所述对BERT预训练模型进行微调训练,具体为:利用逐层解冻策略、逐层衰减学习率策略和倾斜三角学习率策略对所述BERT预训练模型进行微调训练。4.根据权利要求1所述的地址匹配方法,其特征在于,所述训练结合注意力机制的深度卷积神经网络模型,具体包括:搭建结合注意力机制的所述深度卷积神经网络模型;构建地址匹配样本库,所述地址匹配样本库包括多个地址匹配样本,每个所述地址匹配样本包括两条地址文本和所述两条地址文本是否指向同一地点的标记;利用所述地址匹配样本库对所述深度卷积神经网络模型进行训练。5.根据权利要求1所述的地址匹配方法,其特征在于,所述在所述输入层中引入注意力机制,获取所述第一文本向量和所述第二文本向量之间的交互关系特征矩阵,包括:定义输入注意力矩阵,其中,所述输入注意力矩阵用于表示所述第一地址文本中的各个文字与所述第二地址文本中的各个文字之间的相似程度;定义权重矩阵;根据所述输入注意力矩阵和所述权重矩阵得到所述交互关系特征矩阵。6.根据权利要求1所...

【专利技术属性】
技术研发人员:陈逸舟张丹熊晓菁
申请(专利权)人:北京青萌数海科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1