【技术实现步骤摘要】
地址信息解析方法及装置、设备和介质
[0001]本公开涉及人工智能
,尤其涉及深度学习、自然语言处理
,具体涉及一种地址信息解析方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]地址信息解析是指面向地址文本展开地址要素结构化处理,基于此解析地址文本所包含的地址信息的过程。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。< ...
【技术保护点】
【技术特征摘要】
1.一种地址信息解析方法,包括:获取待解析的地址文本,所述地址文本包括表征地址信息的至少一个关键词;确定所述至少一个关键词在所述地址文本中的起止位置信息;以及至少基于所述起止位置信息,解析所述地址文本所包含的地址信息。2.如权利要求1所述的方法,其中,所述至少基于所述起止位置信息,解析所述地址文本所包含的地址信息包括:将所述地址文本和所述起止位置信息输入地址信息解析模型,以获取所述地址信息解析模型所输出的所述地址文本所包含的地址信息。3.如权利要求2所述的方法,其中,所述地址信息解析模型包括语言模型和地址要素标注模型,并且其中,所述将所述地址文本和所述起止位置信息输入地址信息解析模型,以获取所述地址信息解析模型所输出的所述地址文本所包含的地址信息包括:将所述地址文本输入所述语言模型,以获取所述语言模型所输出的所述地址文本对应的多个字向量;将所述多个字向量和所述起止位置信息输入所述地址要素标注模型,以获取所述地址要素标注模型所标注的至少一个地址要素;以及基于所述至少一个地址要素,确定所述地址文本所包含的地址信息。4.如权利要求1所述的方法,还包括:确定与所述至少一个关键词分别对应的至少一个关键词向量,其中,所述至少基于所述起止位置信息,解析所述地址文本所包含的地址信息包括:基于所述起止位置信息和所述至少一个关键词向量,解析所述地址文本所包含的地址信息。5.如权利要求4所述的方法,其中,所述确定与所述至少一个关键词分别对应的至少一个关键词向量包括:从词向量数据库中获取每个关键词对应的关键词向量,所述词向量数据库中包括多个关键词和与所述多个关键词分别对应的多个关键词向量之间的映射关系。6.如权利要求1所述的方法,其中,所述至少一个关键词包括与至少一个地址层级分别对应的至少一个地址要素词,所述方法还包括:确定所述至少一个地址要素词分别对应的地址层级信息,其中,所述至少基于所述起止位置信息,解析所述地址文本所包含的地址信息包括:基于所述起止位置信息和所述地址层级信息,解析所述地址文本所包含的地址信息。7.如权利要求6所述的方法,其中,所述确定所述至少一个地址要素词分别对应的地址层级信息包括:从地址层级数据库中获取每个地址要素词对应的地址层级信息,所述地址层级数据库存储有多个地址要素词和所述多...
【专利技术属性】
技术研发人员:余金林,周小强,黄硕,陈永锋,何径舟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。