地址解析方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:21090108 阅读:37 留言:0更新日期:2019-05-11 10:09
本公开提供了一种地址解析方法,包括:对获得的语料进行分词处理,以得到作为分词语料的词;根据地址划分方式对每个词分别标注一个语义槽;对每个词进行特征提取处理,包括通过命名实体识别提取命名实体特征及通过词性标注提取词性标签特征;以及根据处理后的分词语料进行训练以得到地址解析模型。本公开还提供了一种地址解析装置、及计算机设备及计算机可读存储介质。

Address Resolution Method, Device, Computer Equipment and Computer Readable Storage Media

【技术实现步骤摘要】
地址解析方法、装置、计算机设备及计算机可读存储介质
本公开涉及一种地址解析方法、地址解析装置、及计算机设备及计算机可读存储介质。
技术介绍
任务型人机对话系统已经被成功应用到多种类型的设备,例如:手机(如:出门问问手机App)、音箱(如:出门问问TicHome智能音箱)、电视(如:微鲸电视)和可穿戴设备(如:出门问问TicPodsFree智能耳机)等。其通常包括一个或多个垂直领域,垂直领域表示自然语言文本所属领域,例如音乐领域、导航领域、天气领域等等。目前的任务型人机对话系统中,导航/餐馆/酒店等垂直领域都是通过调用API(ApplicationProgrammingInterface,应用程序编程接口)的方式进行查询,调用API仅填充粗粒度的地址语义槽时,例如海淀区新中关大厦7层、新中关大街和海淀大街交叉口、上海市浦东区、苏州街3号等,会导致API查询结果不精确,因此如何使得查询结果更加准确为需要解决的技术问题。并且现有技术中对每个垂直领域都有相应的训练语料用于训练垂直领域分类模型,这样会导致系统维护成本提高并且使得训练数据收集成本提高。
技术实现思路
为了解决上述技术问题中的至少一个本文档来自技高网...

【技术保护点】
1.一种地址解析方法,其特征在于,包括:对获得的语料进行分词处理,以得到作为分词语料的词;根据地址划分方式对每个词分别标注一个语义槽;对每个词进行特征提取处理,包括通过命名实体识别提取命名实体特征及通过词性标注提取词性标签特征;以及根据处理后的分词语料进行训练以得到地址解析模型。

【技术特征摘要】
1.一种地址解析方法,其特征在于,包括:对获得的语料进行分词处理,以得到作为分词语料的词;根据地址划分方式对每个词分别标注一个语义槽;对每个词进行特征提取处理,包括通过命名实体识别提取命名实体特征及通过词性标注提取词性标签特征;以及根据处理后的分词语料进行训练以得到地址解析模型。2.如权利要求1所述的方法,其特征在于,还包括:在对每个词进行特征提取处理后,对所得到的数据进行格式转换,以便根据处理后的分词语料进行训练。3.如权利要求1或2所述的方法,其特征在于,还包括:对自然语音文本进行自然语言理解;当自然理解结果中存在地址相关语义槽时,对所述地址相关语义槽的文本进行分词处理;对分词后的每个词通过命名实体识别提取命名实体特征及通过词性标注提取词性标签特征;以及利用所述地址解析模型进行地址解析。4.如权利要求3所述的方法,其特征在于,对自然语音文本进行自然语言理解时,得到自然语言文本所属的垂直领域及语义槽;以及所述方法还包括,在利用地址解析模型进行地址解析之后,根据地址解析结果,在对应的所述垂直领域中进行后续处理。5.如权利要求1至4中任一项所述的方法,其特征在于,所述地址划方式中,对县级市或市辖区地址层...

【专利技术属性】
技术研发人员:张贺
申请(专利权)人:出门问问信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1