文本地址识别方法、电子设备及存储介质技术

技术编号:37441427 阅读:18 留言:0更新日期:2023-05-06 09:13
本申请提供了一种文本地址识别方法、电子设备及存储介质,涉及人工智能技术领域。所述方法应用于电子设备,所述方法包括:确定地址识别对应的目标文本;根据所述目标文本的文本语种对应的地址词典,在所述目标文本中确定特征词;根据所述特征词和所述目标文本的文本语种对应的地址书序规则,在所述目标文本中确定目标子序列;按照预设的特征提取规则,确定所述目标子序列对应的文本特征;将所述文本特征输入所述目标文本的文本语种对应的地址识别模型中,得到所述目标子序列对应的地址概率。本申请实施例可以提高了地址识别的准确率。本申请实施例可以提高了地址识别的准确率。本申请实施例可以提高了地址识别的准确率。

【技术实现步骤摘要】
文本地址识别方法、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种文本地址识别方法、电子设备及存储介质。

技术介绍

[0002]随着人工智能(Artificial Intelligence,AI)和大数据的不断发展,文本识别成为其中很重要的技术之一。在将文本识别技术应用到地址角色识别的场景时,需要对待识别文本中的文本地址进行识别,得到地址数据。但是,对待识别文本中较长的地址文本进行识别时,容易出现地址截断的问题,例如,将一个完整的地址切分为多个部分,导致地址识别的效果较差而影响到识别地址的准确性。

技术实现思路

[0003]鉴于以上内容,有必要提供一种文本地址识别方法、电子设备及存储介质,以提升文本地址识别的准确率。
[0004]第一方面,本申请实施例提供一种文本地址识别方法,应用于电子设备,所述方法包括:确定地址识别对应的目标文本;根据所述目标文本的文本语种对应的地址词典,在所述目标文本中确定特征词;根据所述特征词和所述目标文本的文本语种对应的地址书序规则,在所述目标文本中确定目标子序列;按照预本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本地址识别方法,其特征在于,所述方法应用于电子设备,所述方法包括:确定地址识别对应的目标文本;根据所述目标文本的文本语种对应的地址词典,在所述目标文本中确定特征词;根据所述特征词和所述目标文本的文本语种对应的地址书序规则,在所述目标文本中确定目标子序列;按照预设的特征提取规则,确定所述目标子序列对应的文本特征;将所述文本特征输入所述目标文本的文本语种对应的地址识别模型中,得到所述目标子序列对应的地址概率。2.根据权利要求1所述的文本地址识别方法,其特征在于,所述根据所述目标文本的文本语种对应的地址词典,在所述目标文本中确定特征词包括:若所述目标文本中一单词与所述目标文本的文本语种对应的地址词典中记载的一个词相同,将所述单词确定为特征词;或者若所述目标文本中一单词与所述目标文本的文本语种对应的地址词典中记录的一个地址表达规则相匹配,将所述单词确定为特征词。3.根据权利要求2所述的文本地址识别方法,其特征在于,所述方法还包括:若所述目标文本中存在一阿拉伯数字,将所述阿拉伯数字确定为特征词。4.根据权利要求1所述的文本地址识别方法,其特征在于,在所述目标文本中确定特征词之后,所述方法还包括:使用预设的标注词或标注符号,对所述特征词进行标注。5.根据权利要求1所述的文本地址识别方法,其特征在于,所述在所述目标文本中确定目标子序列包括:对确定的每个特征词进行两边扩散;确定每次扩散后得到的分词是否符合所述目标文本的文本语种对应的地址书写规则;根据判断结果确定目标子序列,所述两边扩散包括上文扩散和下文扩散。6.根据权利要求5所述的文本地址识别方法,其特征在于,所述根据判断结果确定目标子序列包括:根据判断结果,确定是否停止两边扩散;若停止两边扩散,根据在所述目标文本中停止两边扩散的位置,确定目标子序列。7.根据权利要求5所述的文本地址识别方法,其特征在于,所述确...

【专利技术属性】
技术研发人员:刘智奇
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1