基于LSTM的中文地址分词方法、系统、计算机设备及介质技术方案

技术编号:43007829 阅读:21 留言:0更新日期:2024-10-18 17:14
本发明专利技术公开了基于LSTM的中文地址分词方法、系统、计算机设备及介质,涉及信息处理技术领域,其中,所述方法包括:预先通过LSTM神经网络构建得到LSTM模型;确定所述LSTM模型的中文地址数据集;采用所述中文地址数据集对所述LSTM模型进行训练与测试,生成中文地址分词模型;将采集的目标中文地址输入所述中文地址分词模型,根据输出结果获取所述目标中文地址的分词结果。这样,通过本发明专利技术的方法可以提升中文地址分词的准确性,进而也提升了地址信息在银行领域的应用价值。

【技术实现步骤摘要】

本专利技术涉及信息处理,具体涉及一种基于lstm的中文地址分词方法、系统、计算机设备以及非易失性计算机可读存储介质。


技术介绍

1、目前,随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(fintech)转变,中文地址分词技术也不例外,但由于金融行业的安全性、实时性要求,也对中文地址分词技术提出了更高的要求。

2、目前,对于银行业务而言,地址信息一直是重要因素,其应用价值已经不单单局限于用户地址的定位,更能将不同数据来源的信息由地址连接起来,用于丰富地刻画客户的画像,在客户营销领域、信用卡领域、反欺诈领域等都有重要价值。但是,在实际采集过程中,由于不同客户的填写方式、生活习惯,同一地址会有不同的写法,甚至同一客户在不同环境下也会对同一地址有不同描述。为了提高地址信息的应用价值,中文地址标准化是实现这些目标的重要途径,中文地址标准化包括分词、要素识别等工作,而中文分词是地址标准化过程中第一步也是最重要的一步。中文地址是由地址要素按一定顺序组合而成,且地址要素的命名存在随意性,这些都对中文地址分词产生了严重的影响,使本文档来自技高网...

【技术保护点】

1.一种基于LSTM的中文地址分词方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于LSTM的中文地址分词方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的基于LSTM的中文地址分词方法,其特征在于,所述确定LSTM模型的中文地址数据集,其中,所述中文地址数据集包括训练数据集与测试数据集。

4.根据权利要求3所述的基于LSTM的中文地址分词方法,其特征在于,所述采用所述中文地址数据集对所述LSTM模型进行训练与测试,生成中文地址分词模型,包括:

5.一种基于LSTM的中文地址分词系统,其特征在于,所述系统包括:

...

【技术特征摘要】

1.一种基于lstm的中文地址分词方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于lstm的中文地址分词方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的基于lstm的中文地址分词方法,其特征在于,所述确定lstm模型的中文地址数据集,其中,所述中文地址数据集包括训练数据集与测试数据集。

4.根据权利要求3所述的基于lstm的中文地址分词方法,其特征在于,所述采用所述中文地址数据集对所述lstm模型进行训练与测试,生成中文地址分词模型,包括:

5.一种基于lstm的中文地址分词系统,其特征在于,所述系统包括:

6.根据权利要求5所述的基于ls...

【专利技术属性】
技术研发人员:张玉霞苏志锋田鸥文广明张炎雨
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1