【技术实现步骤摘要】
本专利技术涉及信息处理,具体涉及一种基于lstm的中文地址分词方法、系统、计算机设备以及非易失性计算机可读存储介质。
技术介绍
1、目前,随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(fintech)转变,中文地址分词技术也不例外,但由于金融行业的安全性、实时性要求,也对中文地址分词技术提出了更高的要求。
2、目前,对于银行业务而言,地址信息一直是重要因素,其应用价值已经不单单局限于用户地址的定位,更能将不同数据来源的信息由地址连接起来,用于丰富地刻画客户的画像,在客户营销领域、信用卡领域、反欺诈领域等都有重要价值。但是,在实际采集过程中,由于不同客户的填写方式、生活习惯,同一地址会有不同的写法,甚至同一客户在不同环境下也会对同一地址有不同描述。为了提高地址信息的应用价值,中文地址标准化是实现这些目标的重要途径,中文地址标准化包括分词、要素识别等工作,而中文分词是地址标准化过程中第一步也是最重要的一步。中文地址是由地址要素按一定顺序组合而成,且地址要素的命名存在随意性,这些都对中文地址分词
...【技术保护点】
1.一种基于LSTM的中文地址分词方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于LSTM的中文地址分词方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的基于LSTM的中文地址分词方法,其特征在于,所述确定LSTM模型的中文地址数据集,其中,所述中文地址数据集包括训练数据集与测试数据集。
4.根据权利要求3所述的基于LSTM的中文地址分词方法,其特征在于,所述采用所述中文地址数据集对所述LSTM模型进行训练与测试,生成中文地址分词模型,包括:
5.一种基于LSTM的中文地址分词系统,其特征在于,所
...【技术特征摘要】
1.一种基于lstm的中文地址分词方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于lstm的中文地址分词方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的基于lstm的中文地址分词方法,其特征在于,所述确定lstm模型的中文地址数据集,其中,所述中文地址数据集包括训练数据集与测试数据集。
4.根据权利要求3所述的基于lstm的中文地址分词方法,其特征在于,所述采用所述中文地址数据集对所述lstm模型进行训练与测试,生成中文地址分词模型,包括:
5.一种基于lstm的中文地址分词系统,其特征在于,所述系统包括:
6.根据权利要求5所述的基于ls...
【专利技术属性】
技术研发人员:张玉霞,苏志锋,田鸥,文广明,张炎雨,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。