一种账单提取方法、装置、电子设备及介质制造方法及图纸

技术编号:20821180 阅读:29 留言:0更新日期:2019-04-10 06:17
本发明专利技术公开一种账单提取方法、装置、电子设备及介质,方法包括:以历史数据和从所述历史数据中提取出的历史账单数据作为训练样本,训练机器学习分类模型,其中,所述历史账单数据是按照预设的账单模板从所述历史数据中提取的数据;获取携带有账单数据的当前数据;采用所述机器学习分类模型提取所述当前数据中的账单数据,并根据所述账单数据,生成符合所述账单模板的当前账单。本申请提供的方法和装置用以解决现有技术中用户了解自己的消费情况资金转移情况,需要消耗大量的查找时间的技术问题,实现了提高查找效率和账单生成效率的技术效果。

【技术实现步骤摘要】
一种账单提取方法、装置、电子设备及介质
本专利技术涉及计算机
,尤其涉及一种账单提取方法、装置、电子设备及介质。
技术介绍
随着科技的进步,智能手机已经普及,大众的生活、消费、娱乐等活动都离不开各类移动设备。智能手机的应用带来了便利,尤其是在各种消费活动中,采用手机来进行支付也更加普遍。银行端、网络支付平台或商家为了方便用户能了解和查询自己的消费情况,在消费或进行资金转移后,往往会提供短信或单据给用户,以保留消费和资金转移记录供用户查询。然而,用户每次想了解自己的消费情况或查询某一笔资金转移时,都需要去翻阅历史短信或单据,需要消耗大量的时间,效率也较低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的账单提取方法、装置、电子设备及介质。第一方面,提供一种账单提取方法,包括:以历史数据和从所述历史数据中提取出的历史账单数据作为训练样本,训练机器学习分类模型,其中,所述历史账单数据是按照预设的账单模板从所述历史数据中提取的数据;获取携带有账单数据的当前数据;采用所述机器学习分类模型提取所述当前数据中的账单数据,并根据所述账单数据,生成符合所述账单模板的当前账单。可选的,所述当前数据为:目标单据的成像图像或短信数据。可选的,当所述当前数据为所述成像数据时,所述获取携带有账单数据的当前数据包括:以所述目标单据为拍摄对象,拍摄获取所述目标单据的成像图像;或者,接收目标单据的成像图像;或者,扫描所述目标单据,获取所述目标单据的成像图像;或者,对所述目标单据的信息进行截屏,获取所述目标单据的成像图像;在所述获取携带有账单数据的当前数据之后,还包括:通过光学字符识别技术识别所述成像图像中的字符数据。可选的,所述短信数据包括以下任一种或多种的组合:短信的接收时间、短信的发送方和短信的内容数据。可选的,所述账单数据包括以下任一种或多种的组合:金额、交易类别、交易己方账户、交易时间、交易对方信息和交易情景。可选的,在所述生成符合所述账单模板的当前账单之后还包括:比对所述当前账单与已经存储的历史账单,确定所述当前账单与所述历史账单是否存在重复关系;如果存在重复关系,则合并存在重复关系的账单。可选的,所述确定所述当前账单与所述历史账单是否存在重复关系,包括:如果所述当前账单与所述历史账单的交易时间的差值在预设差值范围内,且所述当前账单的账单数据与所述历史账单的账单数据匹配,则确定所述当前账单与所述历史账单存在重复关系;如果所述当前账单与所述历史账单的交易时间的差值不在所述预设差值范围内,或者,所述当前账单的账单数据与所述历史账单的账单数据不匹配,则确定所述当前账单与所述历史账单不存在重复关系。可选的,在所述生成符合所述账单模板的当前账单之后,还包括:输出所述当前账单以提示用户,并在接收到用户的确认操作后,存储所述当前账单。可选的,所述输出所述当前账单以提示用户,包括:监听数据的获取事件,并在每次发生数据的获取事件后,输出所述账单以提示用户;或者,按预设时间,输出所述账单以提示用户;或者,在开启账单应用的预设页面后,输出所述账单以提示用户。可选的,所述存储所述当前账单,包括:根据所述账单数据,确定所述当前账单的类型,并分类存储所述当前账单。可选的,所述方法应用于客户端,在所述生成符合所述账单模板的当前账单之后,还包括:发送所述当前账单至服务端进行数据同步,其中,以所述客户端和所述服务端中最后一个操作所述当前账单的那端的操作结果为准,同步所述客户端和所述服务端的所述当前账单中的数据。第二方面,提供一种账单提取装置,包括:训练模块,用于以历史数据和从所述历史数据中提取出的历史账单数据作为训练样本训练机器学习分类模型,其中,所述历史账单数据是按照预设的账单模板从所述历史数据中提取的数据;获取模块,用于获取携带有账单数据的当前数据;提取模块,用于按照所述账单模板,采用所述机器学习分类模型提取所述当前数据中的账单数据,并根据所述账单数据,生成当前账单。可选的,所述当前数据为:目标单据的成像图像或短信数据。可选的,当所述当前数据为所述成像数据时,所述获取模块还用于:以所述目标单据为拍摄对象,拍摄获取所述目标单据的成像图像;或者,接收目标单据的成像图像;或者,扫描所述目标单据,获取所述目标单据的成像图像;或者,对所述目标单据的信息进行截屏,获取所述目标单据的成像图像;通过光学字符识别技术识别所述成像图像中的字符数据。可选的,所述短信数据包括以下任一种或多种的组合:短信的接收时间、短信的发送方和短信的内容数据。可选的,所述账单数据包括以下任一种或多种的组合:金额、交易类别、交易己方账户、交易时间、交易对方信息和交易情景。可选的,所述装置还包括:查重模块,用于比对所述当前账单与已经存储的历史账单,确定所述当前账单与所述历史账单是否存在重复关系;如果存在重复关系,则合并存在重复关系的账单。可选的,所述查重模块还用于:如果所述当前账单与所述历史账单的交易时间的差值在预设差值范围内,且所述当前账单的账单数据与所述历史账单的账单数据匹配,则确定所述当前账单与所述历史账单存在重复关系;如果所述当前账单与所述历史账单的交易时间的差值不在所述预设差值范围内,或者,所述当前账单的账单数据与所述历史账单的账单数据不匹配,则确定所述当前账单与所述历史账单不存在重复关系。可选的,所述装置还包括:输出模块,用于输出所述当前账单以提示用户,并在接收到用户的确认操作后,存储所述当前账单。可选的,所述输出模块还用于:监听数据的获取事件,并在每次发生数据的获取事件后,输出所述账单以提示用户;或者,按预设时间,输出所述账单以提示用户;或者,在开启账单应用的预设页面后,输出所述账单以提示用户。可选的,所述输出模块还用于:根据所述账单数据,确定所述当前账单的类型,并分类存储所述当前账单。可选的,所述装置为客户端,还包括:发送模块,用于发送所述当前账单至服务端进行数据同步,其中,以所述客户端和所述服务端中最后一个操作所述当前账单的那端的操作结果为准,同步所述客户端和所述服务端的所述当前账单中的数据。第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面任一所述的方法。第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面任一所述的方法。本申请实施例中提供的技术方案,至少具有如下技术效果或优点:本申请实施例提供的账单提取方法、装置、电子设备及介质,以历史数据和按照预设的账单模板提取出的历史账单数据作为训练样本训练机器学习分类模型,并采用训练后的机器学习分类模型提取所述当前数据中的账单数据,来生成当前账单,以便于后续用户查询资金变动记录和根据账单来获得集中的消费数据。进一步,采用机器学习分类模型能提高账单提取的效率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选本文档来自技高网...

【技术保护点】
1.一种账单提取方法,其特征在于,包括:以历史数据和从所述历史数据中提取出的历史账单数据作为训练样本,训练机器学习分类模型,其中,所述历史账单数据是按照预设的账单模板从所述历史数据中提取的数据;获取携带有账单数据的当前数据;采用所述机器学习分类模型提取所述当前数据中的账单数据,并根据所述账单数据,生成符合所述账单模板的当前账单。

【技术特征摘要】
1.一种账单提取方法,其特征在于,包括:以历史数据和从所述历史数据中提取出的历史账单数据作为训练样本,训练机器学习分类模型,其中,所述历史账单数据是按照预设的账单模板从所述历史数据中提取的数据;获取携带有账单数据的当前数据;采用所述机器学习分类模型提取所述当前数据中的账单数据,并根据所述账单数据,生成符合所述账单模板的当前账单。2.如权利要求1所述的方法,其特征在于,所述当前数据为:目标单据的成像图像或短信数据。3.如权利要求2所述的方法,其特征在于,当所述当前数据为所述成像数据时,所述获取携带有账单数据的当前数据包括:以所述目标单据为拍摄对象,拍摄获取所述目标单据的成像图像;或者,接收目标单据的成像图像;或者,扫描所述目标单据,获取所述目标单据的成像图像;或者,对所述目标单据的信息进行截屏,获取所述目标单据的成像图像;在所述获取携带有账单数据的当前数据之后,还包括:通过光学字符识别技术识别所述成像图像中的字符数据。4.如权利要求2所述的方法,其特征在于,所述短信数据包括以下任一种或多种的组合:短信的接收时间、短信的发送方和短信的内容数据。5.如权利要求1所述的方法,其特征在于,所述账单数据包括以下任一种或多种的组合:金额、交易类别、交易己方账户、交易时间、交易对方信息和交易情景。6.如权利要求1所述的方法,其特征在于,在所述生成符合所述账单模板的当前账单之后还包括:比对所述当前...

【专利技术属性】
技术研发人员:纪纲余雪亭张云鹏邓淼
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1