【技术实现步骤摘要】
信函内容数据提取方法、装置、设备及存储介质
[0001]本说明书涉及图像识别
,尤其是涉及一种信函内容数据提取方法、装置、设备及存储介质。
技术介绍
[0002]目前金融服务企业存在大量分散的对客渠道,需要处理各式各样的信访信函(纸质信函)。为了建立畅通、便捷的来信办理机制,首先需要信访信件信息快速准确的提取为电子数据,以方便通过电子网络进行快速传输和信访流程处理。现有方式一般采用人工录入或电子扫描的方式对信访信函进行电子化处理,前者处理效率较低且容易出错;后者仅以图片形式传输,难以准确掌握信件内容,且不方便后续处理。
技术实现思路
[0003]本说明书实施例的目的在于提供一种信函内容数据提取方法、装置、设备及存储介质,以提高信函内容数据提取的效率和准确性。
[0004]为达到上述目的,一方面,本说明书实施例提供了一种信函内容数据提取方法,包括:
[0005]获取目标信函的信封图像和正文图像;
[0006]提取所述信封图像中的信封文字内容,并提取所述正文图像中的正文文字内容;r/>[0007]将本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种信函内容数据提取方法,其特征在于,包括:获取目标信函的信封图像和正文图像;提取所述信封图像中的信封文字内容,并提取所述正文图像中的正文文字内容;将所述信封文字内容发送至信封内容核验端审核,并将所述正文文字内容发送至正文内容核验端审核;在所述信封文字内容和所述正文文字内容通过审核时,将所述信封文字内容和所述正文文字内容合并为所述目标信函的文字内容提取记录。2.如权利要求1所述的信函内容数据提取方法,其特征在于,所述提取所述信封图像中的信封文字内容,包括:提取所述信封图像中的信封七要素;所述信封七要素包括:寄件人姓名或名称、收件人姓名或名称、寄件人地址、收件人地址、寄件人邮编、收件人邮编和邮戳时标。3.如权利要求1所述的信函内容数据提取方法,其特征在于,所述提取所述正文图像中的正文文字内容,包括:按照预设的切分策略将所述正文图像切分为多个正文图像切片,并按照正文内容顺序标识每个所述正文图像切片的位置标记;对所述多个正文图像切片并行进行文字内容提取,获得各个所述正文图像切片的正文文字内容片段。4.如权利要求3所述的信函内容数据提取方法,其特征在于,所述切分策略包括按行切分。5.如权利要求2所述的信函内容数据提取方法,其特征在于,所述将所述信封文字内容发送至信封内容核验端审核,包括;将所述信封七要素发送至信封内容核验端进行人工审核。6.如权利要求3或4所述的信函内容数据提取方法,其特征在于,所述将所述正文文字内容发送至正文内容核验端审核,包括;将所述各个所述正文图像切片的正文文字内容片段分发至正文内容核验端进行人工审核。7.如权利要求1所述的信函内容数据提取方法,其特征在于,在将所述信封文字内容发送至信封内容核验端审核,并将所述正文文字内容发送至正文内容核验端审核之后,还包括:在所述信封文字内容未通过审核时,由所述信封内容核验端对所述信封文字内容进行人工修正;和/或,在所述正文文字内容未通过审核时,由所述正文内容核验端对所述信封文字内容进行人工修正。8.如权利要求3或4所述的信函内容数据提取方法,其特征在于,将所述信封文字内容和所述正文文字内容合并为所述目标信函的文字内容提取记录,包括:按照位置标记将各个所述正文图像切片的正文文字内容片段拼接合并为正文文字内容;按照信函标识将所述信封文字内容和所述正文文字内容拼接合并为所述目标信...
【专利技术属性】
技术研发人员:唐业祎,王超,汪维,何洋,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。