【技术实现步骤摘要】
本专利技术涉及表格信息更新,特别涉及一种基于智能识别文本的表格信息更新方法及系统。
技术介绍
1、人们在日常工作、学习和生活中经常需要填写各种各样的表格:如信息登记表,财务报表、调查问卷、银行的存/汇款单等,成为了记录信息的一种重要方式;随着无纸化办公的普及,大量纸质文档需要录入到计算机中,依靠人工进行信息提取及核查准确性,既耗费时间,又耗费人力资源;随着数字化建设的快速发展,如何高效准确提取纸质单据中的关键信息就显得尤为重要;现有技术中一般采用ocr识别技术对表格信息进行处理,ocr可以扫描表格的图像或文档,识别出其中的字符,并将这些字符转化为可编辑的文本数据;但是ocr识别精度受限于图像的质量、表格复杂度、字体样式等。尤其对于含有多种格式的复杂表格,ocr可能难以精确识别表格的行列关系;此外,ocr对非标准化字体(如手写体)或分辨率较低的图片的识别准确率较低;中国专利公开号为cn110796031b公开了一种基于人工智能的表格识别方法、基于人工智能的表格识别装置以及电子设备,主要涉及计算机视觉、自然语言处理和机器学习等技术。该方法包
...【技术保护点】
1.一种基于智能识别文本的表格信息更新方法,其特征在于,包括以下步骤:
2.权利要求1所述的一种基于智能识别文本的表格信息更新方法,其特征在于,在S1中包括:基于图像中的线条检测,采用霍夫变换检测直线,提取表格的行与列边界;
3.权利要求2所述的一种基于智能识别文本的表格信息更新方法,其特征在于,在S2中包括:
4.根据权利要求1所述的一种基于智能识别文本的表格信息更新方法,其特征在于,在S3中包括:
5.根据权利要求4所述的一种基于智能识别文本的表格信息更新方法,其特征在于,预训练的语言模型包括:
6.根据
...【技术特征摘要】
1.一种基于智能识别文本的表格信息更新方法,其特征在于,包括以下步骤:
2.权利要求1所述的一种基于智能识别文本的表格信息更新方法,其特征在于,在s1中包括:基于图像中的线条检测,采用霍夫变换检测直线,提取表格的行与列边界;
3.权利要求2所述的一种基于智能识别文本的表格信息更新方法,其特征在于,在s2中包括:
4.根据权利要求1所述的一种基于智能识别文本的表格信息更新方法,其特征在于,在s3中包括:
5.根据权利要求4所述的一种基于智能识别文本的表格信息更新方法,其特征在于,预训练的语言模型包括:
6.根...
【专利技术属性】
技术研发人员:涂震,魏强,范玉平,高岐,陈瑞兴,
申请(专利权)人:江西微博科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。