【技术实现步骤摘要】
文本处理方法、装置、电子设备及存储介质
[0001]本公开涉及图像识别
,尤其涉及一种文本处理方法、装置、电子设备及存储介质。
技术介绍
[0002]机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
[0003]人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
[0004]智能自动化(Intelligent Automation,IA)是一系列从机器人流程自动化到人工智能的技术总称,将RPA与光学字符识别(Optical Character Recognition,OCR)、智能字符识别(Intelligent Character Recognition,ICR)、流程挖掘(Process Mining)、深度学习(Deep Learning,DL)、机器学习(Machine Learning,ML)、自然语言处理(Natural Language Processing,NLP)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、计算机视觉(Computer Vision,CV)等多种AI技术相结合,以创建能够思考、学习及自适应的端到端的业务流程,涵盖从流程发现、流程自动化,到通过自动而持续的数据收集、理解数据 ...
【技术保护点】
【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取初始文本,其中,所述初始文本是对图像识别得到;确定与所述初始文本对应的文本分类特征,其中,所述文本分类特征描述文本处理信息;根据所述文本处理信息处理所述初始文本,得到目标文本。2.如权利要求1所述的方法,其特征在于,所述确定与所述初始文本对应的文本分类特征,包括:如果所述初始文本包括待处理文字,则采用人工智能AI领域的光学字符识别OCR技术确定所述待处理文字的初始形态特征,其中,所述初始形态特征被作为所述文本分类特征;和/或如果所述初始文本包括待处理字符,则采用所述OCR技术确定所述待处理字符的初始字符特征,其中,所述初始字符特征被作为所述文本分类特征;和/或采用所述OCR技术确定所述初始文本的初始语义特征,其中,所述初始语义特征被作为所述文本分类特征。3.如权利要求2所述的方法,其特征在于,所述文本处理信息由所述初始形态特征描述;其中,所述根据所述文本处理信息处理所述初始文本,得到目标文本,包括:调用机器人流程自动化RPA机器人处理所述文本处理信息,以确定纠错文字的参考形态特征;确定所述初始形态特征和所述参考形态特征之间的相似度信息;根据所述相似度信息,确定处理结果值;根据所述处理结果值处理所述初始文本,得到所述目标文本。4.如权利要求3所述的方法,其特征在于,所述处理结果值包括:信心标识,和与所述信息标识对应的信心评价值;其中,所述根据所述处理结果值处理所述初始文本,得到所述目标文本,包括:如果所述信心标识是目标标识,且所述信心评价值小于或等于设定阈值,则将所述初始文本中所述待处理文字调整为所述纠错文字,以得到所述目标文本;如果所述信心标识不是所述目标标识,或所述信心评价值大于所述设定阈值,则将所述初始文本作为所述目标文本。5.如权利要求2所述的方法,其特征在于,所述文本处理信息由所述初始字符特征描述;其中,所述根据所述文本处理信息处理所述初始文本,得到目标文本,包括:调用RPA机器人处理所述文本处理信息,以确定参考字符特征;根据所述参考字符特征对所述初始文本中所述待处理字符进行纠正处理,得到所述目标文本。6.如权利要求2所述的方法,其特征在于,所述文本处理信息由所述初始语义特征描述;其中,所述根据所述文本处理信息处理所述初始文本,得到目标文本,包括:调用RPA机器人处理所述文本处理信息,以确定纠错对应关系,其中,所述纠错对应关
系包括:多个纠错文本,以及与每个所述纠错文本对应的纠错标记结果;从所述多个纠错文本中确定与所述初始文本所匹配的纠错文本,其中,所述所匹配的纠错文本具有所对应的纠错标记结果;根据所述对应的纠错标记结果对所述初始文本的已有标记结果进行纠正处理,得到所述目标文本。7.如权利要求2所述的方法,其特征在于,所述采用人工智能AI领域的光学字符识别OCR技术确定所述待处理文字的初始形态特征,包括:采用所述OCR技术确定所述待处理文字的结构特征、和/或笔画特征、和/或编码特征、和/或偏旁...
【专利技术属性】
技术研发人员:岳毅,翁嘉颀,陈林平,
申请(专利权)人:来也科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。