一种字符识别方法、装置及存储介质制造方法及图纸

技术编号:26792604 阅读:22 留言:0更新日期:2020-12-22 17:08
本发明专利技术公开了一种字符识别方法,所述方法包括:获取目标字符,并组建至少一个目标字符库;基于每一个目标字符库和预设数据处理结构,构造每一个目标字符库的目标数据结构;获取待处理字符;根据微服务与所述目标数据结构的调用关系,对所述待处理字符进行识别,并获取识别结果,旨在保证工业物联网领域中大数据的采集做到规范合法、节省内存空间且高效的QPS,本发明专利技术采用Be‑Tree的算法搭建起来微服务,可以有效防范对网站的XSS攻击和非法字符的录入,同时避免了现有的工业场景下微服务架构中每个微服务都要加载海量词库,从而节省大量的内存空和提升服务的可用性。

【技术实现步骤摘要】
一种字符识别方法、装置及存储介质
本专利技术涉及工业互联网的字符处理
,尤其涉及一种加字符识别方法、装置及存储介质。
技术介绍
工业互联网是全球工业系统与高级计算、分析、感应技术以及互联网连接融合的一种结果。可以是通过开放的、全球化的工业级网络平台把设备、生产线、工厂、供应商、产品和客户紧密地连接和融合起来,高效共享工业经济中的各种要素资源,帮助制造业延长产业链。而在各种要素资源中有可能存在非法字符,所谓的非法字符可以是测试数据中需要进行识别的字符,以避免测试数据出现问题,或者及时识别测试过程中出现的问题。目前,常用的字符识别算法是将字符打包成传统的打包形式,例如jar包的形式,因为这么做会导致每个需要进行非法字符过滤的服务,都要加载非法字符的词库,比如有10个服务集成了该jar包,如果非法词库的容量是1G,这样就有9G内存的浪费,可见现有技术中的非法字符过滤方式会导致内存被占用,而且降低过滤效率。
技术实现思路
本专利技术的目的在于提供一种字符识别方法、装置及存储介质,旨在保证工业物联网领域中大数据的采集做到本文档来自技高网...

【技术保护点】
1.一种字符识别方法,其特征在于,所述方法包括:/n获取目标字符,并组建至少一个目标字符库;/n基于每一个目标字符库和预设数据处理结构,构造每一个目标字符库的目标数据结构;/n获取待处理字符;/n根据微服务与所述目标数据结构的调用关系,对所述待处理字符进行识别,并获取识别结果。/n

【技术特征摘要】
1.一种字符识别方法,其特征在于,所述方法包括:
获取目标字符,并组建至少一个目标字符库;
基于每一个目标字符库和预设数据处理结构,构造每一个目标字符库的目标数据结构;
获取待处理字符;
根据微服务与所述目标数据结构的调用关系,对所述待处理字符进行识别,并获取识别结果。


2.根据权利要求1所述的一种字符识别方法,其特征在于,所述获取目标字符,并组建至少一个目标字符库的步骤包括:
获取非法字符,其中,所述非法字符为预先设定的字符;
将所述非法字符确定为目标字符;
将所述目标字符组成目标字符库;
将所述目标词库对应的数据加载到数据处理的内存中。


3.根据权利要求2所述的一种字符识别方法,其特征在于,所述基于每一个目标字符库和预设数据处理结构,构造每一个目标字符库的目标数据结构的步骤,包括:
确定预设数据处理结构为Be_Tree数据结构;
根据所述Be_Tree数据结构,将每一个目标字符库构造成树形数据结构。


4.根据权利要求3所述的一种字符识别方法,其特征在于,所述根据微服务与所述目标数据结构的调用关系,对所述待处理字符进行识别,并获取识别结果的步骤,包括:
基于所述数据处理的内存调取所述树形数据结构;
对所述待处理字符进行过滤,获取字符过滤结果;
判断所述字符过滤结果中是否包含与所述待处理字符相同的字符;
如果是,则确认所述待处理字符包含非法字符。


5.根据权利要求4所述的一种字符识别方法,其特征在于,所述对所述待处理字符进行过滤,获取字符过滤结果的步骤,包括:
当所述待处理字符为多个字符时,获取所述待处理字...

【专利技术属性】
技术研发人员:刘滨旷黎明林大
申请(专利权)人:上海微亿智造科技有限公司常州微亿智造科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1