文本识别方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号：28872998 阅读：43 留言：0更新日期：2021-06-15 23:06

本申请公开了一种文本识别方法、装置、电子设备和可读存储介质，其中文本识别方法包括将识别到的字符进行N种组合，获得字符组成的M个语句；确定M个语句中每个语句的语句流畅值；将M个语句进行分词，获得M个语句中每个语句包含的分词的分词分值；基于语句流畅值和分词分值显示M个语句中的目标语句；其中，M≤N，在对文本进行识别之后，通过对识别得到的字符进行组合，获得多个语句，确定每个语句的语句流畅值以及分词分值，根据每个语句的语句流畅值和分词分值从多个语句中筛选得到目标语句，使得筛选得到的目标语句更加符合语义，降低出现输出的语句与其实际书写的语句存在偏差的概率，提高文本识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、电子设备和可读存储介质
本申请涉及文本识别
，具体而言，涉及一种文本识别方法、一种文本识别装置、一种电子设备和一种可读存储介质。
技术介绍
相关技术中，根据书写场景的不同，文本的书写模式也不同，有的文字横向书写，有的文字纵向书写，有的文字按照从左到右的顺序书写，还有的文字按照从右到左的顺序书写。目前采用OCR(OpticalCharacterRecognition，光学字符识别)原理对书写的文字进行识别，只是按照固定的识别顺序进行识别并输出，导致输出的语句不符合语义，文字识别结果不正确，影响文字识别的准确性。申请内容本申请实施例提供了一种文本识别方法、文本识别装置、电子设备和可读存储介质，能够解决相关技术中只是按照固定的识别顺序进行识别并输出，导致输出的语句不符合语义，文字识别结果不正确，影响文字识别的准确性。为了解决上述技术问题，本申请是这样实现的：第一方面，本申请实施例提供了一种文本识别方法，包括：将识别到的字符进行N种组合，获得字符组成的M个语句；确定M个语句中每个语句的语句流畅值；将M个语句进行分词，获得M个语句中每个语句包含的分词的分词分值；基于语句流畅值和分词分值显示M个语句中的目标语句；其中，M≤N。第二方面，本申请实施例提供了一种文本识别装置，包括：组合单元，用于将识别到的字符进行N种组合，获得字符组成的M个语句；确定单元，用于确定M个语句中每个语句的语句流畅值；分词单元，用于将M个语句进行分词，获得M个语句中每个语句包含的分词...

【技术保护点】
1.一种文本识别方法，其特征在于，包括：/n将识别到的字符进行N种组合，获得所述字符组成的M个语句；/n确定所述M个语句中每个语句的语句流畅值；/n将所述M个语句进行分词，获得所述M个语句中每个语句包含的分词的分词分值；/n基于所述语句流畅值和分词分值显示所述M个语句中的目标语句；/n其中，M≤N。/n

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：
将识别到的字符进行N种组合，获得所述字符组成的M个语句；
确定所述M个语句中每个语句的语句流畅值；
将所述M个语句进行分词，获得所述M个语句中每个语句包含的分词的分词分值；
基于所述语句流畅值和分词分值显示所述M个语句中的目标语句；
其中，M≤N。

2.根据权利要求1所述的文本识别方法，其特征在于，所述将识别到的字符进行N种组合，获得所述字符组成的M个语句，包括：
将识别到的字符按照由左至右的顺序进行组合，以及按照由右至左的顺序进行组合，获得M1个语句；以及
将识别到的每一列字符按照由上至下的顺序进行组合，以及按照由下至上的顺序进行组合，获得M2个语句，其中，M1与M2的总和为M。

3.根据权利要求1所述的文本识别方法，其特征在于，所述确定所述M个语句中每个语句的语句流畅值，包括：
确定所述M个语句中每个语句中的每个字符在所述M个语句组成的语句集合中出现的概率值；
根据所述概率值以及所述M个语句中每个语句对应的字符数量，确定所述M个语句中每个语句的语句流畅值。

4.根据权利要求3所述的文本识别方法，其特征在于，所述根据所述概率值以及所述M个语句中每个语句对应的字符数量，确定所述M个语句中每个语句的语句流畅值之后，还包括：
获取所述M个语句中每个语句的权重值；
根据所述权重值对所述M个语句中每个语句中的语句流畅值进行修正。

5.根据权利要求1至3中任一项所述的文本识别方法，其特征在于，将所述M个语句进行分词，获得所述M个语句中每个语句包含的分词的分词分值，具体包括：
根据所述M个语句中每个语句包含的分词与目标词库中的字符匹配的数量确定M个语句中每个语句包含的分词的分词分值。

6.一种文本识别装置，其特征在于，包括：
组合单元，用于将识别到的字符进行N种组合，获得所述字符组...

【专利技术属性】
技术研发人员：佟禹，
申请(专利权)人：维沃移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人