一种文本识别方法、存储介质及终端技术

技术编号：23891827 阅读：36 留言：0更新日期：2020-04-22 06:47

本发明专利技术公开了一种文本识别方法、存储介质及终端，涉及计算机技术领域，所述方法包括以下内容：对输入的文本对象进行预处理并转换为待识别文本的格式；对预处理后的文本进行知识提取得到知识数据；将提取得到的知识数据与基础数据库进行匹配识别。并通过对文本中多方面要素进行识别，分析出语义及要素之间的关系，进而得到文本的语义或者含义关系导图，实现对文本的表面语义和隐藏含义的识别；本发明专利技术识别速度快，耗时短，利于文本识别的实时性。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本识别方法、存储介质及终端
本专利技术涉及计算机
，尤其涉及一种文本识别方法、存储介质及终端。
技术介绍
随着人工智能技术的日新月异，通过计算机进行文本识别成为人工智能领域重点研究方向之一；现有的文本识别方法包括有光学字符识别技术以及场景文本识别技术等等。文本识别通过语义分析和意图分析能够识别出文本中的含义以及关系；以上分析的过程中，常常需要对文本进行多方面要素的识别，以能够在分析出语义的基础上得到要素之间的关系；而现有技术往往是很难达到这样的目的的。
技术实现思路
本专利技术的目的在于克服现有技术的不足，提供一种文本识别方法，能够对文本进行要素化，并通过对文本中多方面要素进行识别，分析出语义及要素之间的关系，实现对文本的表面语义和隐藏含义的识别。本专利技术的目的是通过以下技术方案来实现的：一种文本识别方法，所述方法包括以下内容：对输入的文本对象进行预处理并转换为待识别文本的格式；对预处理后的文本进行知识提取得到知识数据；将提取得到的知识数据与基础数据库

【技术保护点】
1.一种文本识别方法，其特征在于：所述方法包括以下内容：/n对输入的文本对象进行预处理并转换为待识别文本的格式；/n对预处理后的文本进行知识提取得到知识数据；/n将提取得到的知识数据与基础数据库进行匹配识别。/n

【技术特征摘要】
1.一种文本识别方法，其特征在于：所述方法包括以下内容：
对输入的文本对象进行预处理并转换为待识别文本的格式；
对预处理后的文本进行知识提取得到知识数据；
将提取得到的知识数据与基础数据库进行匹配识别。

2.根据权利要求1所述的一种文本识别方法，其特征在于：所述对预处理后的文本进行知识提取得到知识数据包括的内容如下：
根据标点符号对输入文本进行分句，得到句子化文本；
对每句句子进行要素化，通过句子要素化对每句句子进行规整，提取出每句话中的各个类别和关键信息。

3.根据权利要求2所述的一种文本识别方法，其特征在于：将提取得到的知识数据与基础数据库进行匹配识别包括的内容如下：
将提取的所述知识数据往往附带有基础数据的外键，将其与基础数据库中的数据进行匹配识别出知识数据附带的基础数据外键的含义；
根据每句话中知识数据之间的要素化信息匹配句子中要素化之间的关系，得到相应的关系规则线，每条关系规则线对应一条语义或者隐藏含义；
将所...

【专利技术属性】
技术研发人员：郭振东，
申请(专利权)人：深圳市东恒达智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人