基于人工智能现实场景下的中文意义词组的识别方法和系统技术方案

技术编号:26506250 阅读:63 留言:0更新日期:2020-11-27 15:34
本发明专利技术提供了一种基于人工智能现实场景下的中文意义词组的识别方法和系统,识别方法包括:S1:获取采集的真实场景下的实时交互图像;S2:将实时交互图像与预先设定的信息载体和交互载体进行匹配,输出信息载体和交互载体;S3:根据信息载体和交互载体,识别交互载体在信息载体中的位置信息和触发动作信息,后识别交互载体进行触发动作的所在信息载体上的中心焦点及其两边的中文文字信息;S4:根据中文文字信息,利用字典对中文文字信息组成的中文文字序列进行检索,获取文字组合;后利用词典对文字组合进行检索,获取文字组合的中文意义后输出。本发明专利技术提高了文字识别以及中文意义词组识别的速度,且实现自动识别中文意义词组的功能。

【技术实现步骤摘要】
基于人工智能现实场景下的中文意义词组的识别方法和系统
本专利技术涉及人工智能
,具体涉及一种基于人工智能现实场景下的中文意义词组的识别方法和系统。
技术介绍
人工智能(ArtificialIntelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。中文词组学习是中文学习中的重要环节,现有的工具(包括纸质字典、电子辞典、手机查词app)都需要人为手动输入汉字进行词组学习,效率较低。深度学习和大数据的发展大大提升了人工智能方法在图像识别、手势识别和文字识别的性能。通过人工智能的方法将手势识别和文字识别等技术应用到文本识别和中文语言学习,能够很大程度提高人们的学习和阅读效率。现有技术中实现手指触发动作文字识别是通过采集装置获得图像,再对图像进行分割获得特征点再做比对,整个识别的效率非常低,费时长。
技术实现思路
本申请提供一种本专利技术的目的在于提供一种基于人工智能现实场景下的中文意义词组的识别方法和系统,以解决现有技术中手指交互文字识别速度慢、无法达到自动识别中文意义词组的技术问题。根据第一方面,一种实施例中提供一种基于人工智能现实场景下的中文意义词组的识别方法,所述识别方法包括:S1:获取采集的真实场景下包括信息载体和交互载体在内的实时交互图像;S2:将所述实时交互图像与预先设定的信息载体和交互载体,通过以FPN结构网络的卷积神经网络为核心的图像深度学习AI模型进行匹配识别,输出所述信息载体和所述交互载体;S3:根据所述信息载体和所述交互载体,利用手指定位人工智能算法,识别出所述交互载体在所述信息载体中的位置信息和触发动作信息,后通过数学逻辑综合各部分信息计算识别出所述交互载体进行触发动作的所在所述信息载体上的中心焦点,以及利用以卷积神经网络为核心的图像目标识别深度学习AI模型识别获取中心焦点两边的中文图像信息,并使用深度学习文本识别OCR技术获取中文文字信息;S4:根据识别出的中心焦点及其两边的中文文字信息,利用字典对中文文字信息组成的中文文字序列进行匹配检索,获取文字组合;后利用词典对文字组合进行匹配检索,获取文字组合的中文意义后输出。在一种实施例中,所述步骤S3进一步包括:S31:接收所述实时交互图像中的所述信息载体和所述交互载体,通过使用以Densenet结构网络的卷积神经网络为核心的图像深度学习AI模型,或者使用基于Resnet或vgg或darknet结构的图像识别主干网络,以基于高斯分布密度衰减函数的位置信息损失函数为迭代指标,识别所述交互载体在所述信息载体中的的位置信息和触发动作信息;S32:对所述交互载体的触发动作区域进行图像切割,获取以所述触发动作区域为中心焦点区域的单一干净文字图像;其中,所述单一干净文字图像为所述交互图像中仅包含中文文字本身以及其所必要覆盖的背景区域,不包括任何远离中文文字的背景或其他图像信息;S33:对所述单一干净文字图像的中心焦点区域进行标记处理分析,得出中心焦点文字在水平方向的角度信息,并根据角度信息对所述单一干净文字图像进行旋转调整,以获取水平的所述单一干净文字图像;S34:在经过对所述单一干净文字图像的中心焦点区域标记处理及旋转后,同时向所述中心焦点区域的左边和右边获取一组潜在文字区域图像;S35:对所述潜在文字区域图像进行区域切割分析,获得普通焦点区域的新单一干净文字图像;S36:对新单一干净文字图像信息进行判别分析,判断出所述新单一干净文字图像包含有中文图像信息或者非中文图像信息,若包含中文图像信息则识别该中文图像信息,并进入步骤S37,否则对非中文图像信息进行标记;S37:对包含有中文文字信息的普通焦点区域,在其远离中心焦点区域的方向,向左或向右获取一组新的潜在文字区域图像,并重复35-36步骤,直到某一步的普通焦点区域没有中文文字信息或者达到最大迭代步数后停止,返回识别出文字信息。在一种实施例中,重复34-37步骤,获取中心焦点区域左右两边多个文字信息,其中,文字数量取决于左右两边最大迭代次数。在一种实施例中,所述步骤S32中:利用中文文字切割人工智能算法,获取所述交互载体所指向的中文图像信息,得到所述交互载体的触发动作区域的中心焦点区域的单一干净文字图像。在一种实施例中,所述步骤S36中:对包含有中文图像信息的普通焦点区域的单一干净文字图像,利用文字图像识别人工智能算法,获得单一干净文字图像中的中文图像信息。在一种实施例中,所述步骤S1之前还包括:采集并预存真实场景下的信息载体,以便进行匹配。在一种实施例中,所述步骤S1之前还包括:采集并预存真实场景下的交互载体,以便进行匹配。根据第二方面,一种实施例中提供一种基于人工智能现实场景下的中文意义词组的识别系统,采用上述实施例所述的基于人工智能现实场景下的中文意义词组的识别方法,其包括:获取模块、匹配模块、识别模块以及检索模块;所述获取模块用于获取采集的真实场景下包括信息载体和交互载体的实时交互图像;所述匹配模块用于将所述实时交互图像与预先设定的信息载体和交互载体,通过以FPN结构网络的卷积神经网络为核心的图像深度学习AI模型进行匹配识别,输出所述信息载体和所述交互载体;所述识别模块用于根据所述实时交互图像中的所述信息载体和所述交互载体,利用手指定位人工智能算法,识别出所述交互载体在所述信息载体中的位置信息和触发动作信息,后通过数学逻辑综合信息计算识别出所述交互载体进行触发动作的所在所述信息载体上的中心焦点,以及利用以卷积神经网络为核心的图像目标识别深度学习AI模型识别获取中心焦点两边的中文图像信息,并使用深度学习文本识别OCR技术获取中文文字信息;所述检索模块用于根据识别出的中心焦点及其两边的中文文字信息,利用字典对中文文字信息组成的中文文字序列进行匹配检索,获取文字组合;后利用词典对文字组合进行匹配检索,获取文字组合的中文意义后输出。根据第三方面,一种实施例中提供一种终端设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述实施例所述的基于人工智能现实场景下的中文意义词组的识别方法。根据第四方面,一种实施例中提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述实施例所述的基于人工智能现实场景下的中文意义词组的识别方法依据上述实施例的一种基于人工智能现实场景下的中文意义词组的识别方法和系统,本专利技术至少包括以下一种有益效果:(1)由于采集到的是真实场景下包括信息载体和交互载体在内的实时交互图像,本实施例利用手指定位人工智能算法,识别出本文档来自技高网...

【技术保护点】
1.一种基于人工智能现实场景下的中文意义词组的识别方法,其特征在于,所述识别方法包括:/nS1:获取采集的真实场景下包括信息载体和交互载体在内的实时交互图像;/nS2:将所述实时交互图像与预先设定的信息载体和交互载体,通过以FPN结构网络的卷积神经网络为核心的图像深度学习AI模型进行匹配识别,输出所述信息载体和所述交互载体;/nS3:根据所述信息载体和所述交互载体,利用手指定位人工智能算法,识别出所述交互载体在所述信息载体中的位置信息和触发动作信息,后通过数学逻辑综合信息计算识别出所述交互载体进行触发动作的所在所述信息载体上的中心焦点,以及利用以卷积神经网络为核心的图像目标识别深度学习AI模型识别获取中心焦点两边的中文图像信息,并使用深度学习文本识别OCR技术获取中文文字信息;/nS4:根据识别出的中心焦点及其两边的中文文字信息,利用字典对中文文字信息组成的中文文字序列进行匹配检索,获取文字组合;后利用词典对文字组合进行匹配检索,获取文字组合的中文意义后输出。/n

【技术特征摘要】
1.一种基于人工智能现实场景下的中文意义词组的识别方法,其特征在于,所述识别方法包括:
S1:获取采集的真实场景下包括信息载体和交互载体在内的实时交互图像;
S2:将所述实时交互图像与预先设定的信息载体和交互载体,通过以FPN结构网络的卷积神经网络为核心的图像深度学习AI模型进行匹配识别,输出所述信息载体和所述交互载体;
S3:根据所述信息载体和所述交互载体,利用手指定位人工智能算法,识别出所述交互载体在所述信息载体中的位置信息和触发动作信息,后通过数学逻辑综合信息计算识别出所述交互载体进行触发动作的所在所述信息载体上的中心焦点,以及利用以卷积神经网络为核心的图像目标识别深度学习AI模型识别获取中心焦点两边的中文图像信息,并使用深度学习文本识别OCR技术获取中文文字信息;
S4:根据识别出的中心焦点及其两边的中文文字信息,利用字典对中文文字信息组成的中文文字序列进行匹配检索,获取文字组合;后利用词典对文字组合进行匹配检索,获取文字组合的中文意义后输出。


2.如权利要求1所述的基于人工智能现实场景下的中文意义词组的识别方法,其特征在于,所述步骤S3进一步包括:
S31:接收所述实时交互图像中的所述信息载体和所述交互载体,通过使用以Densenet结构网络的卷积神经网络为核心的图像深度学习AI模型,或者使用基于Resnet或vgg或darknet结构的图像识别主干网络,以基于高斯分布密度衰减函数的位置信息损失函数为迭代指标,识别所述交互载体在所述信息载体中的位置信息和触发动作信息;
S32:对所述交互载体的触发动作区域进行图像切割,获取以所述触发动作区域为中心焦点区域的单一干净文字图像;
其中,所述单一干净文字图像为所述交互图像中仅包含中文文字本身以及其所必要覆盖的背景区域,不包括任何远离中文文字的背景或其他图像信息;
S33:对所述单一干净文字图像的中心焦点区域进行标记处理分析,得出中心焦点文字在水平方向的角度信息,并根据角度信息对所述单一干净文字图像进行旋转调整,以获取水平的所述单一干净文字图像;
S34:在经过对所述单一干净文字图像的中心焦点区域标记处理及旋转后,同时向所述中心焦点区域的左边和右边获取一组潜在文字区域图像;
S35:对所述潜在文字区域图像进行区域切割分析,获得普通焦点区域的新单一干净文字图像;
S36:对新单一干净文字图像信息进行判别分析,文字图像识别人工智能算法,判断出所述新单一干净文字图像包含有中文图像信息或者非中文图像信息,若包含中文图像信息则识别该中文图像信息,并进入步骤S27,否则对非中文图像信息进行标记;
S37:对包含有中文文字信息的普通焦点区域,在其远离中心焦点区域的方向,向左或向右获取一组新的潜在文字区域图像,并重复25-26步骤,直到某一步的普通焦点区域没有中文文字信息或者达到最大迭代步数后停止,返回识别出文字信息。


3.如权利要求2...

【专利技术属性】
技术研发人员:高旻昱迟崇明李润发
申请(专利权)人:上海翎腾智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1