基于人工智能的绘本或教材的视觉识别方法及装置制造方法及图纸

技术编号：24939238 阅读：137 留言：0更新日期：2020-07-17 21:11

本发明专利技术提供的基于人工智能的绘本或教材的视觉识别方法，其包含：步骤一：采集待识别内容物图像，对内页图像数据进行图像识别；步骤二：结合内页图像数据的清晰程度，判断得到当前待识别内容物的类型，并进入对应的算法识别模式，其中，算法识别模式包含光学字符识别模式以及图像特征识别模式；步骤三：在对应的算法识别模式下，向用户反馈多模态识别结果数据。本发明专利技术能够根据不同的待识别内容物，采用不同的识别模式进行内容识别，适应的书籍范围广泛；并且，本申请还能够通过用户的指读指令，展开指读识别过程，方便用户的阅读，进一步提升了阅读体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于人工智能的绘本或教材的视觉识别方法及装置
本专利技术涉及人工智能领域，具体地说，涉及一种基于人工智能的绘本或教材的视觉识别方法及装置。
技术介绍
图书是人类用来记录一切成就的主要工具，也是人类交融感情、取得知识、传承经验的重要媒介，对人类文明的开展贡献至钜。图书是以传播文化为目的，用文字或其它信息符号记录于一定形式的材料之上的著作物。现有技术中，在视觉识别领域，对于不同的图书，并没有进行识别方式的区分，这就带来了效率低下，识别率低，错误率高的问题。针对现有技术的现状，急需在实际的识别和阅读中，对图书进行区分，针对不同的图书内容，采用不同的视觉算法做识别，以及识别正确之后提供的服务不同的技术服务。因此，本专利技术提供了一种基于人工智能的绘本或教材的视觉识别方法及装置。
技术实现思路
为解决上述问题，本专利技术提供了一种基于人工智能的绘本或教材的视觉识别方法，所述方法包含以下步骤：步骤一：采集待识别内容物图像，对内页图像数据进行图像识别；步骤二：结合所述内页图像数据的清晰程度，判断得到当前待识别内容物的类型，并进入对应的算法识别模式，其中，所述算法识别模式包含光学字符识别模式以及图像特征识别模式；步骤三：在对应的算法识别模式下，向用户反馈多模态识别结果数据。根据本专利技术的一个实施例，所述步骤一中还包含以下步骤：若未能检测到当前图像数据包含内页图像数据，则对当前图像进行封面识别。根据本专利技术的一个实施例，所述步骤二中还包含以下步骤：确定所述...

【技术保护点】
1.一种基于人工智能的绘本或教材的视觉识别方法，其特征在于，所述方法包含以下步骤：/n步骤一：采集待识别内容物图像，对内页图像数据进行图像识别；/n步骤二：结合所述内页图像数据的清晰程度，判断得到当前待识别内容物的类型，并进入对应的算法识别模式，其中，所述算法识别模式包含光学字符识别模式以及图像特征识别模式；/n步骤三：在对应的算法识别模式下，向用户反馈多模态识别结果数据。/n

【技术特征摘要】
1.一种基于人工智能的绘本或教材的视觉识别方法，其特征在于，所述方法包含以下步骤：
步骤一：采集待识别内容物图像，对内页图像数据进行图像识别；
步骤二：结合所述内页图像数据的清晰程度，判断得到当前待识别内容物的类型，并进入对应的算法识别模式，其中，所述算法识别模式包含光学字符识别模式以及图像特征识别模式；
步骤三：在对应的算法识别模式下，向用户反馈多模态识别结果数据。

2.如权利要求1所述的方法，其特征在于，所述步骤一中还包含以下步骤：若未能检测到当前图像数据包含内页图像数据，则对当前图像进行封面识别。

3.如权利要求1所述的方法，其特征在于，所述步骤二中还包含以下步骤：确定所述内页图像数据的分辨率信息，与阈值信息进行比较，当所述分辨率信息低于所述阈值信息时，确定所述待识别内容物为绘本图书，当所述分辨率信息高于所述阈值信息时，确定所述待识别内容物为教材图书。

4.如权利要求1所述的方法，其特征在于，所述步骤二之后还包含以下步骤：接收用户输出的所述语音交互数据，对所述语音交互数据进行语义理解处理，得到用户的交互意图。

5.如权利要求4所述的方法，其特征在于，所述步骤二之后还包含以下步骤：当检测到手型轮廓时，进入指读识别模式，基于所述手形轮廓指向位置的内容信息，结合...

【专利技术属性】
技术研发人员：俞晓君，贾志强，
申请(专利权)人：北京光年无限科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人