信息的识别方法、装置及终端制造方法及图纸

技术编号:7809157 阅读:148 留言:0更新日期:2012-09-27 07:55
本发明专利技术涉及一种信息的识别方法、装置及终端。该方法包括:采集视频数据,在视频数据中提取图像帧;将图像帧划分多个分区,用分区标识信息标识分区,提取并保存图像帧的每一个分区的特征值;根据分区标识信息,计算分区标识信息对应的分区的多个特征值的变化信息;根据分区标识信息,在数据库中查询分区标识信息对应的分区的多个特征值和多个特征值的变化信息对应的检索文本和/或符号信息;将检索文本和/或符号信息输出。本发明专利技术提供了一种新的信息识别方法,实现了终端将用户面部的动作识别为文本或符号信息,并将文本或符号信息输入到指定的输入位置。

【技术实现步骤摘要】

本专利技术涉及信息
,尤其涉及一种信息的识别方法、装置及終端。
技术介绍
目前,随着语音输入技术的发展,很多手机終端都可以通过语音实现文字输入。语音输入是ー种简便、易用的输入方法,终端将操作者的语音识别为汉字,实现了输入。然而,用户必须在比较安静的环境下进行语音输入,而且声音必须清晰,否则无法被终端正确识别,可能导致输入一些错误的文字,降低了语音输入的准确率。另外,如果用户无法发出声音,也无法使用语音输入来实现输入,降低了语音输入操作的易用性。
技术实现思路
本专利技术实施例提供了一种信息的识别方法、装置及終端,可以实现終端将用户面部的动作识别为文本或符号信息,提供了一种新文本或符号信息的输入方法。一方面,本专利技术实施例提供了一种信息的识别方法,所述方法包括終端采集视频数据,在所述视频数据中提取图像帧;将所述图像帧划分多个分区,所述分区用分区标识信息标识,提取并保存所述图像帧的每ー个分区的特征值;根据所述分区标识信息,计算所述分区标识信息对应的分区的多个特征值的变化信息;根据所述分区标识信息,查询所述分区标识信息对应的分区的多个特征值和所述多个特征值的变化信息对应的检索文本和/或符号信息;显示所述检索文本和/或符号信息。另ー方面,本专利技术实施例提供了一种信息的识别装置,所述装置包括采集单元,用于采集视频数据,在所述视频数据中提取图像帧;提取单元,用于将所述图像帧划分多个分区,所述分区用分区标识信息标识,提取并保存所述图像帧的每ー个分区的特征值;计算单元,用于根据所述分区标识信息,计算所述分区标识信息对应的分区的多个特征值的变化信息;查询单元,用于根据所述分区标识信息,查询所述分区标识信息对应的分区的多个特征值和所述多个特征值的变化信息对应的检索文本和/或符号信息;显示单元,用于显示所述检索文本和/或符号信息。又一方面,本专利技术实施例还提供了ー种终端,包括上述的信息识别装置。本专利技术实施例中,終端需要输入文字或符号信息时,可以采集视频数据,在所述视频数据中提取图像帧;将图像帧划分为多个分区,并提取每个分区的特征值;然后计算每个分区的特征值的变化信息,根据每个分区的特征值和特征值的变化信息,查询对应的检索文本和/或符号信息,显示检索文本和/或符号信息。由此实现了将用户的面部动作识别为用户想要输入的文本或符号信息,提高了終端设备输入信息的便捷性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的ー些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本专利技术实施例提供的一种信息的识别方法流程图;图2为本专利技术实施例提供的一种信息的识别装置示意图。具体实施例方式以下描述中,为了说明而不是为了限定,提出了诸如图像分区及图像分区的特征 值的具体细节,以便透切理解本专利技术。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。本专利技术实施例提供的信息的识别方法、装置及終端在实际应用时,作为ー种新的信息的识别方法可应用于用户需要在終端上输入文本或符号信息的场景。用户在终端中输入信息的方法有多种,语音输入、键盘输入、手写板输入等。本专利技术实施例提供了一种新的信息的识别方法,即面部动作图像输入方法。此输入方法可以与语音输入方法结合使用,也可以单独使用,終端通过对用户面部动作图像进行分析,可以将用户的面部动作识别为用户想要输入的文本或符号信息。本专利技术实施例针对现有技术的缺陷,提供了一种信息的识别方法、装置及終端。终端需要输入文字或符号信息时,可以采集视频数据,在所述视频数据中提取图像帧;将图像帧划分为多个分区,并提取每个分区的特征值;然后计算每个分区的特征值的变化信息,根据每个分区的特征值和特征值的变化信息,在本地数据库或网络服务器中查询对应的检索文本和/或符号信息,显示检索文本和/或符号信息。由此实现了将用户的面部动作识别为用户想要输入的输入文本或符号信息,提高了終端设备输入信息的便捷性。图I为本专利技术实施例提供的一种信息的输入方法流程图。该实施例的执行主体是終端,其中详细描述了终端将用户的面部动作识别为文本或符号信息,并将文本或符号信息输入终端的方法。如图I所示,本实施例包括以下步骤步骤101,終端采集视频数据,在所述视频数据中提取图像帧。在终端设备中输入文本或符号信息之前,首先根据接收到的用户的操作指令,将终端置为信息输入状态,如在想要输入短信内容、备忘录内容、通讯录内容时,会首先执行新建信息的操作指令,終端接收到该操作指令后,打开文字或符号输入功能;然后通过键盘上的按键或按钮开启通过面部动作输入文本或符号信息的功能。开启通过面部动作输入文本或符号信息的功能后,終端通过摄像头拍摄用户面部动作,在用户说话的过程中,用户的上下嘴唇、眼神、牙齿和舌头都会有相应的动作,終端捕捉用户的面部动作后,将动作作为视频数据存储在内部存储部件中。在采集的视频数据中提取多个图像帧,用以终端通过后面的技术方案对连续的图像帧进行分析,以获得用户所说的文字或符号。步骤102,终端将所述图像帧划分多个分区,所述分区用分区标识信息标识,提取并保存所述图像帧的每ー个分区的特征值。每ー个图像帧中都包括人脸区域,終端首先识别图像帧中的人脸区域,然后将人脸区域划分为多个分区,如可以划分为眼睛分区、鼻子分区、嘴唇分区、牙齿分区、舌头分区。然后提取各个分区的特征值,如嘴唇分区的特征值可以为上下嘴唇之间的距离、嘴角上扬的幅度等,牙齿分区的特征值可以为露出的牙齿的数量,舌头分区的特征值可以为露出的舌头的面积或部位等等。对人脸区域进行分区划分后,为了便于提取并保存每个分区的特征值,可以给每个分区设置ー个标识信息,该标识信息可以为各个分区的名称,如“眼睛”分区,也可以用数字来作为每个分区的标识信息,如“ I号”分区为眼睛分区的标识信息。 终端提取出每ー个图像帧中的每个分区的特征值后,将各个分区的特征值按照分区标识信息存储在存储部件中,即ー个分区在多个图像帧中的特征值存储在ー个分区标识信息下,在存储特征值时还要存储该特征值对应的图像帧在视频中的时间帧信息。步骤103,終端根据所述分区标识信息,计算所述分区标识信息对应的分区的多个特征值的变化信息。終端在提取并保存各个分区的多个特征值后,计算相同的分区在不同的图像帧中的特征值的变化信息。終端可以将同一个分区在连续的图像帧中的多个特征值,如其中每两个特征值的差值作为变化信息;也可以计算连续的图像帧中的多个特征值,如其中每两个特征值的变化率,即计算每两个特征值的变化量与时间差值的比值作为变化信息。步骤104,終端根据所述分区标识信息,查询所述分区标识信息对应的分区的多个特征值和所述多个特征值的变化信息对应的检索文本和/或符号信息。为了实现本专利技术的技术方案,在实际应用中,终端数据库中保存了的变化信息与检索文本和/或符号信息的映射关系,終端可以在开启视频输入法时,从该数据库中检索出与分区标识信息对应的分区的多个特征值和所述多个特征值对应的文本和/或符号信息。当然,終本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息的识别方法,其特征在于,所述方法包括 采集视频数据,在所述视频数据中提取图像帧; 将所述图像帧划分多个分区,所述分区用分区标识信息标识,提取并保存所述图像帧的每ー个分区的特征值; 根据所述分区标识信息,计算所述分区标识信息对应的分区的多个特征值的变化信息; 根据所述分区标识信息,查询所述分区标识信息对应的分区的多个特征值和所述多个特征值的变化信息对应的检索文本和/或符号信息; 显示所述检索文本和/或符号信息。2.如权利要求I所述的信息的识别方法,其特征在于,所述采集视频,在所述视频中提取多帧图像之前还包括接收用户的操作指令,将终端置为信息输入状态。3.如权利要求I或2所述的信息的识别方法,其特征在于,所述查询所述分区标识信息对应的分区的多个特征值和所述多个特征值的变化信息对应的检索文本和/或符号信息具体为在本地数据库或网络服务器中查询所述分区标识信息对应的分区的多个特征值和所述多个特征值的变化信息对应的检索文本和/或符号信息。4.如权利要求1-3任一项所述的信息的识别方法,其特征在于,所述显示所述检索文本和/或符号信息之后还包括接收用户的处理指令,根据所述处理指令,从所述检索文本和/或符号信息中选择输入文本和/或符号信息,并将所述输入文本和/或符号信息输入到指定的位置,用以完成信息输入。5.如权利要求1-4任一项所述的信息的识别方法,其特征在于,所述将所述图像帧划分多个分区具体为 识别所述图像帧中的人脸区域; 将所述图像帧中的所述人脸区域划分为眼睛分区、鼻子分区、嘴唇分区、牙齿分区、舌头分区。6.如权利要求1-5任一项所述的信息的识别方法,其特征在于,所述计算所述分区标识信息对应的分区的多个特征值的变化信息具体为根据所述分区标识信息,计算所述分区标识信息对应的分区在连续的图像帧中的多个特征值的变化量;或 根据所述分区标识信息,计算所述分区标识信息对应的分区在连续的图像帧中的多个特征...

【专利技术属性】
技术研发人员:刘春林
申请(专利权)人:华为终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1