避免辨识结果混淆的影像辨识方法技术

技术编号:17615747 阅读:35 留言:0更新日期:2018-04-04 06:55
本发明专利技术公开了一种避免辨识结果混淆的影像辨识方法,于辨识平台接收用户欲辨识的多个标的,并依据多个标的查询预先建构的语义树,以判断多个标的彼此之间是否会产生辨识结果的混淆。于多个标的辨识结果不会产生混淆时,分别取得多个标的所属的母类别对应的母类别分类器,并使用该些母类别分类器进行辨识。并且,于多个标的辨识结果可能产生混淆时,分别取得多个标的底层的多个子类别对应的子类别分类器,并使用该些子类别分类器进行辨识。

Image identification method to avoid confusion of identification results

The invention discloses a method for avoiding confusion of identification result of image identification method in multiple identification platform receives user identification to the subject, and based on a standard semantic tree query constructed in advance, to determine whether multiple targets each other will produce identification results of confusion. When there is no confusion between multiple target recognition results, the parent class classifier corresponding to the parent class belonging to multiple targets is obtained, and the parent class classifier is used to identify it. And, in a number of target identification results may cause confusion, were made more sub categories of underlying multiple object corresponding to the sub category classifier, and identify the use of the sub category classifier.

【技术实现步骤摘要】
避免辨识结果混淆的影像辨识方法
本专利技术涉及一种影像辨识方法,尤其涉及一种可避免辨识结果混淆的影像辨识方法。
技术介绍
要通过人工智能(ArtificialIntelligence,AI)自动对影像或视频中的标的,如人脸、物件、场景等进行辨识,必须先确定要辨识的一或多个标的,并训练对应至该些标的的分类器。如此一来,在对影像或视频进行分析时,可藉由训练完成的一或多个分类器自动对影像或视频进行分析比对,并辨识出影像或视频中是否存在该些标的。如图1所示,为现有技术的分类器训练示意图。举例来说,若用户要辨识的标的包含“手机”以及“屏幕”这两个物件,则需先针对手机这个类别训练一手机分类器1,并针对屏幕这个类别训练一屏幕分类器2。具体地,工程师需将与手机相关的训练素材11,例如手机屏幕、手机背面、手机壳等的相关信息(例如图片、影片等)输入该手机分类器1,令该手机分类器1能够了解包含哪些元素在内的物件符合手机类别的定义。同样地,工程师也需将与屏幕相关的训练素材21,例如电视屏幕、电脑屏幕、手机屏幕等的相关信息输入该屏幕分类器2,令该屏幕分类器2能够了解包含哪些元素在内的物件符合屏幕类别的定义。然而如图1所示,由于该手机分类器1的训练素材11中包含了手机屏幕(也就是说手机类别下面包含了手机屏幕子类别),而该屏幕分类器2的训练素材21中也包含了手机屏幕(也就是说屏幕类别下面也包含了手机屏幕子类别),因此在训练完成之后,该手机分类器1会将包含手机屏幕在内的物件辨识为手机,而该屏幕分类器2会将包含手机屏幕在内的物件辨识为屏幕。如此一来,手机类别与屏幕类别的辨识结果就会产生混淆。举例来说,若用户要在一辨识平台上寻找一视频中有手机出现的片段,但于分析时,先由该屏幕分类器2辨识出该视频中出现了手机屏幕的片段,并且将该手机屏幕定义为屏幕类别,则该片段将会无法被用户所成功搜寻。如此一来,即会因为辨识结果的混淆而造成辨识失败,进而降低自动辨识的辨识率。
技术实现思路
本专利技术的主要目的,在于提供一种避免辨识结果混淆的影像辨识方法,可依据用户欲辨识的标的自动调整与选择实际分析时所使用的分类器,藉此避免辨识结果产生混淆。为了达成上述的目的,本专利技术公开一种避免辨识结果混淆的影像辨识方法,运用于一辨识平台,包括:a)于该辨识平台接收欲辨识的多个标的;b)提供一语义树,依据该多个标的查询该语义树以判断该多个标的是否会产生辨识结果的混淆;c)于该多个标的不会产生辨识结果的混淆时,分别取得各该标的所属的一母类别对应的一母类别分类器;c1)步骤c后,使用该些母类别分类器对一目标视频进行辨识;d)于该多个标的可能产生辨识结果的混淆时,分别取得可能产生混淆的多个标的底层的多个子类别对应的多个子类别分类器,其中该些母类别分别为该些子类别的联集;及d1)步骤d后,使用该多个子类别分类器对该目标视频进行辨识。如上所述,其中该步骤b是于任一该标的底层的任一子类别与另一该标的底层的任一子类别重叠时,判断该二标的可能产生辨识结果的混淆。如上所述,其中还包括:步骤d0)于该多个标的可能产生辨识结果的混淆时,取得该多个标的中不会产生混淆的一个该标的所属的母类别对应的母类别分类器;并且该步骤d1中,同时使用该母类别分类器及该多个子类别分类器对该目标视频进行辨识。如上所述,其中更包括下列步骤:e)步骤c1后,判断该些母类别分类器的其中之一是否得到一有效辨识值;及e1)若任一该母类别分类器得到该有效辨识值,输出对应的该母类别的名称作为辨识结果。如上所述,其中更包括下列步骤:f)步骤d1后,判断该多个子类别分类器的其中之一是否得到一有效辨识值;f1)若任一该子类别分类器得到该有效辨识值,对该子类别的名称进行转译以得到涵盖该子类别的多个母类别;及f2)同时输出该多个母类别的名称作为辨识结果。如上所述,其中该多个标的为物件或场景。如上所述,其中该些母类别为手机、平板电脑、电视、笔记型电脑与屏幕,该些子类别为手机屏幕、平板屏幕、电视屏幕与笔电屏幕。如上所述,其中该些母类别为笔记型电脑、桌上型电脑与键盘,该些子类别为笔电键盘与桌机键盘。如上所述,其中该些母类别为汽车、单车与轮胎,该些子类别为汽车轮胎与单车轮胎。如上所述,其中该些母类别为餐厅、酒吧与桌椅,该些子类别为餐厅桌椅配置与酒吧桌椅配置。本专利技术对照现有技术所能达到的技术功效在于,辨识平台于接收用户欲辨识的标的后,可先判断该些标的彼此之间是否有辨识结果混淆的可能性,再决定要使用该些标的直接对应的母类别分类器进行辨识,或是进一步使用该些标的底层的多个子类别分类器进行辨识。如此一来,可有效避免在用户欲辨识的多个标的的关联性较高时,产生辨识结果混淆的情况。附图说明图1为现有技术的分类器训练示意图;图2为本专利技术的第一具体实施例的语义树示意图;图3为本专利技术的第一具体实施例的辨识流程图;图4A为本专利技术的第一具体实施例的辨识结果输出流程图;图4B为本专利技术的第二具体实施例的辨识结果输出流程图;图5为本专利技术的第一具体实施例的影像辨识示意图;图6A为物件辨识结果混淆的第一示范例;图6B为物件辨识结果混淆的第二示范例;图6C为物件辨识结果混淆的第三示范例;图6D为场景辨识结果混淆的第一示例。附图标记:1…手机分类器;11…训练素材;2…屏幕分类器;21…训练素材;3…语义树;4…视频;41…第一物件;42…第二物件;43…第三物件;S10~S22…辨识步骤;S30~S32…输出步骤;S40~S44…输出步骤。具体实施方式兹就本专利技术的一较佳实施例,配合附图,详细说明如后。本专利技术公开了一种避免辨识结果混淆的影像辨识方法(下面将于说明书中简称为该方法),该方法主要是运用于离线的一辨识系统或连接网络的一辨识平台,于下述说明中,将以该辨识平台为例,进行说明。该辨识平台主要可对静态影像以及动态的视频进行分析,以辨识在影像与视频中出现的各种标的。以创意引晴公司所开发的FITAMOS系统为例,以FITAMOS系统为核心的辨识平台,主要可于影像或视频中辨识出人脸、图片/商标、文字、声音、动作、物件及场景等七大标的。本专利技术的主要技术特征在于,当该辨识平台要同时进行多个标的的辨识时,会先参考预先建构完成的一语义树,以判断该多个标的彼此之间是否存在辨识结果混淆的可能性。并且,再依据判断结果决定要使用该些标的所属的母类别的分类器直接进行辨识,或是使用该些标的底层的多个子类别的分类器进行辨识。如图2所示,为本专利技术的第一具体实施例的语义树示意图。图2公开了一语义树3的具体实施态样。本专利技术中,该语义树3主要是依据语义学(semantics)所建构而成的树状语义逻辑,并且该语义树3具有两个以上的层级,也就是说每一个词汇至少包括一个母类别及一个子类别。于图2的实施例中,在该语义树3的根部底下,包括了“车子”、“屏幕”及“手机”三个类别。若将该车子类别视为母类别,则该车子类别的底层包括了“单车”、“摩托车”及“汽车”三个子类别,也就是说该车子类别为该单车类别、该摩托车类别及该汽车类别的联集。若进一步将该汽车类别视为母类别,则该汽车类别的底层还包括“跑车”、“房车”及“游览车”三个子类别,其中该汽车类别为该跑车类别、该房车类别与该游览车类别的联集。若将该跑车类别视为母类别,该跑车类别的底本文档来自技高网
...
避免辨识结果混淆的影像辨识方法

【技术保护点】
一种避免辨识结果混淆的影像辨识方法,运用于一辨识平台,其特征在于,包括:a)于该辨识平台接收欲辨识的多个标的;b)提供一语义树,依据该多个标的查询该语义树以判断该多个标的是否会产生辨识结果的混淆;c)于该多个标的不会产生辨识结果的混淆时,分别取得各该标的所属的一母类别对应的一母类别分类器;c1)步骤c后,使用该些母类别分类器对一目标视频进行辨识;d)于该多个标的可能产生辨识结果的混淆时,分别取得可能产生混淆的多个标的底层的多个子类别对应的多个子类别分类器,其中该些母类别分别为该些子类别的联集;及d1)步骤d后,使用该多个子类别分类器对该目标视频进行辨识。

【技术特征摘要】
1.一种避免辨识结果混淆的影像辨识方法,运用于一辨识平台,其特征在于,包括:a)于该辨识平台接收欲辨识的多个标的;b)提供一语义树,依据该多个标的查询该语义树以判断该多个标的是否会产生辨识结果的混淆;c)于该多个标的不会产生辨识结果的混淆时,分别取得各该标的所属的一母类别对应的一母类别分类器;c1)步骤c后,使用该些母类别分类器对一目标视频进行辨识;d)于该多个标的可能产生辨识结果的混淆时,分别取得可能产生混淆的多个标的底层的多个子类别对应的多个子类别分类器,其中该些母类别分别为该些子类别的联集;及d1)步骤d后,使用该多个子类别分类器对该目标视频进行辨识。2.根据权利要求1所述的避免辨识结果混淆的影像辨识方法,其特征在于,该步骤b是于任一该标的底层的任一子类别与另一该标的底层的任一子类别重叠时,判断该二标的可能产生辨识结果的混淆。3.根据权利要求2所述的避免辨识结果混淆的影像辨识方法,其特征在于,还包括:步骤d0)于该多个标的可能产生辨识结果的混淆时,取得该多个标的中不会产生混淆的一个该标的所属的母类别对应的母类别分类器;并且该步骤d1中,同时使用该母类别分类器及该多个子类别分类器对该目标视频进行辨识。4.根据权利要求2所述的避免辨识结果混淆的影像辨识方法,其特征在于,还包括下列步骤:e)步骤c1后,判...

【专利技术属性】
技术研发人员:谢少航陈彦呈
申请(专利权)人:创意引晴开曼控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1