音频数据识别装置制造方法及图纸

技术编号:35463448 阅读:15 留言:0更新日期:2022-11-05 16:04
本发明专利技术涉及收集任意音频数据并对收集的音频数据中提取任意一个区间而得的音频资源进行识别的音频数据识别装置,该音频数据识别装置包括:通信单元,收集并发送任意音频数据;及控制单元,识别收集的上述音频数据;控制单元包括:解析单元,将收集的音频数据解析成预定单位;提取单元,将音频数据的解析的多个片段中的任意一个片段选择为音频资源;匹配单元,通过预先安装的人工智能算法匹配音频资源的识别信息;及验证单元,验证与音频资源匹配的识别信息。的识别信息。的识别信息。

【技术实现步骤摘要】
【国外来华专利技术】音频数据识别装置


[0001]本专利技术涉及收集任意音频数据并对收集的音频数据中提取任意一个区间而得的音频资源进行识别的音频数据识别装置。

技术介绍

[0002]最近,深度学习等人工智能技术被应用于音频处理。作为与音频相关的处理技术之一的音频识别技术是为了检测由哪个主体生成音频输入、相关主体在什么情况下生成音频输入而开发的。
[0003]如上所述,为了实现使用人工智能的音频识别技术,多个音频输入、与此对应地已识别的音频信息或音频分析是必不可少的元素。
[0004]以往,为了获取与音频输入相对应的音频信息,使用正确答案纸收集方法。由于正确答案纸收集方法的音频信息收集是由少数的被雇用人进行的,因此所收集的音频信息的特性会根据被雇用人的个人特征而变化,并且存在收集的音频信息有限的问题。
[0005]即,当以正确答案纸收集方法收集音频信息时,难以确保所收集的音频信息的可靠性和客观性,并且难以确保广泛的音频信息。此外,当音频信息的可靠性和范围降低时,音频识别技术的性能自然会下降。
[0006]正确答案纸收集方法的另一问题在于,由于必须由一些被雇用人手动执行,因此在收集与大量音频输入相对应的音频信息的过程中需要相当长的时间。
[0007]作为另一种现有方法,有确保语音话语数据以建立语音识别系统的方法。换句话说,存在被雇用人力发出在直接话语的情况下发生的声音,然后将其记录并收集的方法。然而,这种方法的根本缺点在于,由被雇用的少数人力所收集的音频信息的特性可能会变化,因此难以摆脱地域限制。r/>[0008]因此,本专利技术旨在提供一种音频数据识别装置,其通过随机收集并分析通过社交网络、YouTube等在线上传的音视频数据,进行音频资源的识别,经过验证识别信息的过程,训练人工智能算法,从而能够提高可靠性和广泛范围的数据的识别性能。

技术实现思路

[0009]技术问题
[0010]本专利技术旨在提供用于通过网络收集任意音频数据的音频数据识别装置。
[0011]并且,本专利技术旨在提供一种音频数据识别装置,其对将随机收集的数据解析为预定单元而提取的音频资源的识别信息进行匹配。
[0012]此外,本专利技术旨在提供一种音频数据识别装置,其通过人工智能算法匹配音频资源的识别信息,且通过验证训练人工智能算法来提高识别性能。
[0013]此外,本专利技术旨在提供一种音频数据识别装置,其中,人工智能算法可以通过反馈来训练没有对其识别信息进行分类的音频资源。
[0014]并且,本专利技术旨在提供一种音频数据识别装置,其对通过外部终端由非特定多数
人匹配的识别信息进行验证来提高可靠性。
[0015]解决问题的方案
[0016]为了解决如上所述的本专利技术的技术问题,根据本专利技术的音频数据识别装置包括:通信单元,收集并发送任意音频数据;及控制单元,识别收集的上述音频数据;控制单元包括:解析单元,将收集的音频数据解析成预定单位;提取单元,将音频数据的解析的多个片段中的任意一个片段选择为音频资源;匹配单元,通过预先安装的人工智能算法匹配音频资源的识别信息;及验证单元,验证与音频资源匹配的识别信息。
[0017]在一实施例中,人工智能算法通过接收由验证单元辨别的识别信息的辨别结果输入而训练,验证单元根据通过外部终端的用户输入辨别识别信息。
[0018]并且,在一实施例中,验证单元根据通过外部终端的非特定多数人的输入辨别识别信息,当非特定多数人的辨别结果的误差范围大时,丢掉相关音频资源。
[0019]在一实施例中,外部终端接收匹配的识别信息的真假输入并将其发送给验证单元。
[0020]在另一实施例中,外部终端选择预先提供的多个标识符中的任意一个并接收输入,辨别选择的标识符和与音频资源匹配的识别信息是否相同,并将辨别结果发送给验证单元。
[0021]在一实施例中,匹配单元在预先指定的预定范围内匹配识别信息,在预定范围内没有被识别时,将相关音频资源作为未分类数据处理,对于作为未分类数据处理的音频资源,从外部终端接收相关识别信息的主观输入,从而将该识别信息发送到验证单元。
[0022]在一实施例中,通过预先指定的关键词收集任意音频数据。
[0023]专利技术效果
[0024]根据本专利技术,具有可以提高对广泛范围的音频资源的识别性能的效果。
[0025]此外,还具有可以提高音频资源的准确性而不浪费人力的效果。
[0026]最后,根据本专利技术提出的音频数据识别装置,对于比文本更复杂构成的音频,可以实现提供如下音频数据识别装置的数据库,即,通过人工智能算法容易匹配识别信息,且通过验证过程训练人工智能算法,从而能够识别音频资源。
附图说明
[0027]图1为示意性示出根据本专利技术的一实施例的音频数据识别装置的图。
[0028]图2为示出根据本专利技术的一实施例的音频数据识别装置的框图。
[0029]图3为用于说明根据本专利技术的一实施例的解析单元和提取单元的图。
[0030]图4和图5为用于说明根据本专利技术的一实施例的匹配单元和验证单元的反馈过程的图。
[0031]图6和图7为用于说明根据本专利技术的另一实施例的匹配单元和验证单元的反馈过程的图。
具体实施方式
[0032]用于实施专利技术的最佳方式
[0033]音频数据识别装置的特征在于包括:通信单元,收集并发送任意音频数据;及控制
单元,识别收集的音频数据;控制单元包括:解析单元,将收集的音频数据解析成预定单位;提取单元,将音频数据的解析的多个片段中的任意一个片段选择为音频资源;匹配单元,通过预先安装的人工智能算法匹配音频资源的识别信息;及验证单元,验证与音频资源匹配的识别信息。
[0034]用于实施专利技术的方式
[0035]以下,参照附图来对本专利技术的实施例进行详细说明,以使本专利技术所属
的普通技术人员轻松实现本专利技术。然而,本专利技术可通过多种不同的形式实现,并不限定于以下公开的附图和实施例。另外,为了在附图中清楚地说明本专利技术,与本专利技术无关的部分被省略,在附图中对相同或相似的构成使用了相同或相似的附图标记。
[0036]通过下面的说明能够自然地理解或更加明确本专利技术的目的和效果,当判断为可能不必要地模糊了本专利技术的主旨时,省略了详细说明,因此本专利技术的目的和效果并不限定于下面记载的目的和效果。
[0037]以下,参照附图来详细说明本专利技术的实施例。图1为示意性示出根据本专利技术的一实施例的音频数据识别装置的图。
[0038]首先,参照图1对本专利技术的一实施例进行示意性描述,根据预先指定的关键词,通过搜索和下载收集YouTube、社交网络和各种网络上的音频数据,并根据收集到的音频数据提取有效的音频资源。之后,针对提取的音频资源,通过人工智能算法辨别相关音频资源是在什么状况下的声音或什么类型的声音,并匹配识别信息,并通过反馈验证匹配结果,训练人工智能算法,从而提高可靠性和识别范围,本专利技术涉及如上的音频数据识别装置。即本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种音频数据识别装置,其特征在于,包括:通信单元(100),收集并发送任意音频数据;及控制单元(200),识别收集的上述音频数据;上述控制单元(200)包括:解析单元(210),将收集的上述音频数据解析成预定单位;提取单元(220),将上述音频数据的解析的多个片段中的任意一个片段选择为音频资源;匹配单元(230),通过预先安装的人工智能算法匹配上述音频资源的识别信息;及验证单元(240),验证与上述音频资源匹配的识别信息。2.根据权利要求1所述的音频数据识别装置,其特征在于,上述人工智能算法通过接收由上述验证单元(240)辨别的识别信息的辨别结果输入而训练。3.根据权利要求2所述的音频数据识别装置,其特征在于,上述验证单元(240)根据通过外部终端的用户输入辨别上述识别信息。4.根据权利要求2所述的音频数据识别装置,其特征在于,上述验证单元(240)根据通过外部终端的非特定多数人的输入辨别上述识别信息,当上...

【专利技术属性】
技术研发人员:韩允畅李秀斌朴正修丁一荣李敦文林铉基
申请(专利权)人:科克有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1