数据识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30069550 阅读:47 留言:0更新日期:2021-09-18 08:21
本申请实施例提供了一种数据识别方法、装置、电子设备及存储介质,涉及人工智能领域中的语音识别技术以及机器学习。该方法包括:获取待识别数据;对待识别数据中的每个子数据进行特征提取,得到每个子数据的至少两个维度的数据特征;基于待识别数据所对应的不同维度的数据特征之间的相关性,确定待识别数据对应的修正权重;基于修正权重,对每个数据特征进行加权处理,得到加权处理后的每个数据特征;基于加权处理后的每个数据特征,得到待识别数据的识别结果。本申请实施例基于待识别数据的不同维度的数据特征之间的相关性,确定待识别数据的修正权重,对每个数据特征进行加权处理,可让加权处理后的数据特征的指向性更强,从而提升识别性能。提升识别性能。提升识别性能。

【技术实现步骤摘要】
数据识别方法、装置、电子设备及存储介质


[0001]本申请涉及计算机
,具体而言,本申请涉及一种数据识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着云时代的来临,大数据吸引了越来越多的关注。大数据是指基于互联网获取到的海量的、多样化的数据集合。大数据的核心是利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,模型能利用的数据越多,越可能提升模型的精确性。
[0003]机器学习的基础是特征提取,通过去除不相关数据和冗余数据,能够提升机器学习效率和效果。如何从待处理的数据中提取得到表达能力更佳的特征,成为需要解决的问题。

技术实现思路

[0004]本申请提供了一种数据识别方法、装置及电子设备,可以解决现有技术中存在的问题。
[0005]本申请实施例提供的具体技术方案如下:
[0006]一方面,本申请实施例提供了一种数据识别方法,该方法包括:
[0007]获取待识别数据,待识别数据包括至少两个子数据;
[0008]对每个子数据进行特征提取,得到每个子数据的至少两个维度的数据特征;
[0009]基于待识别数据所对应的不同维度的数据特征之间的相关性,确定待识别数据对应的修正权重,其中,修正权重的维度与数据特征的维度对应;
[0010]基于修正权重,对每个数据特征进行加权处理,得到加权处理后的每个数据特征;
[0011]基于加权处理后的每个数据特征,得到待识别数据的识别结果。
[0012]另一方面,本专利技术实施例还提供了一种数据识别装置,该装置包括:
[0013]获取模块,用于获取待识别数据,待识别数据包括至少两个子数据;
[0014]提取模块,用于对每个子数据进行特征提取,得到每个子数据的至少两个维度的数据特征;
[0015]确定模块,用于基于待识别数据所对应的不同维度的数据特征之间的相关性,确定待识别数据对应的修正权重,其中,修正权重的维度与数据特征的维度对应;
[0016]加权模块,用于基于修正权重,对每个数据特征进行加权处理,得到加权处理后的每个数据特征;
[0017]处理模块,用于基于加权处理后的每个数据特征,得到待识别数据的识别结果。
[0018]本专利技术实施例还提供了一种电子设备,该电子设备包括一个或多个处理器;存储器;一个或多个计算机程序,其中一个或多个计算机程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序被配置用于执行如本申请的第一方面所示的方
法。
[0019]本专利技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质用于存储计算机程序,当计算机程序在处理器上运行时,使得处理器可以执行如本申请的第一方面所示的方法。
[0020]本申请提供的技术方案带来的有益效果是:
[0021]本申请提供了一种数据识别方法、装置及电子设备,基于待识别数据所对应的不同维度的数据特征之间的相关性,确定待识别数据对应的修正权重,基于修正权重,对待识别数据的每个子数据的数据特征进行加权处理,从而实现对不同维度的相关性建模,使得可以利用待识别数据的全局信息来对不同维度的数据特征进行修正,进而实现对每个子数据的修正,让提取的数据特征指向性更强,最后基于加权处理后的每个数据特征,得到待识别数据的识别结果,由于修正数据特征后,可让提取的数据特征指向性更强,从而可以充分利用不同子数据之间的上下文信息,有效提升识别性能,达到提升整个网络的性能的目的。另外,本申请技术方案是基于不同维度的相关性建模实现的,无需依赖通道结构,因而适用于序列建模任务,可以处理包含至少两个子数据的序列形式的待识别数据。
附图说明
[0022]为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
[0023]图1为本申请实施例提供的一种数据识别方法的流程示意图;
[0024]图2为本申请实施例提供的对待识别语音数据进行处理的处理过程的示意图;
[0025]图3为本申请实施例提供的数据识别装置的结构示意图;
[0026]图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0027]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
[0028]本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
[0029]本申请实施例提供的技术方案涉及云计算、人工智能的计算机视觉技术、自然语言处理技术以及机器学习/深度学习等技术,具体通过如下实施例进行说明。
[0030]云计算(cloud computing)指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。云计
算是网格计算(Grid Computing)、分布式计算(DistributedComputing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)等传统计算机和网络技术发展融合的产物。
[0031]随着互联网、实时数据流、连接设备多样化的发展,以及搜索服务、社会网络、移动商务和开放协作等需求的推动,云计算迅速发展起来。不同于以往的并行分布式计算,云计算的产生从理念上将推动整个互联网模式、企业管理模式发生革命性的变革。
[0032]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据识别方法,其特征在于,包括:获取待识别数据,所述待识别数据包括至少两个子数据;对每个所述子数据进行特征提取,得到每个所述子数据的至少两个维度的数据特征;基于所述待识别数据所对应的不同维度的数据特征之间的相关性,确定所述待识别数据对应的修正权重,其中,所述修正权重的维度与所述数据特征的维度对应;基于所述修正权重,对每个所述数据特征进行加权处理,得到加权处理后的每个数据特征;基于所述加权处理后的每个数据特征,得到所述待识别数据的识别结果。2.根据权利要求1所述的方法,其特征在于,所述待识别数据为待识别语音数据,所述子数据为所述待识别语音数据的一帧数据;所述识别结果为所述待识别语音数据的语音识别结果;所述对每个所述子数据进行特征提取,得到每个子数据的数据特征,包括:对所述待识别语音数据的各帧语音数据进行特征提取,得到对应于各帧语音数据的语音特征,其中,所述数据特征为语音特征;所述基于所述待识别数据所对应的不同维度的数据特征之间的相关性,确定所述待识别数据对应的修正权重,包括:基于所述待识别语音数据所对应的不同维度的语音特征之间的相关性,得到所述待识别语音数据对应的修正权重。3.根据权利要求1所述的方法,其特征在于,所述基于所述待识别数据所对应的不同维度的数据特征之间的相关性,确定所述待识别数据对应的修正权重,包括:针对每个维度,基于每个所述数据特征对应同一维度的特征,得到每个维度对应的全局特征;基于每个维度对应的全局特征之间的相关性,确定每个维度对应的权重;基于每个维度对应的权重,得到所述待识别数据对应的修正权重。4.根据权利要求3所述的方法,其特征在于,所述针对每个维度,基于每个所述数据特征对应同一维度的特征,得到每个维度对应的全局特征,包括:针对每个维度,对每个所述数据特征对应同一维度的特征进行全局池化处理,得到每个维度对应的全局特征。5.根据权利要求3所述的方法,其特征在于,所述针对每个维度,基于每个所述数据特征对应同一维度的特征,得到每个维度对应的全局特...

【专利技术属性】
技术研发人员:陈杰苏丹
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1