一种内容识别的系统和方法技术方案

技术编号:25279071 阅读:15 留言:0更新日期:2020-08-14 23:09
本申请提供了一种用于数据提供系统和服务提供系统进行交互的方法。所述方法可以包括从数据提供系统获取数据训练请求和一个或多个数据集。所述方法可以包括确定一个或多个数据集的一个或多个特征向量。所述方法可以包括通过将目标扰动引入一个或多个特征向量确定扰动训练集。所述方法可以包括基于扰动训练集和损失值训练识别模型。所述方法可以包括产生包括内容识别模型的电子信号。所述方法可以进一步包括将电子信号发送到服务提供系统用于内容识别。

【技术实现步骤摘要】
【国外来华专利技术】一种内容识别的系统和方法
本申请一般涉及用于从大数据中进行内容识别的人工智能系统和方法。
技术介绍
在大数据时代,商业可用信息急剧增加。数据分类技术是一种组织和管理信息的方式,应用于语音识别、图像识别、文本内容识别等内容识别
数据分类技术采用模型将信息分类为一个或多个类别。然而,由于模型的鲁棒性较差,数据分类技术经常受到噪声的影响,从而导致精度较低。因此,开发人工智能(AI)系统和方法来分类数据和更准确地识别内容是合乎需要的。
技术实现思路
根据本申请的一方面,提供了一种系统。所述系统可以与数据提供系统和服务提供系统进行交互。所述系统可以包括数据交换端口,从所述数据提供系统接收一个或多个数据集,数据传输端口,连接到所述服务提供系统以进行内容识别,一个或多个存储介质,包括一个或多个训练内容识别模型的指令集,一个或多个处理器,所述处理器与所述数据交换端口,所述数据传输端口,和所述一个或多个存储介质通信。其中当执行一个或多个所述指令集时,所述一个或多个处理器可以用于执行一个或多个下述操作。所述一个或多个处理器可以从所述数据提供系统获取数据训练请求和一个或多个数据集。响应于所述数据提供系统的所述数据训练请求,所述一个或多个处理器可以确定所述一个或多个数据集的一个或多个特征向量。所述一个或多个处理器可以通过将目标扰动引入所述一个或多个特征向量确定扰动训练集。所述目标扰动与所述一个或多个特征向量的密度相关。所述一个或多个处理器可以在多次迭代中,基于所述扰动训练集和损失值训练识别模型。所述损失值可以包括与所述目标扰动相关联的Kullback-Leibler(KL)散度。响应于所述识别模型的所述训练完成的确定,所述一个或多个处理器可以产生包括所述识别模型电子信号并将所述电子信号发送到所述服务提供系统用于内容识别。在一些实施例中,所述一个或多个数据集可以包括语音段,文本文件或图像中至少一种。在一些实施例中,所述目标扰动相关联的所述KL散度可以是所述一个或多个特征向量的概率分布与所述扰动训练集的概率分布之间的KL散度。在一些实施例中,所述损失值可以进一步包括关于所述扰动训练集的概率分布的交叉熵。在一些实施例中,所述一个或多个特征向量的所述概率分布可以根据SoftMax方法确定。在一些实施例中,对于多个迭代中的每一个,所述一个或多个处理器可以进一步基于所述扰动训练集,根据随机梯度下降(SGD)方法,更新所述一个或多个特征向量和所述识别模型的一个或多个参数。所述一个或多个处理器可以指定所述更新的一个或多个特征向量和所述识别模型的所述更新的一个或多个参数作为下一次迭代的输入。在一些实施例中,所述一个或多个处理器可以将初始扰动引入到所述一个或多个特征向量。所述一个或多个处理器可以确定所述一个或多个特征向量的所述概率分布和所述一个或多个特征向量与所述初始扰动的所述概率分布之间的KL散度。所述一个或多个处理器可以确定所述KL散度的最大值。所述一个或多个处理器可以基于所述一个或多个特征向量的密度确定向量长度以及基于所述KL散度的所述最大值和所述向量长度确定所述目标扰动。在一些实施例中,所述一个或多个处理器可以获取数据集以及基于所述训练后的识别模型将所述数据集分类为一个或多个组。在一些实施例中,分类模型可以包括长短期记忆模型(LSTM)。根据本申请的一个方面,提供了一种用于与数据提供系统和服务提供系统进行交互的方法。所述方法可以包括一个或多个以下操作。至少一个处理器可以从所述数据提供系统获取数据训练请求和一个或多个数据集。响应于所述数据提供系统的所述数据训练请求,所述至少一个处理器可以确定所述一个或多个数据集的一个或多个特征向量。所述至少一个处理器可以通过将目标扰动引入所述一个或多个特征向量确定扰动训练集。所述目标扰动可以与一个或多个特征向量的密度相关。所述至少一个处理器可以在多次迭代中,基于所述扰动训练集和损失值训练识别模型。所述损失值可以包括与所述目标扰动相关联的Kullback-Leibler(KL)散度。响应于所述内容识别模型的所述训练完成的确定,所述至少一个处理器可以产生包括所述内容识别模型电子信号以及将所述电子信号发送到所述服务提供系统用于内容识别。根据本申请的另一方面,提供了一种非暂时性计算机可读介质。所述非暂时性计算机可读介质可以包括使至少一个处理器实现方法的可执行指令。所述方法可以包括一个或多个以下操作。所述一个或多个处理器可以从所述数据提供系统获取数据训练请求和一个或多个数据集。响应于所述数据提供系统的所述数据训练请求,所述一个或多个处理器可以确定所述一个或多个数据集的一个或多个特征向量。所述一个或多个处理器可以通过将目标扰动引入所述一个或多个特征向量确定扰动训练集。所述目标扰动可以与所述一个或多个特征向量的密度相关。所述一个或多个处理器可以在多次迭代中,基于所述扰动训练集和损失值训练识别模型。所述损失值可以包括与所述目标扰动相关联的Kullback-Leibler(KL)散度。响应于所述识别模型的所述训练完成的确定,所述一个或多个处理器可以产生包括所述识别模型电子信号并将所述电子信号发送到所述服务提供系统用于内容识别。一部分附加特征将在下面描述中进行说明,通过对以下描述和相应附图的检查或者对实施例的生产或操作的学习,这部分附加特征对于本领域技术人员是明显的。本申请的特征可以通过实践或使用以下实例中详细讨论的方法、手段及组合的各个方面来达成。附图说明本申请将结合示例性实施例进一步进行描述。这些示例性实施例将结合参考附图进行详细描述。附图未按比例绘制。这些实施例是非限制性的示例性实施例,在这些实施例中,相同的标号表示相同的结构,其中:图1是根据本申请一些实施例所示的一种示例性人工智能(AI)内容识别系统的示意图;图2是根据本申请一些实施例所示的示例性计算设备的组件的示意图;图3是根据本申请一些实施例所示的一种示例性用户端的示例性硬件和/或软件组件的示意图;图4是根据本申请一些实施例所示的一种示例性处理引擎的模块图;图5是根据本申请一些实施例所示的一种示例性模型确定模块的模块图;图6-A是根据本申请一些实施例所示的一种示例性识别模型的示意图;图6-B是根据本申请一些实施例所示的一种示例性识别模型的结构的示意图;图7是根据本申请一些实施例所示的用于训练识别模型的示例性过程的流程图;图8是根据本申请一些实施例所示的用于确定目标扰动向量的示例性过程的流程图;和图9是根据本申请一些实施例所示的用于对文本数据进行分类的示例性过程的流程图。具体实施方式为了更清楚地说明本申请的实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例。对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。除非从语言环境中显而易见或另做说明,图本文档来自技高网...

【技术保护点】
1.一种用于数据提供系统和服务提供系统进行交互的系统,包括:/n数据交换端口,从所述数据提供系统接收一个或多个数据集;/n数据传输端口,连接到所述服务提供系统以进行内容识别;/n一个或多个存储介质,包括一个或多个训练内容识别模型的指令集;/n一个或多个处理器,所述处理器与所述数据交换端口,所述数据传输端口,和所述一个或多个存储介质通信,其中当执行一个或多个所述指令集时,所述一个或多个处理器:/n从所述数据提供系统获取数据训练请求和一个或多个数据集;/n响应于所述数据提供系统的所述数据训练请求:/n确定所述一个或多个数据集的一个或多个特征向量;/n通过将目标扰动引入所述一个或多个特征向量确定扰动训练集,其中所述目标扰动与所述一个或多个特征向量的密度相关;和/n在多次迭代中,基于所述扰动训练集和损失值训练识别模型,其中,所述损失值包括与所述目标扰动相关联的Kullback-Leibler(KL)散度;/n响应于所述识别模型的所述训练完成的确定,产生包括所述识别模型电子信号;/n将所述电子信号发送到所述服务提供系统用于内容识别。/n

【技术特征摘要】
【国外来华专利技术】1.一种用于数据提供系统和服务提供系统进行交互的系统,包括:
数据交换端口,从所述数据提供系统接收一个或多个数据集;
数据传输端口,连接到所述服务提供系统以进行内容识别;
一个或多个存储介质,包括一个或多个训练内容识别模型的指令集;
一个或多个处理器,所述处理器与所述数据交换端口,所述数据传输端口,和所述一个或多个存储介质通信,其中当执行一个或多个所述指令集时,所述一个或多个处理器:
从所述数据提供系统获取数据训练请求和一个或多个数据集;
响应于所述数据提供系统的所述数据训练请求:
确定所述一个或多个数据集的一个或多个特征向量;
通过将目标扰动引入所述一个或多个特征向量确定扰动训练集,其中所述目标扰动与所述一个或多个特征向量的密度相关;和
在多次迭代中,基于所述扰动训练集和损失值训练识别模型,其中,所述损失值包括与所述目标扰动相关联的Kullback-Leibler(KL)散度;
响应于所述识别模型的所述训练完成的确定,产生包括所述识别模型电子信号;
将所述电子信号发送到所述服务提供系统用于内容识别。


2.根据权利要求1所述的系统,其中所述一个或多个数据集包括语音段,文本文件或图像中至少一种。


3.根据权利要求1所述的系统,其中与所述目标扰动相关联的所述KL散度是所述一个或多个特征向量的概率分布与所述扰动训练集的概率分布之间的KL散度。


4.根据权利要求1所述的系统,其中所述损失值进一步包括关于所述扰动训练集的概率分布的交叉熵。


5.根据权利要求4所述的系统,其中所述一个或多个特征向量的所述概率分布根据SoftMax方法确定。


6.根据权利要求1所述的系统,其中训练所述识别模型,所述一个或多个处理器进一步:
对于多个迭代中的每一个,
基于所述扰动训练集,根据随机梯度下降(SGD)方法,更新所述一个或多个特征向量和所述识别模型的一个或多个参数;和
指定所述更新的一个或多个特征向量和所述识别模型的所述更新的一个或多个参数作为下一次迭代的输入。


7.根据权利要求1所述的系统,其中所述目标扰动被确定通过:
将初始扰动引入到所述一个或多个特征向量;
确定所述一个或多个特征向量的所述概率分布和所述一个或多个特征向量与所述初始扰动的所述概率分布之间的KL散度;
确定所述KL散度的最大值;
基于所述一个或多个特征向量的密度确定向量长度;和
基于所述KL散度的所述最大值和所述向量长度确定所述目标扰动。


8.根据权利要求1所述的系统,所述一个或多个处理器进一步:
获取数据集;和
基于所述训练后的识别模型将所述数据集分类为一个或多个组。


9.根据权利要求1所述的系统,其中分类模型包括长短期记忆模型(LSTM)。


10.一种用于数据提供系统和服务提供系统进行交互的方法,所述方法在包括至少一个处理器以及至少一个计算机可读存储介质的计算设备上实施,所述方法包括:
从所述数据提供系统获取数据训练请求和一个或多个数据集;
响应于所述数据提供系统的所述数据训练请求:
...

【专利技术属性】
技术研发人员:李晓辉贺利强
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1