限制在网络环境中操纵内容的传输制造技术

技术编号:21918145 阅读:31 留言:0更新日期:2019-08-21 13:45
本公开的系统和方法大体上涉及一种识别计算机网络环境中的可能被操纵的或者欺骗性的数字分量的数据处理系统。所述数据处理系统可以通过例如防止或者减少被操纵的或者欺骗性的数字分量传输的数量来提高在一个或者多个计算机网络上的数据分组(或者基于其他协议的)传输的效率和有效性。

Limit the transmission of manipulated content in a network environment

【技术实现步骤摘要】
【国外来华专利技术】限制在网络环境中操纵内容的传输
技术介绍
过度网络传输(基于分组或者以其他方式)计算装置之间的网络业务数据可能会妨碍计算装置恰当地处理网络业务数据、完成与网络业务数据有关的操作、或者及时对网络业务数据做出响应。如果响应计算装置处于或者高于其处理能力,则过度网络传输网络业务数据还可能会使数据路由复杂化或者降低响应的质量,这可能会导致带宽利用效率低下。可以发起计算装置之间的网络业务数据的网络传输的大量数字分量对象可能会使控制与数字分量对象相对应的网络传输变得更加复杂。
技术实现思路
至少一个方面涉及一种用于限制在网络环境中内容传输的系统。该系统可以包括数据处理系统,该数据处理系统可以包括接口,该接口用于从客户端计算装置接收内容请求。该系统可以包括由数据处理系统执行的内容选择器组件。内容选择器组件可以基于内容请求来选择第一数字分量。第一数字分量可以包括第一多个字符。该系统可以包括由数据处理系统执行的操纵检测组件。操纵检测组件可以检索字典,该字典包括多个数字分量中包括的候选字符的一部分的指示。操纵检测组件可以基于字典将第一多个字符转换成字符数组,该字典可以包括在多个数字分量中包括的候选字符的一部分的指示。操纵检测组件可以基于该字符数组中的第一多个字符的序列将第一数字分量分类成多个类别中的第一类别。操纵检测组件可以基于将第一数字分量分类成多个类别中的第一类别来确定在对来自客户端计算装置的内容请求的响应中不包括第一数字分量。操纵检测组件可以基于来自客户端计算装置的内容请求来生成响应。至少一个方面涉及一种用于限制在网络环境中内容传输的方法。该方法可以包括:通过数据处理系统接收来自客户端计算装置的内容请求。该方法可以包括:通过由数据处理系统执行的内容选择器组件基于该内容请求来选择第一数字分量。第一数字分量可以包括第一多个字符。该方法可以包括:通过由数据处理系统执行的操纵检测组件来检索字典,该字典可以包括在多个数字分量中包括的候选字符的一部分的指示。该方法可以包括:通过操纵检测组件基于字典将第一多个字符转换成字符数组。该方法可以包括:基于该字符数组中的第一多个字符的序列将第一数字分量分类成多个类别中的第一类别。该方法可以包括:通过操纵检测组件基于将第一数字分量分类成多个类别中的第一类别来确定在对来自客户端计算装置的内容请求的响应中不包括第一数字分量。该方法可以包括:通过数据处理系统基于来自客户端计算装置的内容请求来生成响应。本公开的至少一个方面涉及一种数字助理装置,该数字助理装置可以包括音频驱动器、变换器(transducer)、用于检测输入音频信号的传感器、和预处理器组件。预处理器组件可以耦合至音频驱动器、变换器和传感器。预处理器可以对输入音频信号进行过滤以产生过滤的输入音频信号。预处理器可以将过滤的输入音频信号转换成数据分组。预处理器可以将数据分组传输至数据处理系统。数据处理系统可以包括执行自然语言处理器组件、内容选择器组件、接口、和操纵检测组件的一个或者多个处理器和存储器。数据处理系统可以经由接口从预处理器组件接收数据分组,该数据分组包括由传感器检测到的过滤的输入音频信号。数据处理系统可以通过自然语言处理器组件来识别过滤的输入音频信号中的内容请求。数据处理系统可以通过内容选择器组件基于内容请求来选择第一数字分量。第一数字分量可以包括第一多个字符。数据处理系统可以通过操纵检测组件来检索字典,该字典可以包括在多个数字分量中包括的候选字符的一部分的指示。数据处理系统可以通过操纵检测组件基于字典将第一多个字符转换成字符向量,该字典包括在多个数字分量中包括的候选字符的一部分的指示。数据处理系统可以通过操纵检测组件基于字符向量中的第一多个字符的序列将第一数字分量分类成多个类别中的第一类别。数据处理系统可以通过操纵检测组件基于将第一数字分量分类成多个类别中的第一类别来确定在对来自客户端计算装置的内容请求的响应中不包括第一数字分量。数据处理系统可以通过操纵检测组件基于来自客户端计算装置的内容请求来生成响应,基于确定在响应中不包括第一数字分量,该响应不包括第一数字分量。下面详细地讨论了这些和其他方面与实施方式。前述信息和下面的详细说明包括各个方面和实施方式的说明性示例,并且为理解所要求的方面和实施方式的本质和特征提供了概述或者框架。附图提供了对各个方面和实施方式的说明和进一步理解,并且包含在本说明书中构成本说明书的一部分。附图说明附图不旨在按照比例进行绘制。在不同附图中的类似的附图标记和指示表示类似的元件。为了清楚起见,并非每个组件都在每张附图中进行了标记。在附图中:图1描绘了用于限制在网络环境中内容传输的系统。图2描绘了用于在语音启动的计算机网络环境中限制在网络环境中内容传输的方法。图3描绘了用于将数字分量划分成多个部分,然后在语音启动的计算机网络环境中将这些部分转换成字符数组的过程;以及图4是图示了可以用于实现本文描述和图示的系统和方法的元件的计算机系统的一般架构的框图。具体实施方式以下是对与用于限制在网络环境中内容传输的方法、设备、和系统有关的各种概念和实施方式的更详细的描述。以上引入的并且以下更详细地讨论的各种概念可以按照多种方式实现。本公开的系统和方法大体上涉及一种识别计算机网络环境中的可能被操纵的或者欺骗性的数字分量的数据处理系统。该数据处理系统可以通过例如防止或者减少被操纵的或者欺骗性的数字分量传输的数量来提高在一个或者多个计算机网络上的数据分组(或者基于其他协议的)传输的效率和有效性。被操纵的或者欺骗性的数字分量可以是包括文本或者其他内容的内容项,该文本或者其他内容被配置为不被手动或者自动内容过滤器检测到。对文本的操纵可以包括形近字的包含、重复字符的包含、字符的删除、单词的合并、字符的换位或者它们的任何组合。本文描述的系统和方法可以用于数字助理或者其他基于音频的系统或者与数字助理或者其他基于音频的系统一起使用。例如,系统可以包括接收输入音频查询(该输入音频查询也可以被称为输入音频信号)的数据处理系统。根据输入音频查询,数据处理系统可以识别请求以及与该请求对应的触发关键字。基于触发关键字或者请求,数据处理系统可以生成可以包括一个或者多个数字分量的响应。数据处理系统可以选择数字分量,或者可以从第三方向数据处理系统提供数字分量。数字分量可以是用户生成的内容,诸如,评述或者评论。数据处理系统可以处理数字分量以确定数字分量是否为欺骗性的、被操纵的、或者应该被标记为垃圾邮件。数据处理系统可以通过识别被操纵的数字分量来删除、清除、禁止、或者以其他方式限制数字分量的传输,由于不合需要的数字分量未通过网络传输至客户端计算装置,因此这可以减少计算能力、功耗、存储器、和带宽的总消耗。数据处理系统然后可以选择未被操纵的数字分量,可以通过分组或者基于其他协议的数据消息传输经由计算机网络向客户端计算装置提供该未被操纵的数字分量。数字分量也可以被称为内容项。数字分量可以包括在数字分量中。包括所选择的数字分量的输出信号可以使客户端计算装置的音频驱动器组件生成声波(例如,音频输出),可以从客户端计算装置输出该声波。图1图示了用于限制在网络环境中内容传输的示例系统100。数据处理系统102可以包括至少一个服务器,该至少一个服务器具有至少一个处理器本文档来自技高网...

【技术保护点】
1.一种用于限制在网络环境中内容传输的系统,包括:数据处理系统接口,所述数据处理系统接口用于从客户端计算装置接收内容请求;由所述数据处理系统执行的内容选择器组件,所述内容选择器组件用于基于所述内容请求来选择第一数字分量,所述第一数字分量包括第一多个字符;以及由所述数据处理系统执行的操纵检测组件,所述操纵检测组件用于:检索字典,所述字典包括在多个数字分量中包括的候选字符的一部分的指示;基于所述字典将第一多个字符转换成字符向量,所述字典包括在所述多个数字分量中包括的所述候选字符的所述一部分的指示;基于所述字符向量中的所述第一多个字符的序列将所述第一数字分量分类成多个类别中的第一类别;基于将所述第一数字分量分类成所述多个类别中的所述第一类别,确定在对来自所述客户端计算装置的所述内容请求的响应中不包括所述第一数字分量;以及基于来自所述客户端计算装置的所述内容请求来生成所述响应,基于确定在所述响应中不包括所述第一数字分量,所述响应不包括所述第一数字分量。

【技术特征摘要】
【国外来华专利技术】1.一种用于限制在网络环境中内容传输的系统,包括:数据处理系统接口,所述数据处理系统接口用于从客户端计算装置接收内容请求;由所述数据处理系统执行的内容选择器组件,所述内容选择器组件用于基于所述内容请求来选择第一数字分量,所述第一数字分量包括第一多个字符;以及由所述数据处理系统执行的操纵检测组件,所述操纵检测组件用于:检索字典,所述字典包括在多个数字分量中包括的候选字符的一部分的指示;基于所述字典将第一多个字符转换成字符向量,所述字典包括在所述多个数字分量中包括的所述候选字符的所述一部分的指示;基于所述字符向量中的所述第一多个字符的序列将所述第一数字分量分类成多个类别中的第一类别;基于将所述第一数字分量分类成所述多个类别中的所述第一类别,确定在对来自所述客户端计算装置的所述内容请求的响应中不包括所述第一数字分量;以及基于来自所述客户端计算装置的所述内容请求来生成所述响应,基于确定在所述响应中不包括所述第一数字分量,所述响应不包括所述第一数字分量。2.根据权利要求1所述的系统,包括:所述接口用于从所述客户端计算装置接收第二内容请求;所述内容选择器组件用于基于所述第二内容请求来选择第二数字分量,所述第二数字分量包括第二多个字符;以及所述操纵检测组件用于:将所述第二多个字符划分成第一部分和第二部分;将所述第二多个字符的所述第一部分转换成第二字符向量,并且将所述第二多个字符的所述第二部分转换成第三字符向量;以及基于所述第一部分中的所述第二多个字符的序列和所述第二部分中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的第一类别。3.根据权利要求1所述的系统,包括操纵检测组件用于:对所述字符向量进行独热编码;以及对在所述多个数字分量中包括的所述候选字符的所述一部分进行独热编码。4.根据权利要求1所述的系统,包括:自然语言处理器,所述自然语言处理器用于:接收包括所述内容请求的输入音频信号;解析所述输入音频信号以识别所述内容请求和触发关键字;以及所述内容选择器组件用于基于所述内容请求和所述触发关键字来选择所述第一数字分量。5.根据权利要求1所述的系统,包括:所述操纵检测组件用于将所述第一数字分量的音频输出转换成所述第一多个字符。6.根据权利要求1所述的系统,包括:所述内容选择器组件用于基于确定在所述响应中不包括所述第一数字分量来选择第二数字分量,所述第二数字分量包括第二多个字符;以及所述操纵检测组件用于:将所述第二多个字符转换成第二字符向量;基于所述第二字符向量中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的第二类别;以及将所述第二数字分量包括在所述响应中。7.根据权利要求6所述的系统,包括:音频信号发生器组件,所述音频信号发生器组件用于将所述第二数字分量转换成输出音频文件。8.根据权利要求1所述的系统,包括:所述内容选择器组件用于基于确定在所述响应中不包括所述第一数字分量来选择第二数字分量,所述第二数字分量包括第二多个字符;以及所述操纵检测组件用于:识别与所述第二数字分量相关联的语言;基于与所述第二数字分量相关联的所述语言来选择第二字典;基于所述第二字典将所述第二多个字符转换成第二字符向量;基于所述第二字符向量中的所述第二多个字符的序列将所述第二数字分量分类成所述多个类别中的第二类别;以及将所述第二数字分量包括在所述响应中。9.根据权利要求1所述的系统,包括所述操纵检测组件用于:接收所述多个数字分量;确定在所述多个数字分量中包括的所述多个候选字符中的每个候选字符的出现次数;以及基于在所述多个数字分量中的所述多个候选字符中的每个候选字符的出现次数来选择在所述多个数字分量中包括的候选字符的所述一部分。10.根据权利要求9所述的系统,其中,在所述多个数字分量中包括的候选字符的所述一部分中的每个候选字符的出现次数大于在所述候选字符的所述一部分中不包括的所述候选字符中的每个候选字符的出现次数。11.根据权利要求1所述的系统,其中,所述第一数字分量是视觉统一资源定位符(vURL)。12.根据权利要求1所述的系统,包括:所述操纵检测组件用于通过使用长短期记忆神经网络来将所述第一数字分量分类成所述多个类别中的所述第一类别。13.根据权利要求1所述的系统,其中,所述字典包括独热编码字符的矩阵,所述独热编码字符包括多个训练数字分量中包括的字符的一部分。14.一种用于限制在网络环境中内容传输的方法:通过数据处理系统接收来自客户端计算装置的内容请求;通过由所述数据处理系统执行的内容选择器组件,基于所述内容请求来选择第一数字分量,所述第一数字分量包括第一多个字符;通过由所述数据处理系统执行的操纵检测组件来检索字典,所述字典包括在多个数字分量中包括的候选字符的一部分的指示;通过所述操纵检测组件基于所述字典将所述第一多个字符转换成字符向量,所述字典包括在所述多个数字分量中包括的所述候选字符的所述一部分的指示;基于所述字符向量中的所述第一多个字符的序列将所述第一数字分量分类成多个类别中的第一类别;通过所述操纵检测组件,基于将所述第一...

【专利技术属性】
技术研发人员:安德烈·莱文刘银涛沙拉斯·阿南特
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1