数据完整性优化制造技术

技术编号:33213081 阅读:3 留言:0更新日期:2022-04-27 16:49
一种方法包括接收指示用户设备的用户执行指定动作的交互数据,识别与用户相关联的最后时间动作以及与用户和指定动作相关联的初始动作,基于所识别的最后时间和初始动作,与识别的最后时间动作和指定动作相关联的第一属性以及与识别的初始动作和指定动作相关联的第二附加属性,将第一属性和第二附加属性传播到两个或更多个不同的模型,以及基于第一属性和第二附加属性生成第一属性和第二附加属性的一个或多个视觉表示。性的一个或多个视觉表示。性的一个或多个视觉表示。

【技术实现步骤摘要】
【国外来华专利技术】数据完整性优化

技术介绍

[0001]本说明书涉及在为建模目的收集和分析用户数据时的数据处理和保留(preserving)数据完整性。

技术实现思路

[0002]一般而言,本说明书中描述的主题的一个创新方面可以被体现在一种方法中,该方法包括由一个或多个处理器接收指示用户设备的用户执行指定动作的交互数据,由一个或多个处理器识别与用户相关联的最后时间动作和与用户和指定动作相关联的初始动作,由一个或多个处理器并基于识别的最后时间动作和识别的初始动作生成与识别的最后时间动作和指定动作相关联的第一属性以及与识别的初始动作和指定动作相关联的第二附加属性,由一个或多个处理器将第一属性和第二附加属性传播到两个或更多个不同的模型,以及由一个或多个处理器基于第一属性和第二附加属性生成第一属性和第二附加属性的一个或多个视觉表示。
[0003]在一些实施方式中,一个或多个视觉表示包括第一属性的第一视觉表示和第二附加属性的第二不同的视觉表示。在一些实施方式中,第二附加属性的第二不同视觉表示在视觉上不同于第一属性的第一视觉表示。
[0004]在一些实施方式中,识别与用户相关联的最后时间动作以及与用户和指定动作相关联的初始动作包括查询一个或多个交互数据库。
[0005]在一些实施方式中,指定动作包括通过用户界面元素提供用户输入。
[0006]在一些实施方式中,初始动作包括在用户设备上下载和安装应用。
[0007]在一些实施方式中,该方法包括由一个或多个处理器确定所识别的初始动作发生在指定动作发生之前的预定时间段内。<br/>[0008]使用不同模型的系统可能经历由于模型使用不同数据集而产生的差异。例如,当这些系统使用多个模型并且一个模型可以访问另一模型无法访问的数据时,一些系统可能丢失或无法收集应分析的数据。这种数据丢失可能导致差异,特别是当只有一个模型能够收集特定种类的数据时,由于数据丢失或无法访问而导致来自另一模型的错误预测。以下描述讨论了通过确保数据被提供给特定模型或由特定模型访问以改进模型单独和整个系统的准确性来保留数据完整性的技术。此外,这些技术确保将数据复制到适当的系统,使得改进模型的准确性并防止数据丢失。
[0009]可以实施本说明书中描述的主题的特定实施例以实现以下优点中的一个或多个。例如,本说明书中描述的解决方案还通过防止传播不准确来减少数据完整性问题。换句话说,改进的方法为一个模型提供了提供给另一模型的相同数据,使得跨模型使用的数据是一致的。此外,这些方法通过收集和分析比以前使用的更具代表性和更完整的数据集来改进模型的准确性。换句话说,改进的方法允许模型考虑以前未考虑的新因素。此外,该方法扩展模型可用的反馈领域。例如,尽管诸如内容选择模型的模型通常使用特定类型的最新活动数据作为反馈,但是在本说明书中描述的技术允许这些模型使用其他类型的数据和/
或来自更广泛时间窗口的数据,诸如在当前时间之前的预定时间段内发生的活动。
[0010]通过改进这些模型的准确性,计算机减少提供用户不太可能感兴趣的内容或影响用户采取特定动作所需的处理量。此外,通过防止传播不准确或不完整的数据和/或结果,该方法通过减少实现准确结果所需的处理周期数来改进处理模型的系统的效率。
[0011]该方法还提供先前未被考虑或可用于特定模型的数据的视觉指示。通过强调已添加的数据,这些方法允许用户快速轻松地识别新数据以及数据包含在模型中时的任何影响。
[0012]本说明书中描述的主题的一个或多个实施例的细节在附图和以下描述中阐述。本主题的其他特征、方面和优点将从描述、附图和权利要求中变得显然。
附图说明
[0013]图1是用于在数据收集和分析期间优化数据完整性的示例环境的框图。
[0014]图2描绘用于在建模中改进数据完整性的方法的数据流。
[0015]图3是用于在数据收集和分析的建模中改进数据完整性的示例方法的流程图。
[0016]图4是示例计算机系统的框图。
[0017]各个附图中相同的附图标记和名称指示相同的元件。
具体实施方式
[0018]本公开涉及在收集和分析用户数据时优化数据完整性的计算机实现的方法和系统。
[0019]通过用户和内容提供者之间的信息交换和交易,提供者可以接收用户数据,诸如例如用户访问的内容类型、用户上次访问提供者网站的时间以及用户与提供者和/或提供者的网站的交互相关的其他信息。出于此处描述的目的,“内容”指数字内容,包括由内容提供者提供的第三方内容。内容项指特定的一段内容,并且包括用于与用户请求的其他内容一起呈现的数字组件。向用户分发内容的系统可以基于预测内容项目与特定用户的相关性以及用户与内容交互的可能性以及其他因素的模型来选择内容。在一些情况下,系统使用多个模型,但模型不共享数据集。相反,模型是使用不代表所有因素的特定数据集进行训练的。例如,一些模型可能无法访问特定的数据集,并且可能使用不完整的数据集进行训练。与使用更完整数据集的模型相比,使用不完整数据集的模型将产生不准确性,并且在后续建模中继续使用这些模型的结果(诸如对其他模型的输入或对模型本身的反馈)只用于传播不准确。现有的方法没有考虑到特定类型的缺失数据,或者没有收集或无法访问可以改进模型准确性的数据。如本说明书通篇详细描述的,本文的创新技术允许在使用多个模型以访问不同数据集的特定系统中改进数据完整性的技术。
[0020]除了贯穿本文档的描述之外,可以给用户提供有允许用户关于本文中描述的系统、程序或特征是否并何时可以使得能够收集用户信息(例如,关于用户的社交网络、社交动作或活动、专业、用户的偏好、或用户的当前位所的信息)并且用户是否被从服务器发送了内容或通信做出选择的控制。此外,某些数据可以在它被存储或者使用之前被以一个或多个方式处理,使得个人可识别的信息被移除。例如,可以处理用户的身份,使得对用户来说不能够确定个人可识别的信息,或者用户的地理位所可以在获得位所信息的情况下被一
般化(诸如到城市、邮政编码、或州级别),使得不能够确定用户的特定位所。因此,用户可以具有对收集关于用户的什么信息、如何使用该信息并且向用户提供什么信息的控制。
[0021]图1是用于在数据收集和分析期间优化数据完整性的示例环境100的框图。示例环境100包括网络102,诸如局域网(LAN)、广域网(WAN)、因特网或其组合。网络102连接电子文档服务器104(“电子文档服务器”)、用户设备106、数字组件分发系统110(也称为DCDS 110)和隐私服务器120。示例环境100可以包括许多不同的电子文档服务器104和用户设备106。
[0022]用户设备106是能够通过网络102请求和接收资源(例如,电子文档)的电子设备。示例用户设备106包括个人计算机、可穿戴设备、智能扬声器、平板设备、移动通信设备(例如,智能电话)、智能电器和可以通过网络102发送和接收数据的其他设备。在一些实施方式中,用户设备可以包括向用户输出可听信息的扬声器和接受来自于用户的可听输入(例如,口本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:由一个或多个处理器接收指示用户设备的用户执行指定动作的交互数据;由所述一个或多个处理器识别与所述用户相关联的最后时间动作和与所述用户和所述指定动作相关联的初始动作;由所述一个或多个处理器且基于所识别的最后时间动作和所识别的初始动作,生成与所识别的最后时间动作和所述指定动作相关联的第一属性以及与所识别的初始动作和所述指定动作相关联的第二附加属性;由所述一个或多个处理器向两个或更多个不同模型传播所述第一属性和所述第二附加属性;以及由所述一个或多个处理器基于所述第一属性和所述第二附加属性生成所述第一属性和所述第二附加属性的一个或多个视觉表示。2.根据权利要求1所述的方法,其中,所述一个或多个视觉表示包括所述第一属性的第一视觉表示和所述第二附加属性的第二不同视觉表示。3.根据权利要求2所述的方法,其中,所述第二附加属性的所述第二不同视觉表示在视觉上不同于所述第一属性的所述第一视觉表示。4.根据权利要求1所述的方法,其中,识别与所述用户相关联的所述最后时间动作以及与所述用户和所述指定动作相关联的所述初始动作包括查询一个或多个交互数据库。5.根据权利要求1所述的方法,其中,所述指定动作包括通过用户界面元素提供用户输入。6.根据权利要求1所述的方法,其中,所述初始动作包括在所述用户设备上下载和安装应用。7.根据权利要求1所述的方法,进一步包括由所述一个或多个处理器确定所识别的初始动作发生在所述指定动作发生之前的预定时间段内。8.一种系统,包括:一个或多个处理器;以及一个或多个存储器元件,所述一个或多个存储器元件包括在执行时使所述一个或多个处理器执行操作的指令,所述操作包括:由一个或多个处理器接收指示用户设备的用户执行指定动作的交互数据;由所述一个或多个处理器识别与所述用户相关联的最后时间动作和与所述用户和所述指定动作相关联的初始动作;由所述一个或多个处理器且基于所识别的最后时间动作和所识别的初始动作,生成与所识别的最后时间动作和所述指定动作相关联的第一属性以及与所识别的初始动作和所述指定动作相关联的第二附加属性;由所述一个或多个处理器向两个或更多个不同模型传播所述第一属性和所述第二附加属性;以及由所述一个或多个处理器基于所述第一属性和所述第二附加属性生成所述第一属性和所述第二附加属性的一个或多个视觉表示。9.根据权利要求8所述的系统,其中,所述一个或多个视觉表...

【专利技术属性】
技术研发人员:萨特维克
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1