用于众包领域特定情报的设备、系统和方法技术方案

技术编号:13238116 阅读:51 留言:0更新日期:2016-05-15 00:30
本公开提供用于众包领域特定情报的设备、系统和方法。所公开的众包机制可以接收领域特定情报作为数据处理规则模块。例如,数据分析系统可以请求一群软件开发者提供被调整得适于处理来自特定领域的特定类型信息的数据处理规则模块。当数据分析系统从软件开发者之一接收用于特定领域的数据处理规则模块时,数据分析系统可以使用所接收的数据处理规则模块来处理与该特定领域相关联的信息。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】与相关申请的交叉引用根据35U.S.C.§119(e),本申请要求享有以下申请的在先申请日:.美国临时专利申请,序列号61/799,986,申请日为2013年3月15日,专利技术名称为“用于分析和使用基于位置的行为的系统”;.美国临时专利申请,序列号61/800,036,申请日为2013年3月15日,专利技术名称为“地理位置描述符和链接符”;.美国临时专利申请,序列号61/799,131,申请日为2013年3月15日,专利技术名称为“用于众包领域特定情报的系统和方法”;.美国临时专利申请,序列号61/799,846,申请日为2013年3月15日,专利技术名称为“具有分批处理和实时数据处理的系统”;以及.美国临时专利申请,序列号61/799,817,申请日为2013年3月15日,专利技术名称为“用于向位置实体分配分数的系统”。本申请还与以下申请有关:.美国专利申请,序列号14/214,208,申请日与本申请的申请日相同,专利技术名称为“用于分析对象实体的移动的设备、系统和方法”;.美国专利申请,序列号14/214,296,申请日与本申请的申请日相同,专利技术名称为“用于提供位置信息的设备、系统和方法”;.美国专利申请,序列号14/214,213,申请日与本申请的申请日相同,专利技术名称为“”;.美国专利申请,序列号14/214,219,申请日与本申请的申请日相同,专利技术名称为“用于分批处理和实时数据处理的设备、系统和方法”;.美国专利申请,序列号14/214,309,申请日与本申请的申请日相同,专利技术名称为“用于分析感兴趣的实体特性的设备、系统和方法”;以及.美国专利申请,序列号14/214,231,申请日与本申请的申请日相同,专利技术名称为“用于分组数据记录的设备、系统和方法”。上述所引用的每个申请的全部内容(包括临时申请和正式申请)通过引用包含在本文中。
本公开总的涉及用于众包(“crowdsourcing”)领域特定情报的系统和方法。
技术介绍
每天都会创建大量信息。社交网络站点和博客站点每天都会接收上百万的新发布,并且正在不断创建新的网页以提供关于个人、地标、商业或任何其它人们关注的实体的信息。此外,信息通常不是可以从单个资源库获得,而是通常分布在经常遍布全世界的上百万个资源库中。由于信息的巨大体量和分布的本质,人们很难有效消费信息。针对解决此问题,数据分析系统可以(I)使用网络爬虫收集信息,以及(2)创建有意义的信息概要从而使得信息可以容易被消费。要创建这样的有意义的概要,数据分析系统通常预处理(或清理)信息从而从所收集的信息中检测(例如查找或锚定)和取回(例如抽取)相关数据。为此目的,数据分析系统可以使用数据处理模块来搜索具有已知格式或结构的数据。遗憾的是,某些特定领域中数据的格式或结构能够是按照非常规方式的。因此,必须使用领域特定情报来调整数据处理模块以适应特定领域,从而使得数据处理模块能够从大量信息中检测相关数据。遗憾地是,单个软件程序员可能不具有领域特定情报,也不具有针对所有感兴趣的领域来恰当修改数据处理模块的能力。因此,需要用于向数据处理模块提供领域特定情报的有效机制。
技术实现思路
—般来说,一方面,所公开的主题的实施例可以包括设备。设备被配置为众包来自多人的领域特定情报。设备可以包括一个或多个接口,所述接口被配置为提供与第一多个计算装置和第二多个计算装置的通信,其中,所述第一多个计算装置中的一个由具有特定领域知识的所述多人中的一人操作。设备还可以包括处理器,所述处理器与所述一个或多个接口通信并且被配置为运行一个或多个模块。所述一个或多个模块可操作使得所述设备从所述第一多个计算装置接收多个数据处理规则(DPR)模块,其中,所述多个DPR模块中的一个被调整得适于在特定领域中使用,并且所述多个DPR模块中的一个由所述多人中的一人基于所述特定领域知识来提供;以及将所述多个DPR模块组合到第一DPR模块包中从而将所述特定领域知识提供为包。—般来说,一方面,所公开的主题的实施例可以包括用于众包来自多人的领域特定情报的方法。所述方法可以包括由设备中的一个或多个接口提供与第一多个计算装置和第二多个计算装置的通信,其中,所述第一多个计算装置中的一个被配置为由具有特定领域知识的所述多人中的一人操作;在所述设备中的数据处理规则众包(DPRC)模块处接收来自所述第一多个计算装置的多个数据处理规则(DPR)模块,其中,所述多个DPR模块中的一个被调整得适于在特定领域中使用,并且所述多个DPR模块中的一个由所述多人中的一人基于所述特定领域知识来提供;以及将所述多个DPR模块组合到第一DPR模块包中从而将所述特定领域知识提供为包。—般来说,一方面,所公开的主题的实施例可以包括非瞬时性计算机可读介质。非瞬时性计算机可读介质可以包括可执行指令,所述可执行指令可操作使得数据处理设备由所述设备中的一个或多个接口提供与第一多个计算装置和第二多个计算装置的通信,其中,所述第一多个计算装置中的一个被配置为由具有特定领域知识的多人中的一人操作;在所述设备中的数据处理规则众包(DPRC)模块处接收来自所述第一多个计算装置的多个数据处理规则(DPR)模块,其中,所述多个DPR模块中的一个被调整得适于在特定领域中使用,并且所述多个DPR模块中的一个由所述多人中的一人基于所述特定领域知识来提供;以及将所述多个DPR模块组合到第一 DPR模块包中从而将所述特定领域知识提供为包。在本文所公开的实施例的任意一个中,所述设备、方法或非瞬时性计算机可读介质可以包括模块、步骤或可执行指令以用于向所述第二多个计算装置发送DPR模块请求,请求所述第二多个计算装置提供用于预定领域的DPR模块,其中,所述DPR模块请求包含指示所请求的DPR模块的功能需求的信息。在本文所公开的实施例的任意一个中,所述设备、方法或非瞬时性计算机可读介质可以包括模块、步骤或可执行指令以用于从所述第二多个计算装置中的一个接收所请求的DPR模块并且确定所请求的DPR模块满足所述功能需求。在本文所公开的实施例的任意一个中,所述设备、方法或非瞬时性计算机可读介质可以包括模块、步骤或可执行指令以用于从所述第二多个计算装置中的一个接收所请求的DPR模块,其中,所述第二多个计算装置中的一个配置为确定由所述设备接收的DPR模块满足所述功能需求。在本文所公开的实施例的任意一个中,所述多个DPR模块配置为在虚拟机上操作。在本文所公开的实施例的任意一个中,所述多个DPR模块配置为在能够运行从两个或更多个语言编译的机器代码的系统上操作。在本文所公开的实施例的任意一个中,所述设备、方法或非瞬时性计算机可读介质可以包括模块、步骤或可执行指令以用于向与所述设备通信的服务器发送所述第一 DPR模块包以用于在所述服务器处使用。在本文所公开的实施例的任意一个中,所述多个DPR模块中的一个被配置为调用在第二 DPR模块包中的DPR模块,并且所述设备、方法或非瞬时性计算机可读介质可以进一步包括用于维持所述第一 DPR模块包和所述第二 DPR模块包之间的依赖关系的模块、步骤或可执行指令。在本文所公开的实施例的任意一个中,所述设备、方法或非瞬时性计算机可读介质可以包括模块、步骤或可执行指令以用于向所述服务器发送除了所述第一 D本文档来自技高网
...

【技术保护点】
一种被配置为众包来自多人的领域特定情报的设备,所述设备包括:一个或多个接口,其被配置为提供与第一多个计算装置和第二多个计算装置的通信,其中,所述第一多个计算装置中的一个由所述多人中具有特定领域知识的一人操作;以及处理器,其与所述一个或多个接口通信并且被配置为运行一个或多个模块,所述一个或多个模块可操作使得所述设备:从所述第一多个计算装置接收多个数据处理规则(DPR)模块,其中,所述多个DPR模块中的一个被调整得适于在特定领域中使用,并且所述多个DPR模块中的一个由所述多人中的一人基于所述特定领域知识来提供;以及将所述多个DPR模块组合到第一DPR模块包中从而将所述特定领域的知识提供为包。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J·苏B·西马诺夫斯基
申请(专利权)人:美国结构数据有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1