当前位置: 首页 > 专利查询>微软公司专利>正文

使用web门户的内容采集自动化系统技术方案

技术编号:2855059 阅读:208 留言:0更新日期:2012-04-11 18:40
所描述的是实现使用web门户的内容采集自动化过程的技术和机制。该过程允许内容提供者访问广域网上的位置,并与一个或多个资源交互来上传文档。在该过程内,自动化了由人员执行的若干任务。例如,文档自动与对应于提交的法律条款相耦合,并在提交时归档。以此方式,避免了对于哪些条款应用于提交的不确定性。另外,内容自动连接到编辑上管理的内容查看和发行系统。

【技术实现步骤摘要】

下文描述的各实施例一般涉及通过广域网的数据的电子传输,尤其但不排它地涉及使用web门户的数据采集自动化系统。
技术介绍
因特网是一种用于向非常多的用户,甚至在世界各地散布信息或文档的极其有效的机制。实际上,当今最复杂的软件开发者以某一方式将因特网集成到其软件产品中。实际上,许多软件开发者现今已通过因特网使用于更新或增强其软件产品的某些机制可用。这一机制的一个示例目前在模板或其它标准化文档可用于特定开发者的一套产品性软件的用户下载时使用。该产品性软件的用户可能期望不包括在所购买的产品性软件中的特定表单或模板。软件开发者可使附加模板或表单在可通过该产品性套件访问的因特网上的某一位置上可用。在一个示例中,可使补充日历模板或特殊预算表单在线可用。产品性套件的用户理解由软件开发者变得可用的附加内容。这一类型的后继服务有助于使用户理解其在软件中的投资,由此向开发者提供了竞争性优势。在许多情况下,所提供的内容由开发者容易地生成。例如,反病毒程序的制造者可能是创建新病毒定义的最佳候选者。然而,在某些情况下,开发者不是内容的最佳来源。例如考虑提供办公室产品性解决方案的软件开发者的情况。开发者可能期望提供补充的商业模板来提高软件用户的效率。然而,产品性套件的开发者就职业而言作为一个程序员,可能不是用于生成商业模板的最佳来源。在那些情况下,开发者可与第三方提供者合伙来提供专门化的内容,该第三方提供者可以是个人,是特定主题领域的专家。这些安排通过允许每一方集中于其专长的特定领域、开发软件或创建高质量的内容,充分利用了专门化的知识。通常,这些合伙通过向不知道其服务的消费者展示内容提供者,并允许软件开发者以极少的费用或免费提供高质量的内容,创建了共生关系。尽管通常是有益的,然而这些安排遭受至少一个问题现有技术使从若干各异的来源累积内容的过程变得尤其繁重和劳动密集型。换言之,选择与内容提供者合伙的软件开发者必须投入实际的人员来与每一潜在内容提供者处的人员接口。内容的实际交换使用用于数据交换的特别机制来处理。换言之,电子邮件通信可以是与一个内容提供者的所选择的通信手段,而另一个可选择在诸如光盘等数据介质上传送数据。必须以不同的方式处理每一关系使该过程变得低效。此外,内容的传送常规地与各方之间的许可协定相耦合。这些许可证通常频繁地改变,因此正确地确定什么条款被附加到一特定的提交有时候是困难的,这是因为正确地确定提交什么时候发生有时候是困难的。另外,该过程依赖于人员将内容的传送与许可证的执行同时耦合的勤奋,且人员经常会出错。直到现在,本领域的技术人员仍无法理解避免手动累积用于包括在软件开发者在线分发服务中的内容的劳动密集型过程的机制。
技术实现思路
本专利技术针对实现使用web门户的内容采集自动化过程的技术和机制。简言之,该过程允许内容提供者访问广域网上的位置,并与一个或多个资源交互来上传文档。在该过程中,自动化了由人员执行的若干任务。例如,文档自动与对应于提交的任何法律条款耦合,并在提交时被归档。以此方式,避免了对于哪些条款应用于该提交的不确定性,并且在提交时自动从内容提供者收集关于该提交的描述性元数据。另外,内容自动连接到编辑上管理的内容审阅和发行系统。附图说明参考附图描述了非限制和非穷尽实施例,贯穿附图,相同的标号指相同的部件,除非另外指定。图1是概括地示出了用于执行自动化内容采集的系统的功能框图。图2是更详细示出以上结合图1所介绍的web门户的功能框图。图3是更详细示出以上结合图1所介绍的后端服务器的功能框图。图4是示出可在开发者站点处用于向软件开发者提交文档的示例提交表单的概念图。图5是概括地示出用于自动化内容采集的过程500的操作流程图。图6示出了可用于实现本专利技术的示例计算设备。具体实施例方式以下描述针对一种自动化的内容采集系统。一般而言,提供了一种web门户,内容提供者可通过该web门户来向实体(例如,软件开发者)提交文档,并且提交与该提交的适用条款的当时最新的版本一起归档。现在将描述该一般概念的具体实现。图1是概括地示出了用于执行自动化内容采集的系统100的功能框图。系统100中包括的是客户机计算系统102、在内容提供者108的控制下的计算系统、以及开发者站点150。这些元素的每一个通过诸如因特网112等广域网连接。客户机计算系统102包括由软件开发者制造并销售的已安装软件应用程序104。在一个示例中,软件应用程序104是包括文字处理程序、电子表格程序等的产品性套件。另外,软件应用程序104被配置成从由软件开发者维护的内容服务器180检索增强的内容。增强内容的示例包括新模板或表单等等。内容提供者108是在向软件开发者提供包括在内容服务器180中的内容的企业或个人的控制下的计算系统。贯穿本文档,术语“内容提供者”可互换地使用,来表明内容提供者计算系统108或操作内容提供者计算系统108的企业或个人。这是为了简化本讨论起见,并且该术语的互换使用不暗示或应当推断出任何重要性或相关性。在本示例中,内容提供者108向软件开发者提供表示增强内容的文档111。内容提供者通常在某一领域中具有特定的专业知识,并且在该领域中向软件开发者提供增强的内容。在一个具体示例中,内容提供者可在法律行业中具有特定的专家知识,并可向软件开发者提供法律表单或模板。类似地,内容提供者可以在不动产行业中具有特定的专业知识,并且可向软件开发者提供不动产表单等等。在本示例中,文档111表示内容提供者108提供给软件开发者的增强内容。尽管此处被称为“文档”,然而所提供的内容可采用许多不同的形式,诸如剪贴画、文本帮助信息等。为本申请的目的,术语“文档”指包括可从网站服务的内容的任何数字文件或数据编译。开发者站点150是可通过因特网112对其它计算系统可用的站点,以访问由软件开发者变得可用的某些信息。例如,软件开发者使软件应用程序104的增强内容可从内容服务器180上获得。如上所述,内容可以采用模板形式或其它形式,它们由软件开发者104使用,但是最初未安装在软件应用程序104中。本示例中的内容服务器180可由因特网112的一般用户,如客户机计算系统102访问。另外,客户机计算系统102上的软件应用程序104的用户可通过对软件应用程序104的普通使用来访问内容服务器180上的内容。开发者站点150也包括web门户152,若干内容提供者,如内容提供者180可使用该web门户来向软件开发者提供要包括在内容服务器180中的文档。与内容服务器180不同,web门户152可由选择的用户可能使用认证或登录机制来访问。web门户152可用于使关于软件应用程序的开发信息对内容提供者可用。例如,软件开发者可使软件开发工具包(“SDK”)可用于从web门户152下载,并使回答许多开发相关问题的常见问题可用。另外,web门户152可提供一种允许内容提供者108将内容上传到开发者站点150的上传机制。开发者站点150也包括后端服务器156,它是不能通过因特网112直接访问的计算系统。后端服务器156包括可用于控制采集内容的自动化过程的过程管理器158。后端服务器156使用常规的联网机制耦合至web门户152和内容服务器180。后端服务器156包括用于永久储存不是用于通过因特网112的公本文档来自技高网
...

【技术保护点】
一种用于内容采集的计算机实现的方法,包括:启动用于从内容提供者自动采集文档的内容采集事件,所述文档与软件产品相关联;向所述内容提供者提示应用于所述内容采集事件的合约条款;从所述内容提供者接收所述文档;以及将所述合约条款结合所述文档一起自动归档到永久归档存储中。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:I欧里奥丹JA莱德贝特汉尼鲍尔MA阿巴尔P金奇TA梁
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1