文档信息选择方法和计算机程序产品技术

技术编号：7144904 阅读：308 留言：0更新日期：2012-04-11 18:40

公开了一种用于根据多个电子文档生成电子文档的方法，所述方法包括：提供包括多个电子文档的数据库，其中所述文档中的每个均包括按语义构造的信息部分；解析所述多个电子文档，以从所述文档中提取语义描述符，每个语义描述符与所述信息部分的其中一个相关；显示所提取的语义描述符的概览，以供用户进行选择；接收用户选择的提取出的语义描述符；从所述多个电子文档中提取与用户选择的语义描述符相关的信息部分；以及将所述提取出的部分组合到另外的电子文档中。所述方法能够在可以构成数据处理系统的一部分的计算机程序产品中实现。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】文档信息选择方法和计算机程序产品
技术介绍
诸如大型数据库和因特网的可扩展计算机系统的引入已经显著地提高了数字信息的易访问性。如今，这样的系统的用户可以访问来自各种各样的不同源的大量信息。然而，这一改进并不是不存在问题。例如，在这样的数字信息系统中尝试找到正确的信息可能远非是普通的任务。尽管可以限定查询来搜索这样的信息系统，然而将该查询限定为使得该查询产生均与所限定的搜索标准相关的仅几个电子文档是非常难的。电子文档可以是利用诸如MS Word和 Acrobat等的文字处理程序所创建的单个文件，或者可以是能够从因特网上的特有URL获取到的信息。因此，这样的信息系统的用户多半会面对不得不搜索大量电子文档以找到和获取感兴趣的信息的艰难任务。已经进行了大量的努力来为这样的信息系统的用户提供被认为是作为查询结果的更简洁的文档集以找到感兴趣的信息，诸如其中根据特殊词语在电子文档中的出现次数与从所谓的加权词语词典中检索到的加权因子的组合来计算该电子文档关于搜索词的相关性的搜索算法。不利的是，这可能仍需要用户检查大量的文档。附图说明以更详细的方式并且利用参考附图的非限制性的示例说明本专利技术的实施例，其中图1示意性地示出本专利技术的方法的实施例的原理；图2示意性地示出本专利技术的方法的实施例的流程图；图3示意性地示出本专利技术的方法的实施例的一个方面的流程图；以及图4示意性地示出根据本专利技术的实施例的数据处理系统。具体实施例方式应当理解的是，附图仅是示意性的，并且不是按比例绘制的。还应当理解的是，贯穿附图使用相同的附图标记来表示相同或相似的部件。图1提供本专利技术的数据处...

【技术保护点】
１．　一种用于根据多个电子文档生成电子文档的方法，包括：提供包括多个电子文档的数据库，其中所述文档中的每个均包括按语义构造的信息部分；解析所述多个电子文档，以从所述文档中提取语义描述符，每个语义描述符与所述信息部分的其中一个相关；显示所提取的语义描述符的概览，以供用户进行选择；接收用户选择的提取出的语义描述符；从所述多个电子文档中提取与用户选择的语义描述符相关的信息部分；以及将所述提取出的部分组合到另外的电子文档中。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员：T雷，
申请(专利权)人：惠普开发有限公司，
类型：发明
国别省市：US

全部详细技术资料下载我是这个专利的主人