用于获取、分析和挖掘数据和信息的系统和方法技术方案

技术编号：5344456 阅读：201 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供获取、分析和挖掘感兴趣的数据和／或信息的方法，该方法使用至少一个主要搜索项目搜索至少一个数据库来获得包含感兴趣的信息的数据和／或信息以便获得原始数据集；对该原始数据集应用数据挖掘工具以获得挖掘的数据；和对挖掘的数据应用用户界面以获得感兴趣信息的可视化。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
获取、分析和挖掘感兴趣的数据和/或信息的方法。
技术介绍
获取、处理和挖掘数据很大程度上仍然是人工过程，其利用广泛的人工输入。许多方面已经自动化，但是整个过程还没有集成到一起以便允许搜索者利用一个集成系统来获取、分析和挖掘数据和信息并且得到结论。具有搜索引擎的数据库可以获得，诸如Google、 Dialog 和PubMed。每个数据库具有不同的搜索规则、不同的"通配符"使用和不同的资源，诸如百科全书。所有数据库产生原始数据集，该数据集必须通过直接人工交互或诸如OmniViz的工具进行分析。美国取得了 6070133、 6484168、 6665661、 6718336、 6772170、 6898530和6940509 的专利。但是，这些工具是复杂的，并且要求对数学和计算机编程的一定程度的了解，而这种了解典型搜索者是不具有的。另外，每个工具以不同方式分析数据甚至要求数学和计算机技能的更多知识。另外，每个工具通过专有界面使用公共概念，诸如百科全书或搜索标准。假定能够比较和对比来自不同工具的搜索结果，可以发现这些搜索使用相同的搜索项目、相同的百科全书等。专有界面使得不同工具不能同时利用公共界面、数据和同义词。即使通过人工措施联合使用这些工具，得到的数据分类可能需要更多问题而不是意味着答案。对挖掘的数据的分析的产生，与数据相关的报告和观点的生成，仍然需要密集的人类劳力。从诸如数据库的源取得数据、对数据分类以确定什么是感兴趣的、以及分析所挖掘的数据结果的过程的复杂性导致损失时间。另外人工步骤需要保证工具之间搜索的一致性，这导致获...

【技术保护点】
一种获取、分析和挖掘感兴趣的数据和／或信息的方法，包括以下步骤：　ａ．使用至少一个主要搜索项目搜索至少一个数据库，以便获得包含感兴趣的信息的数据和／或信息以得到原始数据集；　ｂ．对该原始数据集应用数据挖掘工具以获得挖掘的数据；和　ｃ．对挖掘的数据应用用户界面，以便获得感兴趣的信息的可视化。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：CD哈特维希，R马西洛，S基佩尔曼，
申请(专利权)人：维里德克斯有限责任公司，
类型：发明
国别省市：US[美国]

全部详细技术资料下载我是这个专利的主人