用于基于语义的自动挖掘的系统技术方案

技术编号：7318642 阅读：148 留言：0更新日期：2012-05-04 10:43

本发明专利技术一般涉及用于基于语义的自动挖掘的系统，以允许为扩充语义产品而进行的Web挖掘能在用户交互最少的情况下进行。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般涉及用于基于语义的自动挖掘的系统，该系统允许用于扩充语义产品数据的网络挖掘(web mining)在用户交互最少的情况下进行。
技术介绍
今天，万维网(WWW)继续以惊人的速度在通信容量以及Web站点规模和复杂性这两个方面增长。诸如Web站点设计、Web服务器设计以及通过Web站点简单的导航这样的任务的复杂性，也随着其增长而增大。由Tim-Berners-Lee引入的万维网上信息资源的巨大爆炸性增长，需要采用自动化的工具来搜索、提取、过滤以及评估需要的信息和资源。因此，将Web转化为用于电子商务和研究的主要工具，导致创建服务器侧和客户侧智能系统，这些系统可以在互联网特别是Web站点挖掘知识。Web挖掘是应用数据挖掘技术从Web上发现模式。它允许从产品或者与万维网有关的活动中提取感兴趣的和可能有用的模式和暗含的信息。Web挖掘类别其中之一是Wfeb内容挖掘。Web内容挖掘是从Web上的文本、图像、音频或视频数据发现有用信息的过程，并且它包括Web文档的文本挖掘和建立在概念索引或基于代理的技术的基础上的资源发现。它是从文档内容或者它们的描述中提取知识的过程。现在存在两组Web内容挖掘战略，即直接挖掘文档内容和改善其他工具诸如搜索引擎的内容搜索。Web内容挖掘是一种超越关键词提取的自动化过程。目前，万维网主要建立在以超文本标记语言(HTML)写成的文档的基础上，HTML是一种标记协议，用于将散布多媒体对象诸如图像和交互表单的文本主体进行编码。人类能利用Web完成某些任务，诸如以另一种语言寻找英语单词，搜索某本书的题目，或者搜索最新版的书等等。但...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：佩鲁马尔·AL·纳根丹，洲元凯，悦林·阿姆鲁迪恩·阿姆鲁，
申请(专利权)人：马来西亚微电子系统有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人