使用神经网络进行数据挖掘制造技术

技术编号:2861206 阅读:175 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种数据挖掘系统和方法。所述系统包括至少一个客户机和服务中介器,其被配置为包括一个接口,用于接收来自所述客户机的查询请求。所述服务中介器将查询请求转发给神经代理,以便调用神经代理的查询,并向客户机转发由神经代理返回的结果对象。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本申请涉及数据挖掘。更具体地说,本申请涉及使用神经网络以及其它的人工智能技术进行数据挖掘。
技术介绍
由于在当今的信息年代计算机和其它信息与通信设备的使用的急剧增加,数值的(numeric)和非数值的(例如文本的)数据被频繁地从许多信息源例如因特网收集。此外,在许多数据库中存在大量的数据。许多数据被采集只用于归档的目的,因此,在许多情况下,这些数据被无组织地存储。在数据的陷阱(morass)中进行过滤而提取用于特定用途的有用的信息是一个严峻的挑战。例如,企业方面的需求不断增加,以便保持其在商务市场上的竞争力,从而从他们和/或其它人已经收集的数据中有效地分析和提取有用的信息,并利用所述提取的信息改善企业的操作。不过,这通常是一个使人胆怯的任务。数据挖掘是分析大量的数据,以便从这些数据中提取有用的信息,例如通过新的数据进行预测(也称为预测分析)。可以获得若干个数据挖掘产品。不过,当前允许在Web上对大量信息进行数据挖掘的商业产品要求客户应用程序维持一个预测模型,尽管服务中介器(service broker)可以收集或存储原始数据并根据需要将其转发给客户。因为客户必须维持所述预测模型,当执行应用程序时,客户机的资源可能被击溃。
技术实现思路
本申请提供一种数据挖掘系统。在一个实施例中,所述数据挖掘系统包括客户机和服务中介器,其被配置为包括一个接口,用于接收来自所述客户机的查询请求。所述服务中介器将查询请求(consultation request)转发给神经代理(Neugent),以便调用神经代理的查询。在神经代理被查询之后,服务中介器向客户机转发由神经代理返回的对象。服务中介器还包括训练接口,并通过所述训练接口接收来自客户的训练请求,所述训练请求包括训练数据。服务中介器把包括训练数据的训练请求转发给神经代理,以便利用所述训练数据调用神经代理的训练。训练请求可以包括用于规定一个比值的参数,以便在训练神经代理和测试或验证神经代理之间分配所述训练数据。在神经代理的训练之后,服务中介器可以向客户机转发由神经代理返回的训练结果对象。本申请还提供一种用于对远程客户机提供服务以便查询神经代理的方法。在一个实施例中,所述方法包括接收来自远程客户机的查询请求,把所述查询请求转发给神经代理,以便调用神经代理的查询,并把由神经代理返回的结果对象转发给远程客户机。本申请还提供一种用于向远程客户机提供服务而训练神经代理的方法。按照一个实施例,所述方法包括接收来自远程客户机的训练请求,向神经代理转发所述训练请求,以便调用神经代理的训练,并向远程客户机转发由神经代理返回的训练结果对象。附图说明本专利技术的特征从下面结合附图进行的详细说明将会更加清楚地理解,其中图1A是按照本专利技术的一个实施例的数据挖掘系统的方块图;图1B是按照本专利技术的另一个实施例的数据挖掘系统的原理图;图2A是按照一个实施例的用于向一个远程客户机提供查询一个神经代理的业务的流程图;图2B是按照一个实施例的用于向一个远程客户机提供训练一个神经代理的业务的流程图;图3是一个函数链网络的原理图;图4A和4B是按照一个实施例的用于值预测神经代理的web业务接口方法的等级图;图5A、5C、5E、5G、5I表示按照另一个实施例的用于分类的神经代理类的目标模式(object schemas);以及图5B、5D、5F、5H、5J和5K表示用于神经代理类的web业务接口的分类图;图6A、6C、6E、6G、6I表示按照第三个实施例的用于分类的神经代理类的目标模式;图6B、6D、6F、6H、6J和6K表示按照第三实施例的用于神经代理类的web业务接口的分类图;图7A-7F表示按照第四实施例的用于分类的神经代理类的web业务接口的分类算法;图7G表示按照第四实施例的用于值预测神经代理的目标模式;图8A、8D、8F、8H和8J表示按照第五实施例的用于分类的神经代理类的目标模式;图8B、8C、8G、8I和8K表示按照第五实施例的用于神经代理类的web业务接口的分类算法;图9A表示按照第六实施例的用于值预测的神经代理的目标模式;图9B、9C表示按照第六实施例的用于值预测神经代理的web业务接口的分类算法;图10A、10C到10F表示按照第七实施例的用于分类的神经代理类的web业务接口的分类算法;以及图10B表示按照第七实施例的用于值预测神经代理的目标模式。具体实施例方式本申请提供用于数据挖掘的工具(呈系统和方法的形式)。例如,所述工具可以包括一个或几个计算机程序或软件模块,它们被存储在常规的程序存储装置或计算机可读的介质中,和/或通过计算机网络或其它传输介质被传输。下面参照图1A按照客户机-服务器形式说明一种数据挖掘系统。不过应当理解,本申请的工具不限于客户机-服务器编程模型,并且可被修改用于对等系统,信息传递系统,以及其它的编程模型。数据挖掘系统10包括客户机11,一个或几个神经代理13,以及服务中介器15。服务中介器15可被配置为一个服务器,并包括用于接收来自客户机的查询请求的接口。服务中介器还可接收来自客户机的训练请求,并且一般是(虽然不一定)远程服务器。神经代理13将在下面进一步说明。参照图1A和2A说明按照一个实施例的用于向远程客户机提供服务以便查询神经代理的方法。在服务中介器15从远程客户机接收查询请求之后(步骤S21),服务中介器把查询请求转发给神经代理13,从而调用神经代理的查询(步骤S22)。在神经代理13被查询之后,服务中介器15向客户机转发由神经代理返回的结果对象(步骤S23)。按照一个实施例的查询请求包括用于查询神经代理13的数据。神经代理13进行包括在所述查询请求中的数据的预测分析。按照另一个实施例,查询请求包括查询神经代理13的数据源的识别。神经代理13进行从在查询请求中被识别的数据源获得的输入数据的预测分析。按照另一个实施例,服务中介器是一个远程服务器。从客户机11到所述远程服务器的查询请求可以包括可扩展的标记语言文档。神经代理可以是服务器侧。下面参照图1A和2B说明按照一个实施例的用于向远程客户机提供服务以便训练一个神经代理的方法。在服务中介器15收到来自远程客户机的训练请求之后(步骤S26),服务中介器把训练请求转发给神经代理15,以便调用神经代理的训练(步骤S27)。在神经代理被训练之后,服务中介器向客户机转发由神经代理返回的训练结果对象(步骤S28)。神经代理可以把训练数据模式(pattern)分成群集(cluster),每个群集相应于一组类似的数据模式,并对于一个输入模式是一个选择的组的成员的概率进行预测。神经代理可以把训练非数值(例如文本)模式分成群集,每个群集相应于一组类似的非数值模式,并对于一个输入的非数值模式是一个选择的组的成员的概率进行预测。神经代理可以借助于把训练数据模式分成多个群集来形成群集模型,每个群集相应于一组类似的数据模式,并确定每个群集从所述的群集转换到每个其它群集的概率。神经代理通过对群集模型施加一个输入模式来预测发生事件的概率。神经代理可以形成一个和一组训练数据模式相关的输入-输出模型,并通过对一个输入模式应用所述模型预测一个输出值。神经代理可以包括一个函数链网络(functional-link net)。神经代理可以形成和本文档来自技高网...

【技术保护点】
一种数据挖掘系统,包括:客户机;以及服务中介器,其被配置为包括一个接口,用于接收来自所述客户机的查询请求,其中所述服务中介器将查询请求转发给神经代理,以便调用神经代理的查询,并向客户机转发由神经代理返回的结果对象。

【技术特征摘要】
【国外来华专利技术】US 2002-4-19 60/374,064;US 2002-4-19 60/374,020;US1.一种数据挖掘系统,包括客户机;以及服务中介器,其被配置为包括一个接口,用于接收来自所述客户机的查询请求,其中所述服务中介器将查询请求转发给神经代理,以便调用神经代理的查询,并向客户机转发由神经代理返回的结果对象。2.如权利要求1所述的系统,其中所述查询请求包括用于查询所述神经代理的数据。3.如权利要求2所述的系统,其中所述神经代理对包括在查询请求中的数据执行预测分析。4.如权利要求1所述的系统,其中查询请求包括用于查询所述神经代理的数据源的识别。5.如权利要求4所述的系统,其中神经代理对从在查询请求中识别的源获得的输入数据执行预测分析。6.如权利要求1所述的系统,其中所述服务中介器通过所述接口接收来自客户机的训练请求,所述训练请求包括训练数据,并把包括训练数据的训练请求转发给神经代理,以便利用所述训练数据调用神经代理的训练。7.如权利要求6所述的系统,其中训练请求包括用于规定在训练神经代理和测试神经代理之间分配所述训练数据的一个比值的参数。8.如权利要求6所述的系统,其中在训练神经代理之后,服务中介器向客户机转发由神经代理返回的训练结果对象。9.如权利要求1所述的系统,其中神经代理把训练数据模式分成群集,每个群集相应于一组类似的数据模式,并预测一个输入模式是一个选择的组的成员的概率。10.如权利要求1所述的系统,其中神经代理把训练非数值模式分成群集,每个群集相应于一组类似的非数值模式,并预测一个输入非数值模式是一个选择的组的成员的概率。11.如权利要求1所述的系统,其中神经代理通过把训练数据模式分成多个群集,每个群集相应于一组类似的数据模式,并对每个群集确定从该群集转换到每个其它群集的概率来形成群集模型,并通过对群集模型应用一个输入模式来预测发生事件的概率...

【专利技术属性】
技术研发人员:杨谦音译查里斯爱德华加罗法洛约格什古普塔罗那德卡斯基尔克威尔逊伊格尔塞杜克汗
申请(专利权)人:计算机联合思想公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1