一种基于大数据的机器学习引擎方法技术

技术编号:26067400 阅读:14 留言:0更新日期:2020-10-28 16:40
本发明专利技术公开了一种基于大数据的机器学习引擎方法,获取外界环境信息、外界环境信息集合、信息处理、创建学习信息大数据库、建立学习知识库、获取机器学习任务、创建交互式学习系统、获取新的学习知识、利用新学知识执行任务,本发明专利技术在创建机器学习信息大数据库时,通过对大数据进行划分和分类的形式,使后续识别机器学习任务信息时能够在大数据库中快速的找寻与之相对应的学习知识,且通过分类的形式来使学习知识分类成学习知识链,使得后续机器学习时能够将其学习任务快速的与对应的学习知识链进行对应,以此来防止学习任务与对应任务的学习知识之间产生差错,进而提高机器学习的整体学习质量和学习效果。

【技术实现步骤摘要】
一种基于大数据的机器学习引擎方法
本专利技术涉及机器学习
,具体为一种基于大数据的机器学习引擎方法。
技术介绍
机器学习是人工智能的一个核心研究领域,是一种利用系统本身进行自我改进的过程,在这个过程中计算机程序的性能随着经验的积累而不断提高,专家、学者们不断提出了各种学习任务算法,这些算法大大提高了计算机从大量数据中提取特征并发现隐含规律的能力,数据挖掘和分析中的机器学习方法的应用越来越广泛,机器学习模型的效果会随着所处理的数据规模越大而越好;但是机器学习时,由于大数据中的数据信息量十分复杂,导致机器学习过程中无法在信息量庞大的数据库中快速的找寻与学习任务相匹配的知识信息,不仅降低了机器学习的速度,同时由于大数据内知识信息量的庞大而导致机器学习的效率和效果降低。
技术实现思路
本专利技术提供一种基于大数据的机器学习引擎方法,可以有效解决上述
技术介绍
中提出但是机器学习时,由于大数据中的数据信息量十分复杂,导致机器学习过程中无法在信息量庞大的数据库中快速的找寻与学习任务相匹配的知识信息,不仅降低了机器学习的速度,同时由于大数据内知识信息量的庞大而导致机器学习的效率和效果降低的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于大数据的机器学习引擎方法,包括如下步骤:S1、获取外界环境信息;S2、外界环境信息集合;S3、信息处理;S4、创建学习信息大数据库;S5、建立学习知识库;S6、获取机器学习任务;S7、创建交互式学习系统;S8、获取新的学习知识;S9、利用新学知识执行任务。基于上述技术方案,所述S1中,获取外界环境信息,通过信息采集元件来获取外部环境中的知识信息;所述S2中,外界环境信息集合,将信息采集元件所获取的外部环境中的知识信息数据进行集合,使散乱的外部环境信息形成集体。基于上述技术方案,所述S3中,信息处理,在外部环境信息集合后,通过知识信息处理器来对环境信息进行滤、排序、关联查询、拆分和数据对比处理,使外部环境信息整合成机器学习的知识;所述S4中,创建学习信息大数据库,将经过信息处理器处理后的学习知识信息通过局域网上传至数据库中,使获取的环境信息进行集中,生成学习信息大数据库。基于上述技术方案,所述S5中,建立学习知识库,具体包括如下步骤:A、根据学习信息领域和类型进行分类;B、依照领域分类生成学习子知识库;C、按照次序生成学习数据链;D、自定义标签。所述A中,在学习信息大数据库创建后,依据学习信息的所属领域和类型来将大数据库中的学习信息进行分类,使大数据库内的学习信息由集中式转换成分布式;所述B中,将分类后的各个分布式学习信息再次根据所属领域和类型来生成学习子知识库,实现将学习信息大数据库转换成多个学习子知识库。基于上述技术方案,所述C中,在学习子知识库创建后,依照各个学习子知识库在学习信息大数据库中的顺序,以五个学习子知识库为一组单元数据链的形式来将各个学习子知识库生成为学习数据链;所述D中,将各个学习子知识库生成的学习数据链,按照次序进行定义标签,实现对各个学习数据链进行标签分类。基于上述技术方案,所述S6中,获取机器学习任务,通过计算机来依据机器自身所学的知识来获取机器学习的任务;所述S7中,创建交互式学习系统,包括交互式学习模型、信息交互模块、信息转换模块、信息传输模块、信息识别和信息反馈模块;所述交互式学习模型,在机器通过计算机获取学习任务后,在计算机内部,建立交互式学习模型,交互式学习模型主要用以将信息进行导入和输出;所述信息转换模块,通过交互式学习模型将机器的学习任务信息输送至信息转换模块,通过信息转换模块来将机器的学习任务信息与学习知识库内的知识信息保持统一格式。基于上述技术方案,所述信息交互模块,在信息转换模块将机器的学习任务信息转换成统一格式后,借助计算机将机器学习的任务信息以文字输入、语音输入和其他输入方式输入到学习知识库;所述信息传输模块,在信息交互模块将学习任务信息传输至学习知识库内后,利用信息传输模块内的传输设备将学习任务信息分别传输至学习知识库内的各个学习数据链内。基于上述技术方案,所述信息识别,在学习任务信息传输至各个学习数据链内后,通过信息识别设备在对应的学习数据链内依据信息的领域和类型来判断与学习任务信息相匹配的学习数据链,并依照自定义标签来确定该学习任务信息对应的学习数据链内的知识信息;所述信息反馈模块,在确定与学习任务信息对应的学习数据链后,通过信息传输设备将对应的学习数据链内的学习知识信息传输至计算机。基于上述技术方案,所述S8中,获取新的学习知识,在计算机获取对应学习数据链内的知识信息后,计算机内部处理器处理后,将对应学习数据链内机器学习的知识信息反馈至机器,实现依据机器的学习信息任务来进行知识学习。基于上述技术方案,所述S9中,利用新学知识执行任务,在机器学习到新的知识信息后,机器利用已获取的知识信息来执行任务,并将该环节的信息反馈至步骤S6,以进一步指导机器学习过程。与现有技术相比,本专利技术的有益效果:本专利技术在创建机器学习信息大数据库时,通过在大数据库中建立学习知识库的形式来将信息量庞大的大数据库信息进行划分,同时依据学习信息的领域和类型再将学习知识库划分成学习知识链,通过对大数据进行划分和分类的形式,来使大数据库中庞大的信息量进行分割独立,以此使得后续识别机器学习任务信息时能够在大数据库中快速的找寻与之相对应的学习知识,以此来提高机器学习整体的学习效率,且通过分类的形式来使学习知识分类成学习知识链,使得后续机器学习时能够将其学习任务快速的与对应的学习知识链进行对应,以此来防止学习任务与对应任务的学习知识之间产生差错,进而提高机器学习的整体学习质量和学习效果;在机器学习时,通过以交互式学习系统来对学习任务信息进行处理,以方便将学习任务信息快速的输入到学习知识库内,并通过将格式进行统一,一方面方便将学习知识库中的学习知识快速的与机器学习任务信息进行匹配联系,另一方便使后续匹配的学习知识信息能够快速的以同一格式输出到机器,以此来提高了机器学习时机器学习任务信息输入和输出的响应速度,进而方便机器快速的学习到学习知识库中的学习知识;在机器学习到新的知识信息后,能够使机器利用已获取的知识信息来执行任务,并将该环节的信息重新反馈机器学习的步骤,以此来方便进一步指导机器学习过程,使得机器学习的过程能够进行循环,实现机器学习的自我更新和不断进步。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1是本专利技术的方法流程图;图2是本专利技术学习知识库的步骤流程图;图3是本专利技术交互式学习系统的结构框图。具体实施方式以下结合附图对本专利技术的优选实施本文档来自技高网...

【技术保护点】
1.一种基于大数据的机器学习引擎方法,其特征在于:包括如下步骤:/nS1、获取外界环境信息;/nS2、外界环境信息集合;/nS3、信息处理;/nS4、创建学习信息大数据库;/nS5、建立学习知识库;/nS6、获取机器学习任务;/nS7、创建交互式学习系统;/nS8、获取新的学习知识;/nS9、利用新学知识执行任务。/n

【技术特征摘要】
1.一种基于大数据的机器学习引擎方法,其特征在于:包括如下步骤:
S1、获取外界环境信息;
S2、外界环境信息集合;
S3、信息处理;
S4、创建学习信息大数据库;
S5、建立学习知识库;
S6、获取机器学习任务;
S7、创建交互式学习系统;
S8、获取新的学习知识;
S9、利用新学知识执行任务。


2.根据权利要求1所述的一种基于大数据的机器学习引擎方法,其特征在于:所述S1中,获取外界环境信息,通过信息采集元件来获取外部环境中的知识信息;
所述S2中,外界环境信息集合,将信息采集元件所获取的外部环境中的知识信息数据进行集合,使散乱的外部环境信息形成集体。


3.根据权利要求2所述的一种基于大数据的机器学习引擎方法,其特征在于:所述S3中,信息处理,在外部环境信息集合后,通过知识信息处理器来对环境信息进行滤、排序、关联查询、拆分和数据对比处理,使外部环境信息整合成机器学习的知识;
所述S4中,创建学习信息大数据库,将经过信息处理器处理后的学习知识信息通过局域网上传至数据库中,使获取的环境信息进行集中,生成学习信息大数据库。


4.根据权利要求1所述的一种基于大数据的机器学习引擎方法,其特征在于:所述S5中,建立学习知识库,具体包括如下步骤:
A、根据学习信息领域和类型进行分类;
B、依照领域分类生成学习子知识库;
C、按照次序生成学习数据链;
D、自定义标签;
所述A中,在学习信息大数据库创建后,依据学习信息的所属领域和类型来将大数据库中的学习信息进行分类,使大数据库内的学习信息由集中式转换成分布式;
所述B中,将分类后的各个分布式学习信息再次根据所属领域和类型来生成学习子知识库,实现将学习信息大数据库转换成多个学习子知识库。


5.根据权利要求4所述的一种基于大数据的机器学习引擎方法,其特征在于:所述C中,在学习子知识库创建后,依照各个学习子知识库在学习信息大数据库中的顺序,以五个学习子知识库为一组单元数据链的形式来将各个学习子知识库生成为学习数据链;
所述D中,将各个学习子知识库生成的学习数据链,按照次序进行定义标签,实现对各个学习数据链进行标签分类。<...

【专利技术属性】
技术研发人员:孙晓伟
申请(专利权)人:闳约深美江苏信息技术开发有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1