一种利用分类文本来确定机器学习算法结果目标类型的优化方法及系统技术方案

技术编号:27975683 阅读:56 留言:0更新日期:2021-04-06 14:09
本发明专利技术公开了一种利用分类文本来确定机器学习算法结果目标类型的优化方法及系统,包括步骤一,语言处理;步骤二,分类目标;步骤三,生成文本;步骤四,性能测量;步骤五,学习算法;步骤六,确定结果;该利用分类文本来确定机器学习算法结果目标类型的优化方法及系统包括以下过程:将文本进行自然语言化处理,确定文本的特征及其之间的关系;分类器基于文本的特征和特征间关系确定一个目标类型,将文本特征及其关系输入到不同的机器学习算法中计算结果,并对每个结果进行评价;最终选择至少一种机器学习算法产生的与目标类型高度相关的结果,通过本发明专利技术方法将多种机器学习算法进行整合,可有效提高结果输出精度。

【技术实现步骤摘要】
一种利用分类文本来确定机器学习算法结果目标类型的优化方法及系统
本专利技术涉及智能识别
,具体为一种利用分类文本来确定机器学习算法结果目标类型的优化方法及系统。
技术介绍
现有的文本主要信息提取是利用机器学习算法执行语义分析或从非结构化数据中提取结构化信息;例如,可能希望通过机器分析产品的描述来确定产品的特征;然而,现有的分析方法和模型不能很好地契合文本中主要内容信息;因此;当前的文本分析技术不能很好地从冗长的文本中推断文本目标类型;而且,目前很多机器学习模型完成给定的文本分析任务过于复杂,可能会导致过度拟合模型和过度拟合训练数据集;因此,需要探索从长文本中提取结构更优的算法;针对这些缺陷,设计一种利用分类文本来确定机器学习算法结果目标类型的优化方法及系统是很有必要的。
技术实现思路
本专利技术的目的在于提供一种利用分类文本来确定机器学习算法结果目标类型的优化方法及系统,以解决上述
技术介绍
中提出的问题。为了解决上述技术问题,本专利技术提供如下技术方案:一种利用分类文本来确定机器学习算法结果目标类型的优化本文档来自技高网...

【技术保护点】
1.一种利用分类文本来确定机器学习算法结果目标类型的优化方法,包括步骤一,语言处理;步骤二,分类目标;步骤三,生成文本;步骤四,性能测量;步骤五,学习算法;步骤六,确定结果;其特征在于:/n其中上述步骤一中,对文本进行自然语言处理,确定文本中的特征及特征间关系;/n其中上述步骤二中,分类,基于文本的关系和特征使用分类器对文本进行分类,从多个目标类型中确定最优目标类型;/n其中上述步骤三中,将文本中确定的特征和及特征关系输入不同的机器的学习算法来生成文本的结果;/n其中上述步骤四中,对于每种机器的学习算法,确定由机器的学习算法产生的性能测量值;/n其中上述步骤五中,确定至少一种能够生成具有性能测...

【技术特征摘要】
1.一种利用分类文本来确定机器学习算法结果目标类型的优化方法,包括步骤一,语言处理;步骤二,分类目标;步骤三,生成文本;步骤四,性能测量;步骤五,学习算法;步骤六,确定结果;其特征在于:
其中上述步骤一中,对文本进行自然语言处理,确定文本中的特征及特征间关系;
其中上述步骤二中,分类,基于文本的关系和特征使用分类器对文本进行分类,从多个目标类型中确定最优目标类型;
其中上述步骤三中,将文本中确定的特征和及特征关系输入不同的机器的学习算法来生成文本的结果;
其中上述步骤四中,对于每种机器的学习算法,确定由机器的学习算法产生的性能测量值;
其中上述步骤五中,确定至少一种能够生成具有性能测量高度相关目标类型的机器的学习算法;
其中上述步骤六中,从所确定的至少一个机器的学习算法至少一个结果中确定结果。


2.一种利用分类文本来确定机器学习算法结果目标类型的系统,包括计算机装置(1)、主内存(2)、储存器(10)、处理单元(14)、网络适配器(15)、I/O接口(16)和显示(17),其特征在于:所述计算机装置(1)内部设置有主内存(2),所述主内存(2)由运算系统(3)、最终结果(4)、结果生成器(5)、输入文本(6)、目标分类器(7)、预估结果(8)、机器学习算法(9)、运行内存(11)、存储系统(12)和缓存(13)组成,且运算系统(3)、最终结果(4)、结果生成器(5)、输入文本(6)、目标分类器(7)、预估结果(8)、机器学习算法(9)、储存器(10)、运行内存(11)、存储系统(12)和缓存(13)均通过信号连接,所述主内存(2)底部设置有储存器(10),且储存器(10)与运算系统(3)通过信号连接,所述主内存(2)一侧设置有处理单元(14),且处理单元(14)与运算系统(3)通过信号连接,所述处理单元(14)底部设置有网络适配器(15)、I/O接口(16)和显示(17),且处理单元(14)、网络适配器(15)、I/O接口(16)和显示(17)均通过信号连接。


3.根据权利要求1所述的一种利用分类文本来确定机器学习算法结果目标类型的优化方法,其特征在于:所述步骤一种其中文本包含问题以及相应的回答,多个目标类型包括正确率、精度、召回率和执行时间。


4.根据权利要求1所述的一种利用分类文本来确定机器学习算法结果目标类型的优化方法,其特征在于:所述步骤二中其中确定目标类型包括通过对文本进行自然语言处理确定文本中的特征,以及对每个目标类型进行评分,所确定的目标类型包括得分最高的目标类型。


5.根据权利要求1所述的一种利用分类文本来确定机器学习算法结果目标类型的优化方法,其特征在于:所述步骤二中其中得分目标类型包括:检测文本是否包含在本体深度中具有高度特异性的特征,同时,确定该精度目标类型得分是否相对于其他目标类型高。


6.根据权利要求1所述的一种利用分类文本来确定机器学习算法结果目标类型的优化方法,其特征在于:所述步骤二中其中得分目标类型:确定文本是否包括在本体深度上具有高度一般性的特征,确定召回率目标类型的得分是否相对高于其他目标类型。


7.根据权利要求1所述的一种利用分类文本来确定机器学习算法结果目标类型的优化方法,其特征在于:所述步骤二中其中得分的目标类型包括:确定文本是否具有包含与特征相关的数值特征,包括医疗状况,在确定该特征与医疗状况有关的数值时,正确率目标类型得分相对高于其他目标类型。

【专利技术属性】
技术研发人员:李环梁展豪王春张足生刘晓蔚廖婷婷
申请(专利权)人:东莞理工学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1