机器学习特征数据处理方法及相关设备技术

技术编号:44612004 阅读:26 留言:0更新日期:2025-03-14 13:03
本公开提供了一种机器学习特征数据处理方法及相关设备,涉及人工智能技术领域。该方法包括:获取多个用户针对开放式口语评测题型输入的原始语音数据;从原始语音数据中提取包含第一数量维度语音特征的第一语音特征数据;根据每个维度的语音特征与口语评测结果之间的相关度,从第一语音特征数据中筛选出包含第二数量维度语音特征的第二语音特征数据,第二数量维度小于第一数量维度;根据第二语音特征数据构建多个语音特征集,采用包裹法从多个语音特征集中筛选出包含第三数量维度语音特征的语音特征集作为自定义语音特征集,以对口语评测模型进行机器学习。本公开能优化训练口语评测模型的特征数据,使训练后的模型在性能和效率方面都大幅提升。

【技术实现步骤摘要】

所属的技术人员能够理解,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。基于同一专利技术构思,本公开实施例中还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的机器学习特征数据处理方法。由于该电子设备实施例解决问题的原理与上述方法实施例相似,因此该电子设备实施例的实施可以参见上述方法实施例的实施,重复之处不再赘述。下面参照图15来描述根据本公开的这种实施方式的电子设备1500。图15显示的电子设备1500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图15所示,电子设备1500以通用计算设备的形式表现。电子设备1500的组件可以包括但不限于:上述至少一个处理单元1510、上述至少一个存储单元1520、连接不同系统组件(包括存储单元1520和处理单元1510)的总线1530。其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元15本文档来自技高网...

【技术保护点】

1.一种机器学习特征数据处理方法,其特征在于,包括:

2.根据权利要求1所述的机器学习特征数据处理方法,其特征在于,在根据所述第二语音特征数据,构建多个语音特征集,采用包裹法从所述多个语音特征集中筛选出用于对口语评测模型进行机器学习的自定义语音特征集之后,所述方法还包括:

3.根据权利要求2所述的机器学习特征数据处理方法,其特征在于,在根据所述自定义语音特征集,对轻量级梯度提升机LightGBM模型进行训练,得到针对开放式口语评测题型进行评测的口语评测模型之后,所述方法还包括:

4.根据权利要求3所述的机器学习特征数据处理方法,其特征在于,在获取目标用...

【技术特征摘要】

1.一种机器学习特征数据处理方法,其特征在于,包括:

2.根据权利要求1所述的机器学习特征数据处理方法,其特征在于,在根据所述第二语音特征数据,构建多个语音特征集,采用包裹法从所述多个语音特征集中筛选出用于对口语评测模型进行机器学习的自定义语音特征集之后,所述方法还包括:

3.根据权利要求2所述的机器学习特征数据处理方法,其特征在于,在根据所述自定义语音特征集,对轻量级梯度提升机lightgbm模型进行训练,得到针对开放式口语评测题型进行评测的口语评测模型之后,所述方法还包括:

4.根据权利要求3所述的机器学习特征数据处理方法,其特征在于,在获取目标用户针对开放式口语评测题型输入的待评估语音数据之后,所述方法还包括:

5.根据权利要求4所述的机器学习特征数据处理方法,其特...

【专利技术属性】
技术研发人员:汪福安刘文
申请(专利权)人:北京天学网教育科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1