数据分类方法技术

技术编号:39729891 阅读:16 留言:0更新日期:2023-12-17 23:33
本公开提供了一种数据分类方法

【技术实现步骤摘要】
数据分类方法、装置、设备、介质、车辆及云端服务器


[0001]本公开涉及数据处理
,尤其涉及一种数据分类方法

装置

设备

介质

车辆及云端服务器


技术介绍

[0002]现有技术中,为了获取用户对产品的口碑,需要从网络上获取大量的舆情数据

如:通过对舆情数据分析,可以得到舆情数据的功能分类,如:车道保持或者车道偏离预警等

但是,上述结果需要人工逐一去分析舆情数据,这样就会出现不同的人在分析相同的舆情数据时,所得到的舆情数据的功能分类存在差异,导致功能分类的分析效率较低


技术实现思路

[0003]为了解决上述技术问题,本公开提供了一种数据分类方法

装置

设备

介质

车辆及云端服务器,用于解决现有技术中在对舆情数据进行分析时,需要人工逐一去分析舆情数据,这样导致舆情数据的分析效率较低的问题

...

【技术保护点】

【技术特征摘要】
1.
一种数据分类方法,其特征在于,包括:获取待分析舆情数据;将所述待分析舆情数据输入至预先配置的主题模型中,确定所述待分析舆情数据在每个功能分类上的第一分类概率;将所述待分析舆情数据输入至预先配置的决策模型中,确定所述待分析舆情数据在每个功能分类上的第二分类概率;对所述第一分类概率和所述第二分类概率进行融合处理,确定所述待分析舆情数据在每个功能分类上的融合概率;根据所述融合分类概率为所述待分析舆情数据匹配对应的功能分类
。2.
根据权利要求1所述的数据分类方法,其特征在于,所述预先配置的主题模型的训练过程如下:获取第一训练样本数据和训练监督数据;其中,所述第一训练样本数据和所述训练监督数据二者均包括至少一条第一舆情数据,每个第一舆情数据包括一个或者多个第一训练分词;针对所述第一训练样本数据中的每个所述第一舆情数据,执行如下操作:将所述第一舆情数据对应的所有第一训练分词输入至隐含狄利克雷分布模型进行训练,得到目标模型;基于所述训练监督数据对所述目标模型进行验证,直至所述目标模型的验证结果满足预设条件,得到所述预先配置的主题模型
。3.
根据权利要求1所述的数据分类方法,其特征在于,所述将所述待分析舆情数据输入至预先配置的主题模型中,确定所述待分析舆情数据在每个功能分类上的第一分类概率,包括:对所述待分析舆情数据进行分词,确定所述待分析舆情数据包括的至少一个第一分词;将所有所述第一分词输入至预先配置的主题模型中,确定所述待分析舆情数据在每个功能分类上的第一分类概率
。4.
根据权利要求1所述的数据分类方法,其特征在于,所述预先配置的决策模型的训练过程如下:获取第二训练样本数据;其中,所述第二训练样本数据包括至少一条第二舆情数据,每个第二舆情数据包括一个或者多个第二训练分词;针对所述第二训练样本数据中的每个所述第二舆情数据,执行如下操作:将所述第二舆情数据对应的所有第二训练分词输入至基于决策树算法的分布式梯度提升框架模型中,依次训练至少一个决策树,直到每个所述决策树的训练残差满足目标条件时,得到预先配置的决策模型
。5.
根据权利要求1所述的数据分类方法,其特征在于,所述将所述待分析舆...

【专利技术属性】
技术研发人员:黄海涛庞鑫单乐天焦俊铭乔举义赵南杜鹏
申请(专利权)人:北京罗克维尔斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1