一种基于文字识别和决策树算法的煤价趋势判断方法技术

技术编号：37607111 阅读：14 留言：0更新日期：2023-05-18 11:59

本发明专利技术的一种基于文字识别和决策树算法的煤价趋势判断方法，属于机器学习技术领域。包括S101，预先获取原始报价单数据；S102，转为数值型数据；S103，将数值型数据转为模型可用的特征；S104，确定样本的类别属性；S105，划分训练数据和测试数据；S106，针对训练数据，计算基尼指数；S107，选择根节点；S108，生成决策树模型；S109，将测试集数据传入上述决策树模型，评估模型拟合较好；S110，将此模型布到移动端展示结果。通过历史数据及专业判断训练出煤价趋势判断模型，可以更快、更精准的判断当日煤价的涨跌情况，提高了下游客户判断煤价趋势的效率和准确率，进而做出更精准的采购决策来降低成本。低成本。低成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文字识别和决策树算法的煤价趋势判断方法

[0001]本专利技术属于机器学习
，具体来说是一种基于文字识别和决策树算法的煤价趋势判断方法。

技术介绍

[0002]煤炭被誉为“工业的粮食”，是众多下游行业的重要原材料，对整个工业系统有举足轻重的作用。而煤炭采购成本又是很多下游客户生产经营中最大的成本，所以煤炭价格趋势判断对于下游客户采购决策与成本控制有很大意义。
[0003]目前下游客户对于当日煤价涨跌趋势多为经验判断和业务感知，如果可以通过历史数据及专业判断训练出煤价趋势判断模型，就可以帮助下游客户更精准的判断当日煤价趋势，从而做出更准确的采购决策。

技术实现思路

[0004]1.专利技术要解决的技术问题
[0005]本专利技术的目的在于解决现有的当日煤价趋势判断不准确的问题。
[0006]2.技术方案
[0007]为达到上述目的，本专利技术提供的技术方案为：
[0008]一种基于文字识别和决策树算法的煤价趋势判断方法，
[0009]包括如下步骤：
[0010]S101，预先获取原始报价单数据；
[0011]S102，对原始图数据通过OCR文字识别技术进行解析，转为数值型数据；
[0012]S103，基于算法和业务经验，将数值型数据转为模型可用的特征；
[0013]S104，利用多名业务人员的丰富经验来确定样本的类别属性；
[0014]S105，划分训练数据和测试数据；
[0015]S106，针...

【技术保护点】

【技术特征摘要】
1.一种基于文字识别和决策树算法的煤价趋势判断方法，其特征在于，包括如下步骤：S101，预先获取原始报价单数据；S102，对原始图数据通过OCR文字识别技术进行解析，转为数值型数据；S103，基于算法和业务经验，将数值型数据转为模型可用的特征；S104，利用多名业务人员的丰富经验来确定样本的类别属性；S105，划分训练数据和测试数据；S106，针对训练数据，计算每个特征的每个切分点对应的基尼指数；S107，选择基尼指数最小的特征及其对应的切分点作为根节点；S108，根据根节点将数据集划分为两部分，分别对应两个子节点，重复S106和S107两个步骤，生成决策树模型；S109，将测试集数据传入上述决策树模型，评估模型拟合较好；S110，将此模型布到移动端展示结果。2.根据权利要求1所述的一种基于文字识别和决策树算法的煤价趋势判断方法，其特征在于：所述步骤S101中获取的数据主要为图片数据，其中包括供应商名称、块形、煤价数据。3.根据权利要求1所述的一种基于文字识别和决策树算法的煤价趋势判断方法，其特征在于：所述步骤S103中基于算法和业务经验将数值型数据转为特征，具体为将价格上涨供应商占比、价格下跌供应商占比、价格上涨块形占比、价格下跌块形占比转换为价格变动的供应商占比差和价格变动的块形占比。4.根据权利要求1所述的一种基于文字识别和决策树算法的煤价趋势判断方法，其特征在于：所述步骤S105基于当前...

【专利技术属性】
技术研发人员：张欢，周敏，杨震威，张龙宇，潘浩，
申请(专利权)人：内蒙古荣通数链煤炭科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人