基于自学习大语言模型的城轨车站资源调度决策辅助系统技术方案

技术编号:39058283 阅读:17 留言:0更新日期:2023-10-12 19:51
本发明专利技术公开了基于自学习大语言模型的城轨车站资源调度决策辅助系统,涉及城轨车站资源调度技术领域,现提出如下方案,包括数据收集单元、人员调度优化单元、PPO智能体、本地LLM语言模型和决策方案文本输出单元;本发明专利技术具有更全面的信息理解和生成能力,通过人员调度决策算法与LLM结合,能够更好地理解和生成与人员调度相关的自然语言信息,从而更准确地指导决策过程,而且具有更灵活的决策优化能力,利用LLM的优势来解决复杂的人员调度问题,提供更准确和智能的决策支持,还通过PPO算法与LLM相结合,通过学习海量的文本数据来生成文本,实现自我学习和训练的能力,更好地应对不确定性,从而生成适应各种情况的调度策略。从而生成适应各种情况的调度策略。从而生成适应各种情况的调度策略。

【技术实现步骤摘要】
基于自学习大语言模型的城轨车站资源调度决策辅助系统


[0001]本专利技术涉及城轨车站资源调度
,尤其涉及基于自学习大语言模型的城轨车站资源调度决策辅助系统。

技术介绍

[0002]城市轨道交通是城市公共交通的骨干,具有节能、省地、运量大、全天候、少污染又安全等特点,属绿色环保交通体系。
[0003]轨道调度是指从事轨道交通列车运行组织指挥工作的工作人员根据各行车岗位的运作对车站资源进行指挥和协调,根据运营时刻表执行,根据行车、供电、环控各岗位的运作对车站资源进行职位和协调,监控系统运行状态,处理紧急事件,调整列车运行。
[0004]现有的调度系统通常只能处理结构化数据,而且通常使用确定性规则和算法进行决策优化,但在复杂的人员调度问题中,存在许多约束条件,还存在许多不确定性因素,例如员工的临时请假、任务的突发性质等,传统模型往往难以有效应对这些不确定性,并生成具有鲁棒性的调度方案,而且传统模型可能在处理大规模数据和实时决策时面临效率和实时性的挑战。

技术实现思路

[0005]本专利技术提出的基于自学习大语言模型的城轨车站资源调度决策辅助系统,解决了现有的调度系统通常只能处理结构化数据,而且通常使用确定性规则和算法进行决策优化,但在复杂的人员调度问题中,存在许多约束条件,还存在许多不确定性因素,例如员工的临时请假、任务的突发性质等,传统模型往往难以有效应对这些不确定性,并生成具有鲁棒性的调度方案,而且传统模型可能在处理大规模数据和实时决策时面临效率和实时性的挑战的问题。
[0006]为了实现上述目的,本专利技术采用了如下技术方案:
[0007]基于自学习大语言模型的城轨车站资源调度决策辅助系统,包括数据收集单元、人员调度优化单元、PPO智能体、本地LLM语言模型和决策方案文本输出单元;
[0008]所述数据收集单元用于收集地铁车站历史数据和实时数据,并对数据进行清洗和预处理,所述数据收集单元将处理后的数据分别传输至人员调度优化单元和PPO智能体;
[0009]所述PPO智能体接收数据收集单元传输的历史数据,通过PPO算法学习历史方案产生类似场景的数据并开始自我训练生成新的数据,所述智能体将生成的新数据传输至人员调度优化单元内;
[0010]PPO算法如下:
[0011][0012]θ是策略参数;
[0013]表示随时间步长的经验期望;
[0014]r
t
是新老政策下概率的比值;
[0015]是时间t的估计优势;
[0016]ε是一个超参数,通常为0.1或0.2;
[0017]所述人员调度优化单元接收数据收集单元传输的历史数据和PPO智能体生成的新数据,所述人员调度优化单元通过人员调度优化算法根据历史数据和新数据生成决策方案,并将决策方案传输至本地LLM语言模型内;
[0018]所述本地LLM语言模型接收人员调度优化单元传输的决策方案,所述本地LLM语言模型通过强大的自然语言处理能力和语境理解能力将决策方案重新理解和生成为自然语言文本,并将其传输至决策方案文本输出单元,本地LLM语言模型能够处理自然语言文本,具备强大的语义理解能力,通过人员调度优化单元的人员调度决策算法与LLM结合,我们能够更好地理解和生成与人员调度相关的自然语言信息,从而更准确地指导决策过程;
[0019]通过将人员调度决策算法与本地LLM语言模型结合具有更灵活的决策优化能力,如在复杂的人员调度问题中,存在许多约束条件,例如员工的技能要求、工作时间限制、任务紧急性等,通过结合人员调度决策算法和LLM,更全面地考虑这些约束条件,并生成满足各种限制的更优调度方案;
[0020]通过将人员调度决策算法与LLM结合,利用LLM的计算能力来加速搜索过程,并生成更优的人员调度方案,LLM根据已有知识和数据进行预测和推理,帮助决策算法更有针对性地搜索,从而得到更好的结果;
[0021]在人员调度问题中,存在许多不确定性因素,例如员工的临时请假、任务的突发性质等,通过结合人员调度决策算法和LLM,利用LLM的语言生成能力和上下文理解能力,更好地应对不确定性,从而生成适应各种情况的调度策略;
[0022]所述决策方案文本输出单元接收本地LLM语言模型传输的自然语言文本并将其展示给工作人员查看。
[0023]进一步地,所述数据收集单元中的历史数据和实时数据包括乘客流量和列车运行情况。
[0024]进一步地,所述数据收集单元中的预处理包括分词、标记化、去除噪声和不必要的信息等。
[0025]进一步地,所述本地LLM语言模型的架构具有捕捉语义和上下文信息的功能,且具备的记忆能力。
[0026]进一步地,所述本地LLM语言模型受训练数据的影响对数据中存在的偏见或不平衡进行检测,并将这些问题反映出来,如果训练数据中存在性别或种族偏见,模型生成的文本可能会反映出这些偏见,处理数据的平衡和偏见是训练和应用大型语言模型时的一个重要问题。
[0027]进一步地,所述本地LLM语言模型在生成结果后对生成结果进行过滤和评估,并根据过滤和评估结果采取相应的处理步骤,大型语言模型在生成文本时会出现准确性和一致性的问题,模型可能会生成不准确的信息或矛盾的内容,这可能是由于模型的训练数据中存在错误或矛盾的信息,或者是由于模型自身的局限性导致的,所以需要进行过滤和评估。
[0028]进一步地,所述数据收集单元的输出端与PPO智能体的输入端相连接,所述PPO智能体的输出端与人员调度优化单元的输入端相连接,所述人员调度优化单元的输出端与PPO智能体的输入端相连接,所述人员调度优化单元的输出端与本地LLM语言模型的输入端相连接,所述本地LLM语言模型的输出端与决策方案文本输出单元的输入端相连接。
[0029]与现有的技术相比,本专利技术的有益效果是:
[0030]本系统具有更全面的信息理解和生成能力,通过人员调度决策算法与LLM结合,能够更好地理解和生成与人员调度相关的自然语言信息,从而更准确地指导决策过程,而且具有更灵活的决策优化能力,利用LLM的优势来解决复杂的人员调度问题,提供更准确和智能的决策支持,还通过PPO算法与LLM相结合,通过学习海量的文本数据来生成文本,实现自我学习和训练的能力,更好地应对不确定性,从而生成适应各种情况的调度策略,本系统自动根据数据生成的决策方案,辅助人工判断,为工作人员提供决策建议,本系统通过大型语言模型(LLM)结合智能优化算法,设计并训练出专门应用于轨道交通领域的决策辅助系统,以优化地铁车站人员调度决策。
附图说明
[0031]图1为本专利技术提出的基于自学习大语言模型的城轨车站资源调度决策辅助系统的系统框图。
具体实施方式
[0032]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。
[0033]在本专利技术的描述中,需要理解的是,术语“中心本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于自学习大语言模型的城轨车站资源调度决策辅助系统,其特征在于,包括数据收集单元、人员调度优化单元、PPO智能体、本地LLM语言模型和决策方案文本输出单元;所述数据收集单元用于收集地铁车站历史数据和实时数据,并对数据进行清洗和预处理,所述数据收集单元将处理后的数据分别传输至人员调度优化单元和PPO智能体;所述PPO智能体接收数据收集单元传输的历史数据,通过PPO算法学习历史方案产生类似场景的数据并开始自我训练生成新的数据,所述智能体将生成的新数据传输至人员调度优化单元内;所述人员调度优化单元接收数据收集单元传输的历史数据和PPO智能体生成的新数据,所述人员调度优化单元通过人员调度优化算法根据历史数据和新数据生成决策方案,并将决策方案传输至本地LLM语言模型内;所述本地LLM语言模型接收人员调度优化单元传输的决策方案,所述本地LLM语言模型通过强大的自然语言处理能力和语境理解能力将决策方案重新理解和生成为自然语言文本,并将其传输至决策方案文本输出单元;所述决策方案文本输出单元接收本地LLM语言模型传输的自然语言文本并将其展示给工作人员查看。2.根据权利要求1所述的基于自学习大语言模型的城轨车站资源调度决策辅助系统,其特征在于,所述数据收集单元中的历史数据和实时数据包括乘客流量和列车运行...

【专利技术属性】
技术研发人员:张婷李超扬陈菁菁卜柿瑜黄甲鸣
申请(专利权)人:深圳技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1