ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对城市轨道交通传统固定运行图缺乏自适应能力的问题,本文提出“韧性密度”概念,将调度目标从传统的最小化延误转向最大化系统内在维持与恢复能力,实现了从“治已病”到“治未病”的范式转变。 通过建立一个部分可观察马尔可夫博弈的严谨数学模型,并创新性地提出一种平均场元强化学习框架,该框架通过元学习应对环境非平稳性,利用平均场理论解决多智能体维度灾 难。 结果表明:该框架在韧性密度(0.82)、运营效率(185 s乘客平均等待时间)、恢复能力(20 min)等核心指标上全面优于对比算 法,为构建新一代智能调度系统奠定了理论基础,推动了轨道交通调度理论向“韧性培育”的深刻转变。