ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对光通信系统中传统功率控制响应滞后和精度不足的问题,本文提出一种基于深度强化学习(DRL)的自适应功率控制方法。 该方法结合深度确定性策略梯度(DDPG)算法与闭环控制,构建状态感知、策略决策和指令执行三大模块,并设计综合通信质量与能耗的奖励函数。 通过离线预训练与在线微调,实现策略的泛化能力和环境适应性。 实验表明:该方法在多种通信环境下,误码率降低超过 20%,最低可达 10-6. 3 量级,响应时间缩短至 90 ms,平均功耗减少 15%,功率波动稳定在 1.5 dB 内。 结合模型压缩与安全回退,实现了毫秒级实时调节,有效提升了功率控制性能。