信息记录材料

首页 > 刊期 > 2025 > 8期 > 综合：探索与发现

基于强化学习的光通信收发设备自适应功率控制系统设计

邹伟，吕甦

【摘要】针对光通信系统中传统功率控制响应滞后和精度不足的问题，本文提出一种基于深度强化学习（ＤＲＬ）的自适应功率控制方法。该方法结合深度确定性策略梯度（ＤＤＰＧ）算法与闭环控制，构建状态感知、策略决策和指令执行三大模块，并设计综合通信质量与能耗的奖励函数。通过离线预训练与在线微调，实现策略的泛化能力和环境适应性。实验表明：该方法在多种通信环境下，误码率降低超过２０％，最低可达１０－６. ３量级，响应时间缩短至９０ｍｓ，平均功耗减少１５％，功率波动稳定在１.５ｄＢ内。结合模型压缩与安全回退，实现了毫秒级实时调节，有效提升了功率控制性能。

【关键字】光通信收发设备；自适应功率控制；强化学习；深度确定性策略梯度（ＤＤＰＧ）算法

【PDF】