ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】为了满足边缘计算环境下大模型部署的实时性与隐私保护需求,本研究提出了融合本地知识库的智能问答系统架构。通过构建 4 层分布式体系,系统采用滑动时间窗负载预测算法实现资源动态调度,引入基于优先级权重的增量式知识更新机制,结合多粒度分类体系优化查询效率。 实验结果表明:相比传统云计算架构,边缘计算使平均响应时延降低 67. 4%,带宽消耗减少 65.1%。在最优节点密度配置下,系统吞吐量提升 48.1%,中央处理器利用率降低 24. 2 个百分点。