ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对大模型在问答系统中面临的全量微调资源消耗高以及垂直领域适应性不足的问题,本研究提出了一种基于低秩自适应/ 量化低秩自适应(LoRA/ QLoRA)技术的创新解决方案。 以深度求索(DeepSeek⁃R1) 为基础模型,结合其动态激活特性,通过LoRA 和 4 位量化 QLoRA 实现参数高效微调,突破传统方法的资源限制。 在医疗问诊、金融数据分析场景中,验证了 LoRA/ QLoRA 的性能与效率平衡能力。 实验结果表明:在保持高精度的同时,该方法将参数量和训练时间显著降低至全量微调的极小比例,有效提升了垂直领域任务的专业性能,并支持在消费级硬件上完成大模型微调。 该方法有效解决了通用模型在专业场景中的适应性问题,为大模型在资源受限场景的实现提供了新的解决方法。