ISSN 1009-5624 CN 10-2021/TQ    主管:中国乐凯集团有限公司    主办:北京乐凯科技有限公司

中国知网全文收录期刊
万方数据库收录期刊
RCCSE中文学术期刊
维普资讯网/超星域出版 全文收录
中国核心期刊(遴选)数据库收录期刊
首页 > 刊期 > 2026 > 2期 > 信息:理论与观点
基于大语言模型与工具学习的层次化思维树评估方法
高晨,刘耀东,王超

摘要针对大语言模型LLM能力评估维度单一灵活性不足及难以适应开放域复杂任务的问题本研究提出一种基于LLM与工具学习的层次化思维树评估方法该方法通过动态构建思维评估树精准定位知识领域并分解评估问题采用工具增强的节点评估机制自主调用外部工具获取信息最终聚合节点结果生成综合性评估报告结果表明该方法能显著提升评估维度的多样性结果的可解释性以及对复杂任务的适应能力为大模型评估提供了动态可靠的解决方案

【关键字】大语言模型(LLM);工具学习;思维树;检索增强生成;自动化评估
【PDF】