MIT 让大模型学会“做计划”：Llama 3 8B 推理准确率飙至 94%

MIT CSAIL 发布 PDDL-Instruct 框架，破解大模型 “嘴炮式计划” 难题 —— 将符号验证器 VAL 融入训练循环，让 Llama-3-8B 先输出可解释的状态 - 动作链，再经 VAL 合法性审计，收到细粒度纠错信号后重新采样。
两轮迭代后，模型规划能力显著提升：Blockworld 任务可行计划率从 46% 升至 94%，Mystery Blockworld 任务性能提升 64 倍，绝对增益达 66%。整个流程无需人工标注，仅靠自动生成的 PDDL 轨迹与验证反馈即可复现。
目前框架已开源代码及 10 万条训练数据，覆盖 20 余种规划场景，虽局限于离散状态空间，但为 “神经 + 符号” 混合推理提供可扩展模板，更换验证器即可适配更多场景。#人工智能#ai #aigc #artificial intelligence#robot #robotics #人工智能产业链联盟#Artificial Intelligence Industry Chain Alliance #ai #artificialintelligence #machinelearning #programming #technology #datascience #computerscience #coding #deeplearning #artificialintelligencetechnology #pythonprogramming #gpt5 #gpt5agi #gpt5chat #gpt5news # gpt5robot #gpt5ai #gpt5openai #chatgpt5 #openaigpt5 #openai #openaichatbotgpt #openaiplayground #openaiapi #openaigpt4#OpenAI #GPT5 #AI #ArtificialIntelligence #Innovation #TechNews #AIResearch #FutureTech #AIRevolution #AIProgress #TechUpdates #SamAltman #Education #EthicalAI #TechBreakthrough #CuttingEdge #AICommunity #TechInsights #AIApplications #techtrends#DeepSeek#宇树机器人#Unitree#Manus#阿里巴巴#Qwen#百度#腾讯#KiMi#Llama-3-8B #MIT CSAIL #PDDL-Instruct 框架 #大模型规划 #符号验证器 VAL #混合推理 #开源模型 #自动训练 #物流调度 #机械臂控制

Видео MIT 让大模型学会“做计划”：Llama 3 8B 推理准确率飙至 94% канала 人工智能产业链联盟