要闻
理想VLA突破AI“图灵天花板”:当自动驾驶学会“人类式思考”
当全球车企都在训练AI如何更好地执行指令时,一个更贴近社会生活本质的困境浮现了——“如何让算法理解“在弯道限速60km/h的路段,若周围车流保持60kph,自车机械遵守30kph限速反而会成为最危险的移动路障”。这种藏在规则与现实中的思考逻辑,正在成为自动驾驶进化的下一个突破口。
在5月7日的中,李想系统性地拆解了理想汽车的解题逻辑:从技术架构的底层革新到价值观的主动对齐,理想VLA大模型如何重新定义人机共驾的“安全基线”。
当全球自动驾驶研发处于“规则算法”与“端到端”的发展阶段时,一个更隐蔽的技术断层正在显现,即如何让AI从“知道怎么做”进化到“像人类一样思考怎么做”。众所周知,传统应对突发路况往往陷入“精准识别障碍物却不懂让行优先级”的尴尬,这种“算法近视症”暴露了目前行业存在过度追求感知精度,却忽视决策背后价值判断的通病。
而理想汽车则借鉴生物学启示录破局,如哺乳动物的大脑皮层,比昆虫神经节多了“思考为何行动”的模块,VLA大模型利用3D视觉和2D的组合看见更真实的物理世界,甚至可以实现看懂导航软件的运行逻辑,而不仅仅只是执行导航软件的提示动作。此外,由于VLA模型拥有自己的脑系统,它不仅能看到物理世界,更能进一步理解物理世界,具有自己的语言和思维链系统,有推理能力,可以像人类一样去执行一些复杂动作,这项技术突破就像让机器有了“驾驶常识”,不仅能扫描判断前面障碍物的形态,还能读懂救护车顶灯闪烁背后的紧急程度差异。
正如李想所言,“我们只有让它变成一个真正的司机,它才是一个生产力工具,不只是一个辅助工具”。
当同行还在纠结该给AI植入多少万条[*]规则时,理想选择用大量真实数据配合世界模型生成数据,来解决模型的黑盒问题,简单来说就是给VLA司机大模型建立了一个考试的模型,模拟真实的交通环境、城市环境,同时世界模型也承担了VLA的强化训练职责,强化司机大模型的驾驶舒适性、合规性和安全性。通过这种验证方式,理想汽车不仅将人工一万公里验证成本从17万降低到了仅需4000元的纯算力成本,解决问题的效率更是大大提升。
为了减少企业陷入重复造轮子的资源内耗和行业巨头垄断导致的巨额授权费用问题,今年3月,理想宣布开源星环OS操作系统,成为全球首个开放车载系统底层代码的车企,用开源操作系统建立行业“普通话”,以封闭训练框架保留企业“方言权”。在统一数据接口、通信协议后,不同品牌车辆能流畅使用同一套“技术语言”。例如,理想与第三方充电桩企业合作开发的“智能充电联动”功能,正是基于开源系统实现跨指令互通,但核心的驾驶决策模型仍保留品牌特性。这种“统一基建+特色服务”的生态模式,既可以避免资源浪费,又能守住技术创新的护城河。用李想的话来说,“我们的系统足够好,才敢开放给行业。”这一战略平衡之道,不仅优化了行业生态,也为理想在智能驾驶的长期竞赛中积蓄了优势。
回望智能驾驶这场马拉松中,当行业追逐炫酷功能时,理想却选择[*]磕基础能力。李想坦言,受到了DeepSeek最佳实践的启发,当团队想要去构建一个能力的时候,第一步一定是搞研究,研究搞明白以后才能进入研发阶段,更表示“如果连规则算法都做不好,根本不知道怎么训练VLA。”
扎实基础实践能力,是冲击上限和确保下限的重中之重。理想汽车之所以能够实现双Orin-X跟Thor-U 都能运行VLA,正是由于理想汽车有自己的编译团队、有做芯片适配的能力、有PCB设计能力、有做自研操作系统的能力,所以才能实现为双Orin-X创造足够大的带宽,使其同样可以运行VLA模型,而各方面扎实的积累,是这一切的基础。这也正印证了李想提出的:规模小的时候无所谓,你规模大的时候基本功和能力永远是无法逾越的。正是这种“慢功夫”,让理想在关键时刻快人一步。
回望在这场没有终点的进化竞赛,VLA的价值不仅在于提供了一个全自动驾驶的未来发展路径,同时也证明了:当技术革命与人文思考同频共振,冰冷的算法也能生长出温暖的价值理性,这或许是理想对移动的家最深刻的时代诠释。