理想AI Talk第二季:发布VLA司机大模型 让AI成为生产工具

来源:财经网作者:彭鑫2025-05-14 12:50
导语

李想认为:“判断Agent(智能体)是否真正智能,关键在于它是否成为生产工具。

近日,理想汽车AI Talk第二季开播。

此次访谈主要是围绕VLA(Vision-Language-Action Model,视觉语言行动模型)大模型的作用、训练方法和挑战以及李想本人对人工智能、创业以及个人成长的思考。

WechatIMG997

图源:理想汽车官方

面对智能驾驶这个课题,理想汽车已经准备用VLA大模型来实现破局。李想认为VLA大模型不是单个技术的突破,而是数百项创新的系统集成,更是生物进化的延续,从动物智能到人类智慧的跃迁。

他也回答了为何有至少五家公司正在研发与理想 L9相似的智能产品。

“智能驾驶的未来已成为各大车企争相追逐的热点,市场需求正在促使技术快速迭代和升级。这不仅仅是竞争,更是推动整个行业技术进步的重要动力。目前辅助驾驶虽然处于十字路口,但对理想影响不大,今天的辅助驾驶就像正处于黎明前的黑暗时刻,辅助驾驶行业遇到了问题,恰恰是理想证明自己价值所在的时刻。”李想说道。

AI要进化成生产工具

“人工智能发展这么好,但我每天工作时间并没有减少反而在增加。”

访谈开始,李想就从实际的角度出发说出目前大多数人还是把AI当成了信息工具来使用,这种信息常伴随大量无效信息、无效结果和无效结论,仅具参考价值。

他把AI工具分为三个层级,分别是信息工具、辅助工具和生产工具。

成为辅助工具后,AI可以提升效率,例如现在的辅助驾驶,但仍需人类参与。未来,AI发展为生产工具后,将能独立完成专业任务,显著提升效率与质量。

他认为:“判断Agent(智能体)是否真正智能,关键在于它是否成为生产工具。只有当人工智能变成生产工具,才是其真正爆发的时刻。就像人类会雇佣司机,人工智能技术最终也会承担类似职责,成为真正的生产工具。”

正因如此,理想的VLA大模型应运而生,未来它将成为交通领域专业的生产工具。

据demo演示视频显示,理想的这个 “司机 Agent”展示了和人类司机类似的智能能力,不仅具备现有的优秀辅助驾驶能力,而且还能直接通过语音的方式和人类驾驶员高效交互。

如在通过高速收费站时,直接说出“走人工”三个字,系统就可以从 ETC 收费通道转向人工收费通道,在日常驾驶和泊车环节,也可以通过“前方掉头”、“C 区停车”、“靠边停车”等简单指令,调整行车或泊车的路线。

然而VLA的实现并不是突变的过程而是进化的过程,经历了以下三个阶段。

以理想汽车为例,第一阶段是2021年自然依赖规则算法和高精地图的辅助驾驶,类似“昆虫动物智能”;第二阶段是2023年起研究,并于2024年正式推送的端到端+VLM辅助驾驶,接近“哺乳动物智能”。

WechatIMG1000

图源:理想汽车官方

第三阶段就是VLA即将开启的“人类智能”的阶段。它能通过3D和2D视觉的组合,完整地看到物理世界,而不像VLM仅能解析2D图像。同时,VLA拥有完整的脑系统,具备语言、CoT(Chain of Thought,思维链)推理能力,既能看,也能理解并真正执行行动,符合人类的运作方式。

理想汽车十周年

“创业路上苦多于甜,选择保留那些有价值的美好片段,用来激励自己保持正能量。”李想说道。

他回顾了此前的几次创业经历,认为自己的思维方式仍是如此。

“遇到问题解决问题,解决别人不愿解决的难题,解决用户的痛点,不断向他人学习。不同的是,如今面临的问题更复杂、服务的用户群体更多、公司规模和组织也更庞大。“他说道。

对于AI的发展,李想却认为,在AI面前所有的人性都应被保留,无论好坏,因为一切人性都是文化、生命、性格、能力的特质,也是人类真正的生命力所在。

再过2个月,理想汽车将迎来成立十周年。

编辑:安安

相关新闻

新闻爆料

010-85657230
  • 热门排行
  • 大家喜欢