理想MindVLA大模型:开启自动驾驶新时代

近日,理想汽车在NVIDIA GTC 2025大会上正式发布了其下一代自动驾驶技术——MindVLA大模型。这一创新成果标志着自动驾驶技术的一次重大飞跃,其融合了视觉、语言和行为三大智能,开创了机器人大模型的新范式。
1、技术特点
MindVLA大模型的核心优势在于其整合了视觉、语言和行为三大智能。通俗来说,它是一个能够看到、听到并且做到的系统。例如,它可以在陌生车库中自主漫游找车位并完成泊车,还能根据驾驶员的语音指令如“开快点、开慢点、左拐、右拐”等进行相应操作。此外,用户甚至可以给它发送地标照片,它能够按图索骥找到目的地。
理想mindvla大模型:开启自动驾驶新时代
2、技术架构
MindVLA大模型采用了MindGPT作为语言基座。其语音指令通过座舱的ASR转换为文字后输入给MindVLA。这一设计继承了MindGPT在语言理解与交互领域的优势能力,如语义解析、逻辑推理等,并针对自动驾驶场景进行了专项优化。它实现了智舱与智驾在功能层面的协同创新,而非系统层的完全融合。
理想mindvla大模型:开启自动驾驶新时代
3、应用前景
对于用户而言,MindVLA让汽车不再仅仅是一个交通工具,而是一个能够听懂用户说话、看懂用户需求并帮助解决问题的“专职司机”。对于汽车行业来说,MindVLA的出现可能会像当年的iPhone4一样,重新定义未来的出行方式。在人工智能领域,MindVLA的到来将使车成为连接物理世界和数字世界的桥梁,这种技术可能会应用到更多领域,进而改变我们的生活。
理想mindvla大模型:开启自动驾驶新时代
4、发布计划
MindVLA大模型预计将在2025年7月份与理想i8车型同时首发。配备AD Max系统的车辆可以提供高级辅助驾驶和全场景NOA的功能,除了能够运行目前的端到端+VLM大模型之外,也将支持今年后续会推出的更强大的MindVLA大模型。

AD:精心整理了2000+好用的AI工具!点此获取

相关推荐