首页 > 新车报告 > 新车报告 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

新车报告更多>>

广东佛山市委政策研究室招考专业技术雇员公告 广东河源市消防救援支队2025年第一批政府专职消防员招聘86人公告 2025年广东河源职业技术学院招聘博士研究生5人公告 云南大理永平县思源实验学校公益性岗位招聘公告 2025年陕西渭南市事业单位招聘191人公告 云南临沧耿马傣族佤族自治县委社会工作部招聘编外人员公告 2025年吉林白山市县事业单位招聘应征入伍高校毕业生14人公告 2025年湖南株洲市芦淞区面向应届生招聘教师30人公告 超30家车企推出促销降价,春节买车谁家更划算? 吉利再添新爆款,银河L6 EM-i和银河L7 EM-i亮相 10万块纯电车最重要的是什么?埃安UT鹦鹉龙给出一个答案 2024车企年销量盘点,谁一骑绝尘?谁再创新高? 2024十大“网红”新车,火起来都是有原因的! 揽月轮胎磨内衬?星途:极限场景中,个别车辆出现轻微擦碰 阿维塔06上市倒计时,2025年上半年这三款新车要来了 自主品牌2024年销量排名出炉,多家车企创历史纪录! Simone Trazzi:中国市场发展迅速,要以创造性和灵活性提供高标准服务 | 第六届金辑奖 · 中国汽车产业影响力人物 丰田汽车将投资至少16亿美元改造泰国工厂,以生产混动车 CES 2025:大陆集团将展示最新SDV、自动驾驶等技术 长安汽车大动作,牵手亿航智能布局飞行汽车 特斯拉因胎压监测系统缺陷在美国召回近70万辆汽车 本田与软银合作测试蜂窝网络V2X技术 以预防交通事故 秦L、海豹06终端销量大降,吉利超12万辆创新高 非夕打造自适应机器人汽车充电方案 赋能新能源出行生态 2024年重庆市忠县卫生事业单位招聘应届生23人公告 2025年云南玉溪元江县教育体育系统招聘教师19人公告 2024年北京石油化工学院辅导员及管理岗招聘14人公告 2024年首都医科大学附属北京朝阳医院招聘2人公告 2024年广西贵港市平南县赴外招聘中学教师77人公告 2025年云南玉溪市元江县卫生健康系统招聘事业单位工作人员33人公告