首页 > 新车报告 > 新车报告 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

新车报告更多>>

极豆科技与中科创达、Rightware达成战略合作,共建智能座舱HMI全栈方案 福特不排除重返轿车市场 因应成本与价格压力 连签20多家改装大牌!首家NAJ京东养车改装中心在武汉开业 荣耀官方提醒Magic8 Pro Air避免使用一体式全包镜头膜 苹果iOS 27系统Siri将升级为完整聊天机器人,不会成独立应用 刘强东与其造车,不如造共享单车 前比亚迪腾势品牌负责人赵长江正式加盟鸿蒙智行-智界汽车 余承东:中国新能源市场50万以上 每卖出10台车就有7辆问界M9 9大车企要卖超1800万台,鸿蒙智行冲刺销量翻番,四家车企瞄准300万年销 扎克伯格改革绩效评级体系:Meta“卓越贡献奖”可获三倍奖金 张文宏:拒绝把AI引入医院病历系统 医生需要训练专业诊断能力 Gartner:英伟达2025年成为首家半导体销售年收入破1000亿美元企业 苹果官宣iPhone将搭载最强AI!马斯克第一个跳出来骂 打破BBA垄断!享界12月冲到中大型车销量榜第四 直追宝马5系 美媒实测:ChatGPT内置应用体验不佳 难撼动苹果App Store地位 罗永浩否认与华为有过节:提遥遥领先是开玩笑 Yann LeCun炮轰Alexandr Wang缺乏经验:Meta AI会有更多人离职 消息称苹果A20芯片单颗成本高达280美元,2nm先进制程芯片恐成“史上最贵” 马斯克引领“比基尼换装”风潮引争议,xAI承认Grok修图功能遭滥用 一骑绝尘:挪威2025年电动汽车渗透率达95.9%,12月接近98% 2025年未能上市!特朗普土豪金T1手机再度推迟 宝马官宣专属独立品牌BMW ALPINA:专属定制、精选材质、标志性驾驶质感 事关债市、稳定币、个人征信等 潘功胜称多项政策举措即将实施 前三季度GDP增长5.6%,首都经济成绩单预示了怎样的未来? 前三季度我国黄金消费量同比下降:金饰遇冷、金条需求仍然旺盛 雷军回应YU7首拆:欢迎同行和专家指点 以“质量基石”护航中国新能源汽车创新与出海,共筑产业“白金标准”​ 曝欧盟拟于12月官宣新规,推动小型电动车平价化 保时捷中国研发中心正式启用,开发周期有望大幅缩短 月薪高达12万!字节发力人形机器人