为了快速实现商业化,我们需要做技术和赚钱

日期:2023-10-17 14:41:14 / 人气:219


10月11日,米莉AI日,米莉一次性发布了HP170、HP370、HP570三款智能驾驶产品,最低价格直降3000元,打响了智能驾驶产品的千元价格战。
此外,本次AI日也是DriveGPT发布后的首次升级,而此次升级的重点是如何让大模型“无所不知”,让它更像自动驾驶领域的人类驾驶员。
智能驾驶产品价格跌破万元。
“2023年,中国高级智能辅助驾驶市场迎来大爆发。”墨豪之星董事长张凯给出了新的判断。
张凯表示,目前乘用车的销量和智能化指数都在稳步提升,而智能驾驶的普及率和价格却在反方向提升。L2及以上乘用车市场智能驾驶渗透率为42.4%,2025年将达到70%,并普及到10-20万主销车型。
与此同时,NOA这座城市迎来了一波量产浪潮,目前已占到L2及以上城市辅助驾驶份额的17%,2025年将达到70%。
在我看来,停车和出行分开的硬件设计和一体机将逐渐退出市场,更具性价比的停车和出行一体化的域控方案将成为主流。于是,在这个AI日,米莉发布了“HP170、HP370、HP570”智能辅助驾驶产品,覆盖了千元不同价格区间,分别是:
HP 170:3000元级,可以实现导航和泊车的智能驾驶。计算能力是5TOPS。传感器方案标配1个前视摄像头、4个鱼眼摄像头、2个后角雷达和12个超声波雷达,可选配1个前视雷达和2个前角雷达。
惠普370: 5000元,可实现城市记忆驾驶,记忆停车。计算能力是32TOPS。传感器方案标配2个前视摄像头、2个侧视摄像头、1个后视摄像头、4个鱼眼摄像头、1个前雷达、2个后角雷达和12个超声波雷达,2个前角雷达可以灵活选择。
Hp 570: 8000元级,可实现城市无地图NOH、全场景辅助停车等功能。两个芯片,72TOPS和100TOPS,可用于计算能力。传感器方案标配2个前视摄像头、4个侧视摄像头、1个后视摄像头、4个鱼眼摄像头、1个前置雷达和12个超声波雷达。支持一台激光雷达。
可以看到,蜜莉的三款智能辅助驾驶产品价格都降到了万元以下,最低的3000元。从产品配置来看,Millie在硬件的使用上非常克制,无论是使用运算能力更低的芯片,缩小传感器的尺寸(抛弃激光雷达),还是将高速无人导航压缩到单个MCU等等。,都是其成本降低的表现。
张凯在会后的沟通中表示,从长远来看,还是视觉+激光雷达的路线。目前是为了更快的将智能驾驶产品推向市场,实现快速商业化的目的。
同时,对于智能驾驶产品的降价,张凯认为这是技术迭代的阶段性结果。基于一些轻量级工作的布局,原本需要在大型计算平台上布局的能力,基本都在中型计算平台上布局了。值得一提的是,除了高通Ride的SA8650芯片,毫米的三款产品使用的芯片还使用了地平线征途3和TI的TDA4。
细节方面,这三款智能辅助驾驶产品预计在2023年和2024年上市,其中8000元级别城市的NOH目前处于功能验证阶段。
在上一个AI日,米莉透露其辅助驾驶产品HPilot已经接到了三家OEM厂商的订单,其中一家是长城汽车,另外两家没有公开。
在这个AI日,米莉给出了旗下辅助驾驶产品HPilot的最新数据:HPilot整体已搭载20多款车型,用户辅助驾驶里程突破8700万公里。其中最新搭载毫米HPilot的车型有山海枪HEV版和新摩卡Hi-4S。
DriveGPT有哪些新进展?
除了宣传商业化趋势,每个AI日的重点也将是技术升级。
上一届AI日,我们推出了自动驾驶领域的生成式大模型DriveGPT,将原有的感知和认知相关的大模型能力融入其中。
DriveGPT大模型上线200天后,其训练数据规模得到进一步提升。截至2023年10月,DriveGPT已经筛选出超过100亿个互联网图像数据集和480万条包括人类驾驶行为在内的自动驾驶4D片段数据。
根据规划,在数据驱动的自动驾驶3.0时代,感知阶段需要通过海量数据训练感知的基础模型,学习和理解客观世界中的各种物体;在认知阶段,通过海量的驾驶员驾驶行为数据学习驾驶常识,通过数据驱动的方法不断迭代提升整个系统的能力水平。
在我看来,人类在驾驶时,不仅要有对基本交通规则的认识,还要有对物理世界的认知能力。如果仅仅基于车辆传感器的数据进行训练,我们无法穷尽各种路况,也无法像人类一样理解万物之间的联系、事件的逻辑以及背后的常识,并基于这些人类的社会经验做出更好的驾驶策略。
基于这样的判断,我们在DriveGPT的基础上,在感知模型上增加了新的图形多模态模型,在认知模型上增加了大语言模型LLM,使其具备了一般感知和一般认知的能力。
在之前的AI DAY上,DriveGPT已经通过构建大的视觉感知模型,包括路面、天气、光照等局部和全局语义信息,将现实世界建模到三维空间,再用时间序列形成四维向量空间,实现了对真实物理世界的学习。
在构建真实物理世界的4D感知的基础上,Millie进一步引入图形和文本的开源多模态模型,构建更通用的语义感知模型,从而实现文本、图形和视频多模态信息的融合,从而完成4D向量空间到语义空间的对齐,实现像人类一样“识别万物”的能力。
智行数据智能科学家何翔举了一个现实的例子。以前的模型只能识别车道线、红色路灯等交通信息,只能识别路面的杂草、塑料袋、猫狗、小动物等障碍物,无法像人类一样理解现实世界。图形多模态模型的引入就是为了解决这个问题。
有了“识别一切”的能力,就要让他们知道被识别物体背后的物理知识。DriveGPT首先通过构造驾驶语言描述驾驶环境和驾驶意图,然后结合导航引导信息和汽车的历史动作,借助外部大语言模型LLM的海量知识辅助给出驾驶决策。
也就是说,当识别杂草时,有必要让他们知道草可以被碾过的物理特性。在认知模型中加入大语言模型LLM,相当于给大模型植入了一个“大脑”来理解和认识,从而做出更像人类的驾驶行为。
毫米CEO顾表示,DriveGPT大模型的技术框架升级将在驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解读、驾驶环境预测、车侧模型开发等七大应用中实现。
例如,在驾驶行为的解释上,毫米DriveGPT可以通过引入大语言模型让AI解释其驾驶决策,而毫米只需要通过构建自动驾驶描述数据对大语言模型进行微调,让大语言模型像驾校教练或陪练一样更详细地解释驾驶行为。
当然,上述技术进步是云端层面的升级,如何将能力下放到车端的智能驾驶系统,是一个很大的问题。在我看来,车端的智能驾驶系统会从两个方面进化——循序渐进的全链路建模和循序渐进的大建模。未来车端和云端都是端到端的自动驾驶模式。
据悉,Millie正在尝试使用蒸馏法,即利用大模型输出的伪标签作为监督信号,让车端小模型在云端学习大模型的预测结果,或者通过对齐特征图,让车端小模型在云端直接学习对齐特征图,从而提高车端小模型的能力。
Millicent表示,基于蒸馏法,汽车端的感知效果可以提高五个百分点。
我们既要赚钱,也要做技术。
可以说,每一个AI日都是观察纳米技术进步的窗口,也是看到量产和商业化进展的途径。
结合AI DAY之前的发展可以看出,时代从1.0到3.0的发展,已经构建了一套比较完整的技术框架,构建了自动驾驶数据MANA的智能系统,将感知和认知相关的大模型能力融入到DriveGPT中。
有了技术基础,米莉现在做的就是在这个基础上建一栋楼。Millicent指出,在自动驾驶3.0时代,其特征是大数据和大模型,开发模式是数据驱动的。自动驾驶在云端实现感知大模型和认知大模型能力的突破,逐步将车端各类小模型统一为感知模型和认知模型,同时AI对控制模块建模,再将能力赋能到车端。
当然,再先进的技术,只有量产才能有商业价值。
今年以来,高水平智能驾驶正迎来前所未有的上升期。根据公开数据,许多汽车公司的用户正在快速升级他们的智能驾驶模型。其中,小鹏G6/G9 Max版占比分别达到60%和80%;M7智家新版已预订订单超过33000套,占比近66%。在上个月宝骏发布的云林溪版本中,80%的用户购买了智能驾驶版本。
市场的窗口正在打开,用户对智能驾驶产品的接受度在不断提高。这是智能驾驶大规模普及的黄金期,也是各厂商在市场立足的关键占领期。
不同于以往反应器硬件和性能的玩法,随着价格战一轮又一轮的打响,以更具价格优势的方式开路,成为智能驾驶普及的关键手段。这就不难理解Mimo在本次AI日一次性发布三款千元级智能驾驶产品了。用张凯的话说,“这是Mimo给2023年中国智能驾驶市场的答案。”
就米莉而言,除了技术,还需要钱。但是,最终的结果能有多高,取决于有多少厂商愿意为此买单。
(本文为第一钛媒体App,肖漫撰写,张敏编辑) "

作者:杏彩注册登录官网




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT 杏彩娱乐 版权所有