为了快速实现商业化，我们需要做技术和赚钱

日期：2023-10-17 14:41:14 / 人气：411

10月11日，米莉AI日，米莉一次性发布了HP170、HP370、HP570三款智能驾驶产品，最低价格直降3000元，打响了智能驾驶产品的千元价格战。
此外，本次AI日也是DriveGPT发布后的首次升级，而此次升级的重点是如何让大模型“无所不知”，让它更像自动驾驶领域的人类驾驶员。
智能驾驶产品价格跌破万元。
“2023年，中国高级智能辅助驾驶市场迎来大爆发。”墨豪之星董事长张凯给出了新的判断。
张凯表示，目前乘用车的销量和智能化指数都在稳步提升，而智能驾驶的普及率和价格却在反方向提升。L2及以上乘用车市场智能驾驶渗透率为42.4%，2025年将达到70%，并普及到10-20万主销车型。
与此同时，NOA这座城市迎来了一波量产浪潮，目前已占到L2及以上城市辅助驾驶份额的17%，2025年将达到70%。
在我看来，停车和出行分开的硬件设计和一体机将逐渐退出市场，更具性价比的停车和出行一体化的域控方案将成为主流。于是，在这个AI日，米莉发布了“HP170、HP370、HP570”智能辅助驾驶产品，覆盖了千元不同价格区间，分别是:
HP 170:3000元级，可以实现导航和泊车的智能驾驶。计算能力是5TOPS。传感器方案标配1个前视摄像头、4个鱼眼摄像头、2个后角雷达和12个超声波雷达，可选配1个前视雷达和2个前角雷达。
惠普370: 5000元，可实现城市记忆驾驶，记忆停车。计算能力是32TOPS。传感器方案标配2个前视摄像头、2个侧视摄像头、1个后视摄像头、4个鱼眼摄像头、1个前雷达、2个后角雷达和12个超声波雷达，2个前角雷达可以灵活选择。
Hp 570: 8000元级，可实现城市无地图NOH、全场景辅助停车等功能。两个芯片，72TOPS和100TOPS，可用于计算能力。传感器方案标配2个前视摄像头、4个侧视摄像头、1个后视摄像头、4个鱼眼摄像头、1个前置雷达和12个超声波雷达。支持一台激光雷达。
可以看到，蜜莉的三款智能辅助驾驶产品价格都降到了万元以下，最低的3000元。从产品配置来看，Millie在硬件的使用上非常克制，无论是使用运算能力更低的芯片，缩小传感器的尺寸(抛弃激光雷达)，还是将高速无人导航压缩到单个MCU等等。，都是其成本降低的表现。
张凯在会后的沟通中表示，从长远来看，还是视觉+激光雷达的路线。目前是为了更快的将智能驾驶产品推向市场，实现快速商业化的目的。
同时，对于智能驾驶产品的降价，张凯认为这是技术迭代的阶段性结果。基于一些轻量级工作的布局，原本需要在大型计算平台上布局的能力，基本都在中型计算平台上布局了。值得一提的是，除了高通Ride的SA8650芯片，毫米的三款产品使用的芯片还使用了地平线征途3和TI的TDA4。
细节方面，这三款智能辅助驾驶产品预计在2023年和2024年上市，其中8000元级别城市的NOH目前处于功能验证阶段。
在上一个AI日，米莉透露其辅助驾驶产品HPilot已经接到了三家OEM厂商的订单，其中一家是长城汽车，另外两家没有公开。
在这个AI日，米莉给出了旗下辅助驾驶产品HPilot的最新数据:HPilot整体已搭载20多款车型，用户辅助驾驶里程突破8700万公里。其中最新搭载毫米HPilot的车型有山海枪HEV版和新摩卡Hi-4S。
DriveGPT有哪些新进展？
除了宣传商业化趋势，每个AI日的重点也将是技术升级。
上一届AI日，我们推出了自动驾驶领域的生成式大模型DriveGPT，将原有的感知和认知相关的大模型能力融入其中。
DriveGPT大模型上线200天后，其训练数据规模得到进一步提升。截至2023年10月，DriveGPT已经筛选出超过100亿个互联网图像数据集和480万条包括人类驾驶行为在内的自动驾驶4D片段数据。
根据规划，在数据驱动的自动驾驶3.0时代，感知阶段需要通过海量数据训练感知的基础模型，学习和理解客观世界中的各种物体；在认知阶段，通过海量的驾驶员驾驶行为数据学习驾驶常识，通过数据驱动的方法不断迭代提升整个系统的能力水平。
在我看来，人类在驾驶时，不仅要有对基本交通规则的认识，还要有对物理世界的认知能力。如果仅仅基于车辆传感器的数据进行训练，我们无法穷尽各种路况，也无法像人类一样理解万物之间的联系、事件的逻辑以及背后的常识，并基于这些人类的社会经验做出更好的驾驶策略。
基于这样的判断，我们在DriveGPT的基础上，在感知模型上增加了新的图形多模态模型，在认知模型上增加了大语言模型LLM，使其具备了一般感知和一般认知的能力。
在之前的AI DAY上，DriveGPT已经通过构建大的视觉感知模型，包括路面、天气、光照等局部和全局语义信息，将现实世界建模到三维空间，再用时间序列形成四维向量空间，实现了对真实物理世界的学习。
在构建真实物理世界的4D感知的基础上，Millie进一步引入图形和文本的开源多模态模型，构建更通用的语义感知模型，从而实现文本、图形和视频多模态信息的融合，从而完成4D向量空间到语义空间的对齐，实现像人类一样“识别万物”的能力。
智行数据智能科学家何翔举了一个现实的例子。以前的模型只能识别车道线、红色路灯等交通信息，只能识别路面的杂草、塑料袋、猫狗、小动物等障碍物，无法像人类一样理解现实世界。图形多模态模型的引入就是为了解决这个问题。
有了“识别一切”的能力，就要让他们知道被识别物体背后的物理知识。DriveGPT首先通过构造驾驶语言描述驾驶环境和驾驶意图，然后结合导航引导信息和汽车的历史动作，借助外部大语言模型LLM的海量知识辅助给出驾驶决策。
也就是说，当识别杂草时，有必要让他们知道草可以被碾过的物理特性。在认知模型中加入大语言模型LLM，相当于给大模型植入了一个“大脑”来理解和认识，从而做出更像人类的驾驶行为。
毫米CEO顾表示，DriveGPT大模型的技术框架升级将在驾驶场景理解、驾驶场景标注、驾驶场景生成、驾驶场景迁移、驾驶行为解读、驾驶环境预测、车侧模型开发等七大应用中实现。
例如，在驾驶行为的解释上，毫米DriveGPT可以通过引入大语言模型让AI解释其驾驶决策，而毫米只需要通过构建自动驾驶描述数据对大语言模型进行微调，让大语言模型像驾校教练或陪练一样更详细地解释驾驶行为。
当然，上述技术进步是云端层面的升级，如何将能力下放到车端的智能驾驶系统，是一个很大的问题。在我看来，车端的智能驾驶系统会从两个方面进化——循序渐进的全链路建模和循序渐进的大建模。未来车端和云端都是端到端的自动驾驶模式。
据悉，Millie正在尝试使用蒸馏法，即利用大模型输出的伪标签作为监督信号，让车端小模型在云端学习大模型的预测结果，或者通过对齐特征图，让车端小模型在云端直接学习对齐特征图，从而提高车端小模型的能力。
Millicent表示，基于蒸馏法，汽车端的感知效果可以提高五个百分点。
我们既要赚钱，也要做技术。
可以说，每一个AI日都是观察纳米技术进步的窗口，也是看到量产和商业化进展的途径。
结合AI DAY之前的发展可以看出，时代从1.0到3.0的发展，已经构建了一套比较完整的技术框架，构建了自动驾驶数据MANA的智能系统，将感知和认知相关的大模型能力融入到DriveGPT中。
有了技术基础，米莉现在做的就是在这个基础上建一栋楼。Millicent指出，在自动驾驶3.0时代，其特征是大数据和大模型，开发模式是数据驱动的。自动驾驶在云端实现感知大模型和认知大模型能力的突破，逐步将车端各类小模型统一为感知模型和认知模型，同时AI对控制模块建模，再将能力赋能到车端。
当然，再先进的技术，只有量产才能有商业价值。
今年以来，高水平智能驾驶正迎来前所未有的上升期。根据公开数据，许多汽车公司的用户正在快速升级他们的智能驾驶模型。其中，小鹏G6/G9 Max版占比分别达到60%和80%；M7智家新版已预订订单超过33000套，占比近66%。在上个月宝骏发布的云林溪版本中，80%的用户购买了智能驾驶版本。
市场的窗口正在打开，用户对智能驾驶产品的接受度在不断提高。这是智能驾驶大规模普及的黄金期，也是各厂商在市场立足的关键占领期。
不同于以往反应器硬件和性能的玩法，随着价格战一轮又一轮的打响，以更具价格优势的方式开路，成为智能驾驶普及的关键手段。这就不难理解Mimo在本次AI日一次性发布三款千元级智能驾驶产品了。用张凯的话说，“这是Mimo给2023年中国智能驾驶市场的答案。”
就米莉而言，除了技术，还需要钱。但是，最终的结果能有多高，取决于有多少厂商愿意为此买单。
(本文为第一钛媒体App，肖漫撰写，张敏编辑) "

作者：杏彩注册登录官网

为了快速实现商业化，我们需要做技术和赚钱

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →