图说:商汤绝影首次亮相北京车展 采访对象供图
2024北京国际汽车展览会正在举办中,上海人工智能企业商汤绝影携系列原生态大模型及相关产品矩阵首次亮相北京车展。
作为首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影在本届车展上首次向公众展示了面向量产的端到端自动驾驶解决方案UniAD的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示了通用人工智能技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未来出行全新体验。
商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示,未来汽车智能化的竞争,本质上是通用人工智能技术融合应用的比拼。
“像人一样开车”
商汤及其联合实验室在2022年底提出了行业首个感知决策一体化自动驾驶通用模型UniAD,并在次年荣获国际计算机视觉与模式识别会议最佳论文。
此次北京车展上,商汤绝影以UniAD自动驾驶解决方案的实车测试成果展现了中国端到端智驾的实力。在无高精地图条件下,仅依靠视觉感知,无论是复杂城市道路还是无中线的乡村道路上,车辆能高效准确地完成包括大角度左转上桥、避让占道车辆及施工区域、绕行跑步行人等一系列高难度操作,做到“像人一样开车”。
图说:搭载UniAD方案的车辆可真正做到“像人一样开车”
当前,行业需要真正的端到端自动驾驶方案——基于规则的智驾方案“天花板”已开始显现。随着城区成为智驾落地的主战场,场景计算的复杂度呈指数级增长。大量的人力资源投入也只是增加有限的规则,无法应对数量无限的复杂场景和长尾路况。端到端技术的出现开辟了一条全新的道路,开始推动自动驾驶范式从铺设大量人力转变为持续算力投入和高质量数据输入。
据悉,UniAD端到端方案有更高的能力上限,强大的学习和思考能力让它能够像人一样开车;数据驱动的端到端模型泛化能力强、迭代效率快,可以帮助车企低成本快速开城;纯视觉感知的无图方案,进一步降低系统的软硬件成本,助力智驾普及,实现全国都能开。
图说:新一代自动驾驶大模型:可感知、可交互、可信赖
提供真正懂你的智能座舱
前几天,商汤科技发布了全新升级的“日日新5.0”大模型。基于端云结合的架构,商汤端侧大模型大幅超越同量级大模型,越级比肩7B、13B大模型,更适合车端部署。
基于多模态大模型、大语言模型、文生图模型等能力组合,商汤绝影构建了以多模态场景大脑为核心的一系列全景感知、主动关怀且富有创造力的大模型座舱产品。
通过应用场景和用户需求驱动,多模态场景大脑让智能汽车可以高效准确地全景感知和深度理解用户需求和周围环境,并以场景大脑为核心打通不同应用,将离散的单点功能聚合在一起,从而为用户提供更多深度个性化的主动关怀和服务。
图说:“旅医”让用户在座舱内就可以获得专业及个性化的健康管理服务
此外,以多模态场景大脑为核心,商汤绝影还能提供更多基于汽车场景的AI大模型座舱产品。以商汤“大医”医疗健康大模型为桥梁的“旅医”,让用户在座舱内就可以获得专业及个性化的健康管理服务,让出行更安心;而基于AIGC大模型技术的“神笔”,可以把用户简单的绘画线条转变成具有美感的艺术作品,增添驾乘乐趣。
人机交互的创新也是驱动座舱体验升维的重要因素,去年Apple Vision Pro的问世展现了3D交互的创新体验和应用潜力。商汤绝影将3D Gaze高精视线交互和3D 动态手势交互这两大全新座舱3D交互演示带到车展现场,让观众体验到更符合人类直觉的舱内交互方式,推动座舱交互向更安全、更便利的3D交互升维进化。
据悉,商汤绝影还在进一步探索舱驾融合,实现智能驾驶和智能座舱在硬件、软件及应用层面的全面融合,提升用户体验、降低系统成本,进一步打破舱内外的界限和束缚,涌现更多创新功能。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。