在智能化浪潮席卷全球汽车产业之际,某新锐自动驾驶厂商积极探索大模型在智能汽车领域的创新应用,高效利用大模型对于提升自动驾驶技术的核心竞争力至关重要。然而,大模型的应用尚处初级阶段,其对算力、数据存储与处理能力的需求呈指数级增长,成为该厂商面临技术突破与业务发展的多重挑战。
需求与痛点
应对大模型应用趋势
尽管大模型在自动驾驶领域的应用前景广阔,但其尚处发展初期,如何快速应用并充分利用其潜力,成为该厂商亟待解决的问题。
海量数据处理难题
多模态数据(自然语言、图像、音频等)、车载传感器数据、场景数据的存储与处理需求激增,传统方式已无法满足高效、安全的存储与处理需求。
高效算力诉求
大模型训练对算力需求极高,需数十亿量级 GPU 小时,且训练周期长、场景多样、模型种类丰富;且推理时的高并发对系统性要求严格。
用户需求不断升级
随着 AI 业务发展,该厂商需构建支持英伟达 H 系列万卡集群,并整合 Kubernetes 管理、存储和网络,以实现 GPU 高效训练和灵活扩展。
解决方案
为满足其独特需求,考虑需求、成本、能⼒等因素,该新锐自动驾驶厂商选择了集高效算力、海量存储与智能管理于一体的 AI 算力云。
专属云服务
为该客户打造了专属的客户专区,实现物理隔离的独立集群,确保数据安全与资源专用。
分期建设,稳步部署
第一期部署 128 台计算节点,配备 48 个 IB 交换机,奠定坚实计算基础;二期扩容至 512 台计算节点集群,增加至 320 个 IB 交换机,全面升级性能。
高速网络架构
- 双 IB 网络:构建 400G 带宽计算网络与 200G 带宽存储网络,确保上下行通信高速稳定。
- 极致优化:整机 IB 网络带宽与 H 系列显存带宽升级匹配,实现 1:1 网络收敛,千卡集群加速比高达 90%,保证低延迟、高并发的数据交互。
强大存储体系
- 海量对象存储:提供 100P 容量,通过 API 接口无缝对接,满足各类非结构化数据的存储需求。
- 高效并行文件存储:配备 10P EPFS POSIX 客户端,确保大规模结构化数据的处理游刃有余。
灵活带宽管理
与 IDC 机房紧密合作,提供按需调整的公网带宽服务,确保数据传输高效畅通。