Oracle dan Nvidia bekerjasama untuk mencipta superkomputer Zettaflops: mampu menyokong sehingga 131072 Blackwell B200 GPU

Sep 14,2024

Oracle telah melancarkan kluster baru yang akan digunakan untuk latihan AI melalui Oracle Cloud Infrastructure (OCI).Kelompok yang paling kuat ini akan didasarkan pada GPU Blackwell yang akan datang Nvidia, dengan prestasi AI total sehingga 2.4ZettaFlops, yang lebih kuat daripada kelompok AI yang baru diumumkan oleh Elon Musk.

Kluster superkomputer baru Oracle boleh dikonfigurasikan dengan Nvidia Hopper atau Blackwell GPU untuk AI dan HPC (pengkomputeran berprestasi tinggi), serta peranti rangkaian yang berbeza, termasuk latency ROCEV2 ultra-rendah dengan ConnectX-7 Nic dan ConnectX-8 Supernic atau Rangkaian ConnectX-8pada NVIDIA Quantum-2 Infiniband.Penyimpanan HPC juga boleh dipilih mengikut keperluan prestasi:

Kluster Super OCI yang dilengkapi dengan H100 GPU boleh menyokong sehingga 16384 GPU, memberikan prestasi puncak 65 FP8/INT8 EXAFLOPS dan rangkaian rangkaian komprehensif sebanyak 13PB/s;

Kluster Super OCI yang dilengkapi dengan H200 GPU akan dilancarkan pada tahun ini, yang boleh skala sehingga 65536 GPU dan menyediakan sehingga 260 FP8/INT8 EXAFLOPS dan 52PB/S rangkaian rangkaian;

Kluster Super OCI yang dilengkapi dengan Blackwell B200 GPU akan berkembang ke 131072 GPU, memberikan prestasi puncak sehingga 2.4 FP8/INT8 Zettaflops.

Kelompok superkomputer yang akan datang OCI jauh melebihi keupayaan sistem terkemuka semasa.Menurut Oracle, bilangan GPU di OCI Super Cluster atas berdasarkan B200 adalah lebih daripada tiga kali ganda daripada superkomputer perbatasan (menggunakan 37888 AMD Instinct MI250X GPU) dan lebih daripada enam kali ganda daripada kluster super lain.

Kluster Super OCI yang akan datang akan menggunakan kabinet Cecair Cecair NVIDIA NVIDIA, dengan 72 GPU berkomunikasi antara satu sama lain dalam satu domain NVLINK tunggal pada jalur lebar 129.6 TB/s.Oracle telah menyatakan bahawa GPU Blackwell Nvidia akan tersedia pada separuh pertama tahun 2025 (disebabkan oleh ketersediaan terhad Blackwell tahun ini), tetapi kini tidak jelas apabila OCI akan menawarkan kluster Blackwell yang dimuatkan sepenuhnya.
Produk RFQ