Supermicro предложила решения на платформе NVIDIA Blackwell

19 ноября 2024, 7:52

Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облачных вычислений, хранения данных и 5G/Edge, анонсировал самую производительную систему SuperCluster, комплексное решение для центров обработки данных для ИИ на платформе NVIDIA Blackwell в эпоху генеративного ИИ на основе моделей с триллионами параметров. Новый SuperCluster значительно повысит количество систем NVIDIA HGX B200 8-GPU в стойке с жидкостным охлаждением, что приведет к значительному увеличению плотности вычислений на графических процессорах по сравнению с существующими лучшими в отрасли решениями Supermicro SuperCluster на базе NVIDIA HGX H100 и H200 с жидкостным охлаждением. Кроме того, Supermicro расширяет портфель своих систем NVIDIA Hopper для удовлетворения потребностей, связанных с быстрым внедрением ускоренных вычислений для приложений HPC и массового корпоративного ИИ.

«Supermicro обладает опытом, возможностями для быстрого выполнения заказов и мощностями для развертывания крупнейших в мире проектов центров обработки данных для ИИ с жидкостным охлаждением, содержащих 100 000 графических процессоров, в реализации которых участвовали недавно Supermicro и NVIDIA», — сказал Чарльз Лян (Charles Liang), президент и генеральный директор Supermicro. «Эти системы Supermicro SuperCluster снижают энергопотребление благодаря эффективности прямого жидкостного охлаждения (DLC). Теперь у нас есть решения, в которых используется платформа NVIDIA Blackwell. Использование нашего подхода «строительных блоков» позволяет нам быстро проектировать серверы с системами NVIDIA HGX B200 8-GPU, которые могут быть с жидкостным или воздушным охлаждением. Наши системы SuperCluster обеспечивают беспрецедентную плотность, производительность и эффективность, прокладывая путь к еще более плотным вычислительным решениям для ИИ в будущем. В кластерах Supermicro используется прямое жидкостное охлаждение, что обеспечивает повышение производительности, снижение энергопотребления всего центра обработки данных и сокращение эксплуатационных расходов».

Модернизированное масштабируемое решение SuperCluster основано на стоечной конструкции с инновационными вертикальными распределительными коллекторами теплоносителя (CDM), которые позволяют повысить количество вычислительных узлов в одной стойке. Недавно разработанные эффективные охлаждающие пластины и усовершенствованная конструкция шлангов дополнительно повышают эффективность системы жидкостного охлаждения. Также доступен новый вариант рядных блоков распределения охлаждения (CDU) для крупных развертываний. В традиционных центрах обработки данных с воздушным охлаждением также могут использоваться преимущества новых систем NVIDIA HGX B200 8-GPU с новым системным шасси с воздушным охлаждением.

Новые системы Supermicro NVIDIA HGX B200 8-GPU поставляются с рядом обновлений, отличающих их от предыдущего поколения. Новая система включает в себя усовершенствования в отведении тепла и питании, поддержку двух процессоров Intel® Xeon® 6 мощностью 500 Вт (с модулями MRDIMM DDR5 со скоростью 8800 МТ/с) или процессоров AMD EPYCTM 9005 Series. Новая система Supermicro NVIDIA HGX B200 форм-фактора 10U с воздушным охлаждением имеет усовершенствованное шасси с расширенным пространством для охлаждения, позволяющим разместить восемь графических процессоров Blackwell с TDP 1000 Вт. Эти системы разработаны с соотношением графических процессоров к NIC 1:1 и поддерживают карты NVIDIA BlueField®-3 SuperNIC или NVIDIA ConnectX®-7 NIC для масштабирования в структуре высокопроизводительных вычислений. Кроме того, два блока обработки данных (DPU) NVIDIA BlueField-3 на систему оптимизируют обработку данных при передаче в подключенное высокопроизводительное хранилище ИИ и из него.

Supermicro также предлагает решения для всех суперчипов NVIDIA GB200 Grace Blackwell, включая недавно анонсированный суперчип NVIDIA GB200 NVL4 и экзафлопсный компьютер в одной стойке NVIDIA GB200 NVL72.

Линейка NVIDIA MGX от Supermicro будет поддерживать суперчип NVIDIA GB200 Grace Blackwell NVL4. Этот суперчип открывает будущее конвергентных высокопроизводительных вычислений и искусственного интеллекта, обеспечивая революционную производительность благодаря четырем графическим процессорам Blackwell, подключенным к NVIDIA NVLink™, объединенным с двумя процессорами NVIDIA Grace™ через NVLink-C2C. Совместимый с модульными системами NVIDIA MGX с жидкостным охлаждением от Supermicro, этот суперчип обеспечивает двукратное повышение производительности при научных вычислениях, обучении графовых нейронных сетей (GNN) и логических приложений по сравнению с предыдущим поколением.

Решение NVIDIA GB200 NVL72 SuperCluster со сквозным жидкостным охлаждением Supermicro создает суперкомпьютер экзафлопсного масштаба в одной стойке с программным обеспечением SuperCloud Composer (SCC), обеспечивающий комплексные возможности мониторинга и управления для центров обработки данных с жидкостным охлаждением. 72 графических процессора NVIDIA Blackwell и 36 процессоров NVIDIA Grace подключены через NVIDIA NVLink и коммутатор NVLink Switch пятого поколения и эффективно работают как один мощный графический процессор с массивным пулом памяти HBM3e, обеспечивая общую пропускную способность связи графических процессоров 130 Тбайт/с с низкой задержкой.

Системы ускоренных вычислений Supermicro 5U PCIe теперь доступны с модулями NVIDIA H200 NVL, идеально подходящими для корпоративных стоек с низким энергопотреблением с воздушным охлаждением, которые требуют гибких конфигураций, обеспечивающих ускорение выполнения многих рабочих нагрузок для ИИ и высокопроизводительных вычислений, независимо от размера. Благодаря четырем графическим процессорам, подключенным с помощью NVIDIA NVLink, увеличенному в 1,5 раза объему памяти и увеличенной в 1,2 раза полосе пропускания с HBM3e, модуль NVIDIA H200 NVL может тонко настраивать большие языковые модели (LLM) за несколько часов, обеспечивая в 1,7 раза более высокую производительность логических операций LLM по сравнению с предыдущим поколением. NVIDIA H200 NVL также включает пятилетнюю подписку на NVIDIA AI Enterprise, изначально облачную программную платформу для разработки и развертывания производственного ИИ.

Системы ускоренных вычислений Supermicro X14 и H14 5U PCIe поддерживают до двух 4-полосных систем NVIDIA H200 NVL через NVLink (всего 8 графических процессоров в системе), обеспечивая скорость межсоединения графических процессоров до 900 ГБ/с с общим пулом 564 ГБ памяти HBM3e на домен NVLink с 4 графическими процессорами. Новая система ускоренных вычислений PCIe может поддерживать до 10 графических процессоров PCIe и теперь также оснащена новейшими процессорами Intel Xeon 6 или AMD EPYC 9005 Series для создания гибких и универсальных систем для приложений ИИ и высокопроизводительных вычислений.