ابرکامپیوتر هوش مصنوعی NVIDIA HGX

شتاب‌دهی به آینده‌ هوش مصنوعی و محاسبات پیشرفته
با نسل جدید پلتفرم‌های محاسباتی برای AI ،HPC و تحلیل داده در مراکز داده مدرن.

بررسی کلی

پلتفرم NVIDIA HGX یکی از پیشرفته‌ترین راهکارهای محاسباتی در جهان است که برای پردازش‌های پیچیده هوش مصنوعی (AI) و رایانش با کارایی بالا (HPC) طراحی شده است.
این پلتفرم با ترکیب چندین پردازنده گرافیکی (GPU)، فناوری فوق‌سریع NVLink و شبکه‌های اختصاصی NVIDIA Networking، حداکثر توان محاسباتی را برای مراکز داده و سازمان‌هایی که با حجم عظیم داده و مدل‌های یادگیری عمیق سر و کار دارند، فراهم می‌کند.

با پشتیبانی از پشته‌ نرم‌افزاری کاملا بهینه‌سازی‌شده برای AI و NVIDIA HGX ،HPC عملکردی بی‌رقیب ارائه داده و به کسب‌وکارها کمک می‌کند تا سریع‌تر به بینش، نوآوری و نتایج دقیق‌تر دست یابند.

جدیدترین نسخه، NVIDIA HGX B300، با بهره‌گیری از هشت GPU از نوع NVIDIA Blackwell Ultra، تا ۱.۵ برابر توان FP4 Tensor Core FLOPS بیشتر و ۲ برابر عملکرد بهتر در پردازش Attention نسبت به مدل قبلی (HGX B200) دارد؛ که بیانگر گامی بزرگ به‌سوی نسل جدید رایانش شتاب‌یافته و هوش مصنوعی مولد (Generative AI) است.

آموزش

آموزش مقیاس‌پذیر برای مدل‌های بزرگ هوش مصنوعی

عملکرد آموزشی نسل بعد

پلتفرم HGX B300 تا ۲.۶ برابر عملکرد بهتر در آموزش مدل‌های زبانی بزرگ (مانند DeepSeek-R1) ارائه می‌دهد.
با در اختیار داشتن بیش از ۲ ترابایت حافظه پرسرعت و ۱۴.۴ ترابایت بر ثانیه پهنای‌باند NVLink Switch، این پلتفرم امکان آموزش مدل‌ها در مقیاس بسیار بزرگ و ارتباط میان GPUها با سرعت و بازدهی بالا را فراهم می‌سازد.

عملکرد آموزشی هوش مصنوعی Deep-Seek-R1
training ndvia
عملکرد پیش‌بینی‌شده ممکن است تغییر کند. کارایی به ازای هر GPU، با دقت FP8، اندازه بچ ۱۶K، و طول دنباله ۱۶K.
تحلیل

عملکرد و انعطاف‌پذیری در استدلال هوش مصنوعی

DeepSeek-R1: طول ورودی دنباله (ISL) برابر با ۳۲ هزار و طول خروجی دنباله (OSL) برابر با ۸ هزار است.
از پلتفرم HGX B300 با فناوری تفکیک‌پذیری دینامیک (FP4 Dynamo Disaggregation) استفاده می‌کند.
همچنین از H100 با پردازش FP8 و دسته‌بندی در حین اجرا (In-flight Batching) بهره می‌برد.
عملکرد پیش‌بینی‌شده ممکن است تغییر کند.

افزایش درآمد توکنی در پلتفرم HGX B300

منحنی بالایی، پارامترهای کلیدی مؤثر بر خروجی درآمدی توکن در کارخانه هوش مصنوعی (AI Factory) را نشان می‌دهد.
محور عمودی، میزان توان پردازش توکن بر ثانیه (TPS) را در یک کارخانه هوش مصنوعی با مصرف یک مگاوات (MW) نمایش می‌دهد، در حالی‌که محور افقی تعامل و پاسخ‌گویی کاربر را بر حسب TPS برای هر کاربر منفرد اندازه‌گیری می‌کند.

در نقطه‌ بهینه‌ای که بین ظرفیت پردازش (Throughput) و پاسخ‌گویی (Responsiveness) برقرار می‌شود، پلتفرم HGX B300 تا ۳۰ برابر افزایش عملکرد کلی در خروجی کارخانه هوش مصنوعی نسبت به معماری NVIDIA Hopper ارائه می‌دهد؛ که این به معنای حداکثر درآمد توکنی است.

شبکه‌سازی

شتاب‌دهی به HGX با استفاده از شبکه‌های NVIDIA

مرکز داده، واحد جدید رایانش در عصر مدرن بوده و شبکه نقش اساسی در مقیاس‌دهی عملکرد برنامه‌ها در سراسر آن ایفا می‌کند.
با ترکیب پلتفرم HGX و فناوری NVIDIA Quantum InfiniBand، عملکرد و بهره‌وری در سطحی جهانی ارائه می‌شود تا از حداکثر استفاده از منابع محاسباتی اطمینان حاصل گردد.

در مراکز داده‌ ابری هوش مصنوعی که از شبکه‌های مبتنی بر Ethernet استفاده می‌کنند، بهترین کارایی HGX در کنار پلتفرم شبکه‌ای NVIDIA Spectrum-X حاصل می‌شود؛ این پلتفرم بالاترین سطح عملکرد هوش مصنوعی را بر بستر Ethernet فراهم می‌کند.
Spectrum-X شامل سوئیچ‌های Spectrum-X و کارت‌های شبکه NVIDIA SuperNIC است که بهینه‌ترین استفاده از منابع و تفکیک عملکردی دقیق (Performance Isolation) را ممکن می‌سازند و نتایجی پایدار و قابل پیش‌بینی را برای هزاران پردازش هوش مصنوعی هم‌زمان در هر مقیاسی ارائه می‌دهند.

علاوه بر این، Spectrum-X از قابلیت‌های پیشرفته‌ چندمستاجری ابری (Cloud Multi-Tenancy) و امنیت مبتنی بر اعتماد صفر (Zero-Trust Security) پشتیبانی می‌کند.

مشخصات فنی

جدول مشخصات فنی NVIDIA HGX

پلتفرم NVIDIA HGX در قالب بردهای پایه (Baseboard) عرضه می‌شود که شامل یکی از پیکربندی‌های زیر است:

  • چهار یا هشت ماژول Hopper SXM
  • هشت ماژول NVIDIA Blackwell SXM یا NVIDIA Blackwell Ultra SXM یا NVIDIA Blackwell B100 SXM

این ترکیب قدرتمند از سخت‌افزار پیشرفته و نرم‌افزار بهینه‌سازی‌شده، پایه‌ای محکم برای دستیابی به عملکردی بی‌سابقه در ابررایانش هوش مصنوعی (AI Supercomputing) فراهم می‌سازد.

HGX B300
HGX B200
HGX B100
8x NVIDIA Blackwell Ultra SXM
8x NVIDIA Blackwell SXM
8x NVIDIA Blackwell B100 SXM
Form Factor
144 PFLOPS | 108 PFLOPS
144 PFLOPS | 72 PFLOPS
112 PFLOPS
FP4 Tensor Core¹
72 PFLOPS
72 PFLOPS
56 PFLOPS
FP8/FP6 Tensor Core²
3 POPS
72 POPS
56 POPS
INT8 Tensor Core²
36 PFLOPS
36 PFLOPS
28 PFLOPS
FP16/BF16 Tensor Core²
18 PFLOPS
18 PFLOPS
14 PFLOPS
TF32 Tensor Core²
600 TFLOPS
600 TFLOPS
480 TFLOPS
FP32
10 TFLOPS
296 TFLOPS
240 TFLOPS
FP64/FP64 Tensor Core
2.1 TB
1.4 TB
Up to 1.5TB
Total Memory
Fifth generation
Fifth generation
Fifth generation
NVIDIA NVLink
NVLink 5 Switch
NVLink 5 Switch
Fourth generation
™NVIDIA NVLink Switch
1.8 TB/s
1.8 TB/s
1.8 TB/s
NVLink GPU-to-GPU Bandwidth
14.4 TB/s
14.4 TB/s
14.4 TB/s
Total NVLink Bandwidth
1.6 TB/s
0.8 TB/s
عدد دقیقی وجود ندارد
Networking Bandwidth
2x
1x
1x
Attention Performance³

1.  Specification in Sparse | Dense

2. Specification in Sparse. Dense is ½ sparse spec shown.

3. vs. Blackwell.

8-GPU
4-GPU
HGX H200
8x NVIDIA H200 SXM
4x NVIDIA H200 SXM
Form Factor
32 PFLOPS
16 PFLOPS
*FP8 Tensor Core
32 POPS
16 POPS
*INT8 Tensor Core
16 PFLOPS
8 PFLOPS
*FP16/BF16 Tensor Core
8 PFLOPS
4 PFLOPS
*TF32 Tensor Core
540 TFLOPS
270 TFLOPS
FP32
270 TFLOPS
140 TFLOPS
FP64
540 TFLOPS
270 TFLOPS
FP64 Tensor Core
1.1 TB HBM3E
564 GB HBM3E
Total Memory
38 TB/s
19 TB/s
GPU Aggregate Bandwidth
Fourth generation
Fourth generation
NVLink
NVLink 4 Switch
N/A
NVSwitch
900 GB/s
N/A
NVSwitch GPU-to-GPU Bandwidth
7.2 TB/s
3.6 TB/s
Total Aggregate Bandwidth
0.8 TB/s
0.4 TB/s
Networking Bandwidth
8-GPU
4-GPU
HGX H100
8x NVIDIA H200 SXM
4x NVIDIA H200 SXM
Form Factor
32 PFLOPS
16 PFLOPS
*FP8 Tensor Core
32 POPS
16 POPS
*INT8 Tensor Core
16 PFLOPS
8 PFLOPS
*FP16/BF16 Tensor Core
8 PFLOPS
4 PFLOPS
*TF32 Tensor Core
540 TFLOPS
270 TFLOPS
FP32
270 TFLOPS
140 TFLOPS
FP64
540 TFLOPS
270 TFLOPS
FP64 Tensor Core
640 GB HBM3
320 GB HBM3
Total Memory
27 TB/s
13 TB/s
GPU Aggregate Bandwidth
Fourth generation
Fourth generation
NVLink
NVLink 4 Switch
N/A
NVSwitch
900 GB/s
N/A
NVSwitch GPU-to-GPU Bandwidth
7.2 TB/s
3.6 TB/s
Total Aggregate Bandwidth
0.8 TB/s
0.4 TB/s
Networking Bandwidth
چرا نوران

خرید مطمئن تجهیزات NVIDIA از نوران

نوران ارتباطات پایدار به عنوان تامین‌کننده معتبر تجهیزات پیشرفته‌ NVIDIA، به کسب‌وکارها در توسعه و استقرار پروژه‌های هوش مصنوعی کمک می‌کند. این پلتفرم‌ها با ترکیب سخت‌افزار و نرم‌افزارهای پیشرفته، عملکرد بالایی در محاسبات پیچیده ارائه می‌دهند. نوران با ارائه خدمات پشتیبانی تخصصی، کیفیت و اصالت محصولات را تضمین کرده و در کنار مشتریان برای دستیابی به بهترین نتایج و پیشرفت در فناوری هوش مصنوعی قرار دارد. همچنین، نوران امکان مشاوره تخصصی پیش از خرید را فراهم می‌کند تا مشتریان با اطمینان کامل تصمیم‌گیری کنند. تیم پشتیبانی نوران همیشه آماده است تا در تمامی مراحل راه‌اندازی و استفاده از تجهیزات، همراهتان بوده و به تمامی سوالات و نیازهای فنی شما پاسخ دهد.

آماده ورود به نسل جدید رایانش شتاب‌یافته هستید؟
با پلتفرم‌های NVIDIA HGX و پشتیبانی تخصصی نوران، زیرساختی بسازید که آینده‌ هوش مصنوعی و محاسبات پیشرفته را برای سازمان شما ممکن کند.
نوران ارتباطات پایدار
ما را در شبکه های اجتماعی دنبال کنید