سبب أهمية NVIDIA GB300 NVL72 (Blackwell Ultra) 🤔 لماذا تعتبر NVIDIA GB300 NVL72 (Blackwell Ultra) مهمة 🤔
قامت NVIDIA بتجميع 72 وحدة معالجة رسومات Blackwell Ultra و36 وحدة معالجة مركزية Grace في وحدة تبريد سائلة على نطاق الرفوف تستهلك حوالي 120 كيلوواط وتوفر 1.1 إكسا فلوبس من حوسبة FP4 مع وحدة GB300 NVL72 - أي أكثر من أداء الذكاء الاصطناعي بمقدار 1.5 ضعف من وحدة GB200 NVL72 الأصلية (NVIDIA، 2025). تغير هذه الخزانة الواحدة كل الافتراضات المتعلقة بالطاقة والتبريد والكابلات داخل مراكز البيانات الحديثة. إليك ما يتعلمه مهندسو النشر أثناء إعدادهم للمواقع لأول عمليات تسليم GB300 NVL72 للإنتاج.
1. تشريح الرف
تزن الخزانة حوالي 1.36 طن (3,000 رطل) وتحتل نفس مساحة الحامل التقليدي الذي تبلغ 42 وحدة (السجل، 2024). تمثل وحدة معالجة الرسومات GB300 NVL72 وحدة معالجة رسومات Blackwell Ultra، التي تتميز بوحدات معالجة رسومات B300 المحسّنة مع ذاكرة HBM3e بسعة 288 جيجابايت لكل وحدة معالجة رسومات (بزيادة 50% عن وحدة B200 الأصلية بسعة 192 جيجابايت) التي تم تحقيقها من خلال مكدسات HBM3e بارتفاع 12 بدلاً من 8 ارتفاعات. تقترن كل رقاقة فائقة الآن بأربع وحدات معالجة رسومات B300 مع وحدتي معالجة مركزية من Grace، مقارنةً بالتكوين الأصلي المكون من وحدتي معالجة رسومات. وتجمع كل رقاقة فائقة من Grace-Blackwell بين 72 نواة وحدة معالجة رسومات Blackwell Ultra بسرعة 2.6 جيجاهرتز مع وحدة معالجة مركزية Arm Neoverse V2 ذات 128 نواة تعمل بتردد أساسي 3.1 جيجاهرتز. توفر ذاكرة HBM3e المدمجة 8 تيرابايت/ثانية لكل وحدة معالجة رسومات بسعة 288 جيجابايت.
رؤية ميدانية: يستقر مركز ثقل الحامل أعلى بنسبة 18% من مركز ثقل الخوادم القياسية بسبب وضع موارد الحوسبة بكثافة في الصواني العلوية. توصي أفضل الممارسات الآن بتثبيت قضبان التثبيت بمسامير M12، بدلاً من صواميل القفص القياسية، لمعالجة الاهتزازات الدقيقة التي لوحظت أثناء التشغيل بالحمل الكامل.
2. تغذية الوحش: توصيل الطاقة
An GB300 NVL72 rack ships with built‑in PSU shelves, delivering 94.5% efficiency at full load. Peak consumption hits 120.8 kW during mixed‑precision training workloads—power quality analyzers typically record 0.97 power factor with <3% total harmonic distortion.
مقارنة طوبولوجيا الجهد:
208 فولت/60 هرتز: تيار خط 335 أمبير، يتطلب نحاس 4/0 AWG (107 مم²)
415 فولت/50-60 هرتز: تيار خط 168 أمبير، يحتاج فقط إلى 70 مم² من النحاس
480 فولت/60 هرتز: تيار خط 145 أمبير، الحد الأدنى من الانتشار في أمريكا الشمالية
تتضمن أفضل الممارسات في الصناعة توفير تغذية مزدوجة 415 فولت ثلاثية المراحل لكل حامل عبر موصلات IEC 60309 بقوة 160 أمبير. يقلل هذا الخيار من خسائر I²R بنسبة 75% مقارنةً بـ 208 فولت مع الحفاظ على التوافق مع معايير المنشأة الأوروبية. تشير القياسات الميدانية إلى أن لوحات القواطع تظل عادةً أقل من 85% من الاستنزاف الحراري في الغرف التي تبلغ درجة حرارتها 22 درجة مئوية.
تخفيف التوافقي: تُظهر رفوف GB300 NVL72 تشوهًا توافقيًا كليًا بنسبة 4.8% في ظل أحمال التدريب النموذجية للذكاء الاصطناعي. تتطلب عمليات النشر التي تتجاوز ثمانية رفوف عادةً مقومات ذات 12 نبضة على محولات مخصصة للحفاظ على التوافق مع IEEE 519.
3. دليل التبريد واقع الهندسة الحرارية
يبلغ قياس كل قالب من قوالب وحدة معالجة الرسومات Blackwell Ultra 744 مم² ويبدد ما يصل إلى 1000 واط من خلال واجهة اللوحة الباردة. تضيف وحدة المعالجة المركزية Grace 500 واط أخرى عبر 128 نواة. ويضع برنامج IR7000 من Dell للسائل كمسار افتراضي للمعدات من فئة Blackwell، مدعياً أن السعة لكل رف تصل إلى 480 كيلوواط مع مبادلات حرارية مغلقة في الباب الخلفي (Dell Technologies، 2024).
التسلسل الهرمي الحراري الموصى به:
≤80 كيلوواط/رف: مبادلات حرارية بباب خلفي مع إمداد مياه بدرجة حرارة 18 درجة مئوية، ومعدل تدفق 35 لتر/دقيقة
80-132 كيلوواط/رف: حلقات مباشرة إلى رقاقة (DTC) إلزامية، إمداد 15 درجة مئوية، 30 لتر/دقيقة كحد أدنى
132 كيلوواط/حامل: التبريد بالغمر أو تكوينات الحامل المنفصل المطلوبة
مواصفات DTC من عمليات النشر الميداني:
اللوحة الباردة ΔT: 12-15 درجة مئوية عند التحميل الكامل (درجة حرارة وصلة وحدة معالجة الرسومات 83-87 درجة مئوية)
انخفاض الضغط: 2.1 بار عبر الحلقة الكاملة مع 30٪ بروبيلين جلايكول البروبيلين
توزيع التدفق: ± 3% تباين في جميع ألواح التبريد بوحدة معالجة الرسومات ال 72
Leak rate: <2 mL/year per QDC fitting (tested over 8,760 hours)
رؤية حرجة: تُظهر شبكة توصيل الطاقة في Blackwell Ultra عابرات على نطاق ميكروثانية، تصل إلى 1.4 ضعف طاقة الحالة المستقرة أثناء مزامنة التدرج. توصي ممارسات الصناعة بتحديد حجم التبريد بنسبة 110% من TDP المقدرة للتعامل مع هذه الارتفاعات الحرارية دون اختناق وحدة معالجة الرسومات.
4. نسيج الشبكة: إدارة شبكة NVLink 5.0 والاتصال المحسّن
تحتوي كل وحدة من وحدات معالجة رسومات GB300 NVL72 على 72 وحدة معالجة رسومات Blackwell Ultra مع NVLink 5.0، مما يوفر نطاقًا تردديًا يبلغ 1.8 تيرابايت/ثانية لكل وحدة معالجة رسومات وإجمالي نطاق ترددي NVLink 130 تيرابايت/ثانية عبر النظام. يعمل الجيل الخامس من الجيل الخامس من NVLink بمعدل إشارات 200 جيجابت/ثانية لكل رابط، مع 18 رابطاً لكل وحدة معالجة رسومات. تقوم رقاقات NVSwitch التسع بتوجيه حركة المرور هذه بزمن انتقال يبلغ 300 نانوثانية وتدعم أنماط اتصال من وحدة معالجة رسومات إلى وحدة معالجة رسومات في 576 اتجاهًا.
يتميز الاتصال بين الرفوف الآن بوحدات ConnectX-8 SuperNICs التي توفر اتصالاً شبكيًا بسرعة 800 جيجابت/ث لكل وحدة معالجة رسومات (ضعف سرعة 400 جيجابت/ثانية من الجيل السابق)، وتدعم كلاً من منصات NVIDIA Quantum-X800 InfiniBand وSpectrum-X Ethernet.
بنية الكابلات:
Intra‑rack: 1,728 copper Twinax cables (75‑ohm impedance, <5m lengths)
بين الرفوف: 90 منفذ QSFP112 QSFP112 عبر أجهزة الإرسال والاستقبال 800G عبر OM4 MMF
التخزين/الإدارة: 18 وحدة تخزين/إدارة DPU من طراز Bluefield-3 مع وصلات مزدوجة 800G لكل منها
القياسات الميدانية:
الميزانية الضوئية: ميزانية فقدان الإدراج 1.5 ديسيبل على امتداد 150 متر OM4
BER performance: <10⁻¹⁵ sustained over 72‑hour stress tests
كثافة الموصلات: 1,908 توصيلة لكل رف (بما في ذلك الطاقة)
تتضمن أفضل الممارسات شحن تجميعات جذع الألياف 144 المنتهية مسبقًا مع تلميع APC والتحقق من كل موصل مع اختبار فقدان الإدخال/ارتجاع الخسارة وفقًا لمعايير TIA-568. يمكن للأطقم المتمرسة المكونة من شخصين إكمال تركيب الألياف GB300 NVL72 في 2.8 ساعة في المتوسط، بعد أن كان متوسط الوقت الذي يستغرقه الفنيون في تركيب الكابلات في الموقع 7.5 ساعة.
Signal integrity insight: NVLink‑5 operates with 25 GBd PAM‑4 signaling. Typical installations maintain a 2.1 dB insertion loss budget per Twinax connection and <120 fs RMS jitter through careful cable routing and ferrite suppression.
5. قائمة مراجعة النشر المختبرة ميدانياً
المتطلبات الهيكلية:
تحميل الأرضية: اعتماد ≥14 كيلو نيوتن/متر مربع (2,030 رطل/قدم مربع)؛ الوزن الموزع يتجاوز معظم المنشآت القديمة
الدعامات الزلزالية: تتطلب التركيبات في المنطقة 4 دعامات X إضافية وفقًا ل IBC 2021
Vibration isolation: <0.5g acceleration at 10–1000 Hz to prevent NVLink errors
البنية التحتية للطاقة:
تغذيات مزدوجة بجهد 415 فولت، 160 أمبير لكل منهما، مع مراقبة الدائرة الفرعية شنايدر PM8000
مقاس وحدة الإمداد بالطاقة غير المنقطعة: 150 كيلو فولت أمبير لكل حامل (هامش أمان بنسبة 125%) مع طوبولوجيا التحويل المزدوج عبر الإنترنت
Grounding: Isolated equipment ground with <1Ω resistance to facility MGB
مواصفات التبريد:
Coolant quality: <50 µS/cm conductivity, 30% propylene glycol, pH 8.5–9.5
استبدال الفلتر: 5 ميكرومتر مطوي 5 ميكرومتر كل 1,000 ساعة، 1 ميكرومتر نهائي كل 2,000 ساعة
كشف التسرب: مستشعرات السوائل الموصلة في جميع تجهيزات QDC بحساسية 0.1 مل
مخزون قطع الغيار:
صينية NVSwitch واحدة (المهلة الزمنية: 6 أسابيع)
خرطوشتا مضخة CDU (MTBF: 8,760 ساعة)
20 جهاز إرسال واستقبال QSFP112 QSFP112 (معدل الأعطال الميدانية: 0.02% سنوياً)
مادة الواجهة الحرارية الطارئة (Honeywell PTM7950، أنابيب 5g)
اتفاقية مستوى الخدمة عن بُعد: أصبحت الاستجابة في الموقع لمدة 4 ساعات في الموقع معيارًا قياسيًا في هذا المجال يحافظ شركاء النشر الرائدون في هذا المجال على هذا الهدف في العديد من البلدان مع وقت تشغيل بنسبة تزيد عن 99%.
6. توصيف الأداء في ظل أحمال الإنتاج
معايير الاستدلال بالذكاء الاصطناعي (من تقارير النشر المبكرة):
طراز DeepSeek R1-671B: إنتاجية مستدامة تصل إلى 1,000 رمز / ثانية
نموذج معلمة GPT-3 175B 847 توكينز/ثانية/متوسط وحدة المعلمات
الانتشار المستقر 2.1: 14.2 صورة/الثانية بدقة 1024×1024
تدريب ResNet-50 ImageNet: 2,340 عينة/ثانية إنتاجية مستدامة
تحجيم كفاءة الطاقة:
استخدام الحامل الواحد: 1.42 GFLOPS/ واط عند استخدام وحدة معالجة الرسومات بنسبة 95%
مجموعة من 10 رفوف: 1.38 GFLOPS/ واط (تقلل نفقات التبريد من الكفاءة)
طاقة الشبكة الخاملة: 3.2 كيلوواط لكل رف (NVSwitch + أجهزة الإرسال والاستقبال)
تحسينات في أداء منطق الذكاء الاصطناعي: يوفر GB300 NVL72 زيادة بمقدار 10 أضعاف في الرموز في الثانية لكل مستخدم وتحسيناً بمقدار 5 أضعاف في TPS لكل ميغاواط مقارنةً بـ Hopper، مما يؤدي إلى زيادة محتملة إجمالية قدرها 50 ضعفاً في أداء إنتاج مصنع الذكاء الاصطناعي.
تأثيرات التدوير الحراري: بعد 2,000 ساعة من التشغيل الإنتاج، أبلغت عمليات النشر المبكرة عن تدهور الأداء بنسبة 0.3% بسبب ضخ مواد الواجهة الحرارية. يحافظ الاستبدال المجدول لمادة TIM على فترات زمنية مدتها 18 شهرًا على ذروة الأداء.
7. تحليل التكلفة الإجمالية للملكية مقابل التكلفة الإجمالية للملكية داخل الشركة
تقدم Lambda وحدات معالجة رسومات B200 بسعر منخفض يصل إلى 2.99 دولار لكل ساعة وحدة معالجة رسومات مع التزامات متعددة السنوات (Lambda 2025). تُظهر النمذجة المالية التي تتضمن التكاليف الحقيقية للمنشأة من عمليات النشر في الصناعة:
توزيع التكلفة لكل رف على مدار 36 شهراً:
النفقات الرأسمالية للأجهزة: 3.7 إلى 4.0 مليون دولار (بما في ذلك قطع الغيار والأدوات) ل GB300 NVL72
طاقة المنشأة: 310 آلاف دولار أمريكي بسعر 0.08 دولار أمريكي/كيلوواط ساعة بمتوسط استخدام 85%
البنية التحتية للتبريد: 180 ألف دولار أمريكي (وحدة CDU، والسباكة، وأجهزة التحكم)
موظفو العمليات: 240 ألف دولار (0.25 مكافئ دوام كامل)
المجموع: 4.43-4.73 مليون دولار أمريكي مقابل 4.7 مليون دولار أمريكي مكافئ السحابة
تحدث نقطة التعادل بمتوسط معدل استخدام يبلغ 67% على مدار 18 شهرًا، مع الأخذ في الاعتبار الاستهلاك والتمويل وتكاليف الفرص البديلة. يكتسب المديرون الماليون في المؤسسات إمكانية التنبؤ بالميزانية مع تجنب التقيد بمورّد السحابة.
8. GB300 مقابل GB200: فهم Blackwell Ultra
صورة الجيل السابق GB200 من الجيل GB200
يمثل معالج GB300 NVL72 (Blackwell Ultra) تطورًا كبيرًا عن معالج GB200 NVL72 الأصلي. تتضمن التحسينات الرئيسية أداء حوسبة ذكاء اصطناعي أكبر بمقدار 1.5 مرة وذاكرة HBM3e بسعة 288 جيجابايت لكل وحدة معالجة رسومات (مقابل 192 جيجابايت)، وتركيز محسّن على الاستدلال على قياس وقت الاختبار لتطبيقات الاستدلال بالذكاء الاصطناعي.
توفر البنية الجديدة زيادة بمقدار 10 أضعاف في التوكنات في الثانية لكل مستخدم وتحسيناً بمقدار 5 أضعاف في TPS لكل ميغاواط مقارنةً بـ Hopper، مما يؤدي إلى زيادة محتملة إجمالية قدرها 50 ضعفاً في ناتج مصنع الذكاء الاصطناعي. وهذا ما يجعل GB300 NVL72 مُحسّنة خصيصاً للعصر الناشئ من الاستدلال بالذكاء الاصطناعي، حيث تتطلب نماذج مثل DeepSeek R1 حوسبة أكبر بكثير أثناء الاستدلال لتحسين الدقة.
الجدول الزمني للتوفر: من المتوقع أن تتوافر أنظمة GB300 NVL72 من الشركاء في النصف الثاني من عام 2025، مقارنةً بأنظمة GB200 NVL72 المتوفرة الآن.
9. لماذا تختار الشركات المدرجة في قائمة فورتشن 500 شركاء النشر المتخصصين
قام المتخصصون الرائدون في مجال النشر بتركيب أكثر من 100,000 وحدة معالجة رسومية عبر أكثر من 850 مركز بيانات، مع الحفاظ على اتفاقيات مستوى الخدمة العالمية (SLAs) لمدة 4 ساعات من خلال فرق هندسية ميدانية واسعة النطاق. وقد قامت هذه الصناعة بتكليف آلاف الأميال من الألياف وعدة ميجاوات من البنية التحتية المخصصة للذكاء الاصطناعي منذ عام 2022.
مقاييس النشر الأخيرة:
متوسط الجدول الزمني لإعداد الموقع: 6.2 أسابيع (أقل من متوسط 11 أسبوعًا في الصناعة)
معدل نجاح الاختبار الأول 97.3% لاختبار التشغيل
مشاكل ما بعد النشر معدل فشل المكونات بنسبة 0.08% في أول 90 يومًا من النشر
تقوم شركات تصنيع المعدات الأصلية بشحن الأجهزة، بينما يقوم الشركاء المتخصصون بتحويل الأجهزة إلى بنية تحتية للإنتاج. يمكن أن يؤدي إشراك فرق النشر المتمرسة خلال مراحل التخطيط إلى تقليل الجداول الزمنية بنسبة 45% من خلال استخدام حزم الطاقة الجاهزة وحلقات التبريد مسبقة التجهيز وحزم الألياف المنتهية في المصنع.
فكرة الفراق
تمثل خزانة GB300 NVL72 تحولاً جوهريًا من "الخوادم في الرفوف" إلى "مراكز البيانات في الخزانات". الفيزياء لا ترحم: 120 كيلوواط من كثافة الحوسبة تتطلب الدقة في كل توصيلة طاقة وحلقة تبريد وإنهاء الألياف. أتقن الأساسيات الهندسية في اليوم 0، وستقدم Blackwell Ultra أداءً تحويليًا في التفكير المنطقي للذكاء الاصطناعي لسنوات قادمة.
هل أنت مستعد لمناقشة التفاصيل التقنية التي لم نستطع استيعابها في 2,000 كلمة؟ يزدهر مهندسو النشر لدينا في هذه المحادثات - حدد موعدًا للتعمق التقني على solutions@introl.com.
المراجع
ديل تكنولوجيز. 2024. "مصنع Dell للذكاء الاصطناعي يحول مراكز البيانات من خلال ابتكارات التبريد المتقدم والحوسبة عالية الكثافة والتخزين بالذكاء الاصطناعي." بيان صحفي، 15 أكتوبر. غرفة أخبار ديل تكنولوجيز
مقدمة. 2025. "عمليات نشر البنية التحتية لوحدات معالجة الرسومات والمهندسين الميدانيين العالميين." تم الوصول إليه في 23 يونيو. introl.com
لامبدا 2025. "تسعير سحابة الذكاء الاصطناعي - مجموعات NVIDIA B200." تم الوصول إليه في 23 يونيو. تسعير مختبرات لامبدا
NVIDIA. 2025. "صفحة المنتج GB300 NVL72." تم الوصول إليه في 23 يونيو. مركز بيانات إنفيديا
NVIDIA. 2025. "منصة NVIDIA Blackwell Ultra AI Factory Platform تمهد الطريق لعصر الذكاء الاصطناعي المنطقي." بيان صحفي، 18 مارس. أخبار إنفيديا
سوبر مايكرو. 2025. "ورقة بيانات NVIDIA GB300 NVL72 SuperCluster." فبراير. ورقة بيانات سوبر مايكرو
السجل 2024. مان، توبياس. "رف واحد، 120 كيلوواط من الحوسبة: نظرة فاحصة على وحش DGX GB200 NVL72 من NVIDIA." 21 مارس. السجل