لماذا لا تبدو مراكز بيانات الذكاء الاصطناعي كما كانت عليه قبل عامين؟

يعمل التقارب بين الأجهزة الثورية وتقنيات التبريد المتطورة وخبرة النشر الاستراتيجية على تحويل كيفية بناء الشركات للبنية التحتية للذكاء الاصطناعي في عام 2025. يقدّم نظام GB300 NVL72 من NVIDIA تقنية رائدة في مجال سلاسة الطاقة تقلل من ذروة الطلب على الشبكة بنسبة تصل إلى 30%، بينما يتسابق سوق البنية التحتية العالمية لوحدات معالجة الرسومات نحو 190 مليار دولار بحلول عام 2030. تحقق المؤسسات التي تتقن التفاعل المعقد بين إدارة الطاقة والحلول الحرارية والشراكات الاستراتيجية عائد استثمار يتراوح بين 150% و350% على استثماراتها في الذكاء الاصطناعي، بينما تواجه المؤسسات التي تعاني من ضعف تخطيط البنية التحتية وقتاً يتراوح بين 40 و70% من الموارد الخاملة ومعدلات فشل في المشاريع تتجاوز 80%.

لقد وصل مشهد البنية التحتية للذكاء الاصطناعي إلى نقطة انعطاف حيث أصبحت مناهج مراكز البيانات التقليدية غير كافية بشكل أساسي. سيشكل الاستهلاك المتوقع للطاقة من أعباء عمل الذكاء الاصطناعي 27% من إجمالي استخدام مركز البيانات بحلول عام 2027، مع احتمال أن تتطلب عمليات التدريب الفردية ما يصل إلى 8 جيجاوات بحلول عام 2030. يتطلب هذا النمو الهائل، بالإضافة إلى تضاعف متطلبات طاقة وحدة معالجة الرسومات من 400 واط إلى أكثر من 1000 واط في ثلاث سنوات فقط، أساليب جديدة تمامًا لتصميم البنية التحتية ونشرها وإدارتها. وقد برزت شركات مثل Introl كعوامل تمكين بالغة الأهمية، حيث تدير عمليات نشر ما يصل إلى 100,000 وحدة معالجة رسومات مع معالجة النقص الحاد في المواهب الذي يؤثر على 90% من المؤسسات التي تحاول تنفيذ مشاريع البنية التحتية للذكاء الاصطناعي.

إدارة الطاقة الثورية تلبي الطلب غير المسبوق.

يمثل نظام GB300 NVL72 من NVIDIA نقلة نوعية في معالجة تحديات البنية التحتية الفريدة للذكاء الاصطناعي. تعالج تقنية تجانس الطاقة ثلاثية المراحل في النظام - التي تجمع بين الحد الأقصى للطاقة أثناء زيادة الاستهلاك، و65 جول لكل وحدة معالجة رسومات من وحدات تخزين الطاقة المدمجة، وأجهزة حرق الطاقة الذكية أثناء خفض الاستهلاك - بشكل مباشر مشاكل تزامن الشبكة التي تنشأ عندما تعمل آلاف وحدات معالجة الرسومات في خطى متقاربة. يمكّن هذا الابتكار مراكز البيانات من توفير البنية التحتية بناءً على متوسط الاستهلاك بدلاً من ذروة الاستهلاك، مما يسمح بزيادة كثافة الحوسبة بنسبة 30% ضمن مظاريف الطاقة الحالية.

تكشف المواصفات الفنية عن سبب أهمية ذلك بالنسبة لعمليات النشر الخاصة بالمؤسسات. مع 72 وحدة معالجة رسومات Blackwell Ultra التي توفر وحدات معالجة رسومات Blackwell Ultra التي توفر 70 ضعفاً من وحدات فلوبس للذكاء الاصطناعي أكثر من منصات Hopper السابقة وذاكرة متماسكة بسعة 40 تيرابايت لكل حامل، يعمل نظام GB300 NVL72 كوحدة حاسوبية ضخمة واحدة من خلال مجال NVLink الذي تبلغ سرعته 130 تيرابايت/ثانية. يحقق النظام تحسيناً بمقدار 5 أضعاف في التوكنات لكل ميجاوات مقارنةً بالأجيال السابقة، مما يعالج مباشرةً تقاطع متطلبات الأداء وقيود الطاقة التي تحد من نطاق نشر الذكاء الاصطناعي. يتيح تكامل التبريد السائل أداءً أكبر بـ 25 ضعفاً بنفس استهلاك الطاقة مقارنةً بالبنية التحتية التقليدية H100 المبردة بالهواء. فجأة، أصبحت حسابات عمليات نشر الذكاء الاصطناعي منطقية.

والأموال المتدفقة تثبت ذلك. مبيعات وحدات معالجة الرسومات؟ ستنتقل من 20 مليار دولار هذا العام إلى 180-190 مليار دولار بحلول عام 2030. قم بالحساب، هذا نمو بمقدار 10 أضعاف في ست سنوات. لا عجب أن كل البائعين يتدافعون للحصول على موقع. ومع ذلك، يواجه هذا النمو قيودًا شديدة على البنية التحتية، حيث تتجاوز المهل الزمنية لتوصيلات الطاقة ثلاث سنوات في الأسواق الرئيسية، ويؤدي نقص المعدات الحيوية إلى تأخير لمدة عامين للمحولات ووحدات توزيع الطاقة. وتتجه المؤسسات بشكل متزايد إلى شركاء النشر المتخصصين للتغلب على هذه التحديات، حيث تستخدم 34% من المؤسسات الكبيرة الآن نماذج وحدات معالجة الرسومات كخدمة للوصول إلى السعة المطلوبة دون استثمارات رأسمالية ضخمة.

ثورة التبريد تتيح تحقيق طفرة في كثافة الذكاء الاصطناعي.

يمثل الانتقال من التبريد الهوائي إلى التبريد السائل أكثر من مجرد تحسين تدريجي؛ إنه مطلب أساسي لأعباء عمل الذكاء الاصطناعي الحديثة. لا يمكن للتبريد الهوائي التقليدي، الفعال حتى 35 درجة مئوية فقط مع الاحتفاظ بأداء وحدة المعالجة المركزية بنسبة 80٪، التعامل مع كثافة الحامل التي تتراوح بين 50 و100 كيلووات القياسية الآن في عمليات نشر الذكاء الاصطناعي. وقد أدى هذا القيد إلى ارتفاع قيمة سوق التبريد السائل من 5.65 مليار دولار في عام 2024 إلى 48.42 مليار دولار بحلول عام 2034، مع زيادة معدلات الاعتماد من 7% إلى 22% من مراكز البيانات في ثلاث سنوات فقط.

تتعامل حلول التبريد السائل المباشر إلى الرقاقة الآن مع ما يصل إلى 1600 واط لكل مكون، مما يتيح كثافة أعلى بنسبة 58% للخادم مقارنةً بالتبريد الهوائي مع تقليل استهلاك طاقة البنية التحتية بنسبة 40%. تُظهر شركات مثل JetCool، من خلال التبريد الحراري الدقيق SmartPlate الذي يستهدف النقاط الساخنة لوحدة معالجة الرسومات، ومنصات DLC 3000/7000 من Dell كيف يمكن للإدارة الحرارية المستهدفة أن تحول اقتصاديات النشر. يدفع التبريد بالغمر الحدود إلى أبعد من ذلك، مع أنظمة مثل ICEraQ من GRC التي تحقق قدرة تبريد تصل إلى 368 كيلووات لكل نظام مع الحفاظ على فعالية استخدام الطاقة أقل من 1.03.

الفوائد الكمية مقنعة. يقلل التبريد السائل من استهلاك الطاقة للخوادم بمعدل 11% في المتوسط مع التخلص من 80% من متطلبات مساحة البنية التحتية التقليدية للتبريد. أظهر نشر PhonePe مع شركة Dell انخفاضًا في معدل PUE من 1.8 إلى 1.3 من خلال اعتماد التبريد السائل، مما أدى إلى توفير 40% من الطاقة لعمليات البنية التحتية. بالنسبة لعمليات النشر على نطاق واسع، قامت شركة Supermicro بالفعل بشحن أكثر من 100,000 وحدة معالجة رسومات NVIDIA مع تبريد سائل مدمج، مما يدل على جاهزية التقنية لحجم الإنتاج.

تعمل خبرة النشر الاستراتيجي على سد فجوة التنفيذ.

لقد خلق تعقيد البنية التحتية الحديثة للذكاء الاصطناعي حاجة ماسة لشركاء النشر المتخصصين. تمثل Introl مثالاً على هذه الفئة الجديدة من ممكِّنات البنية التحتية، حيث نمت من شركة ناشئة إلى إدارة عمليات نشر ما يصل إلى 100,000 وحدة معالجة رسومات على مستوى العالم مع نمو الإيرادات السنوية بنسبة تزيد عن 100% منذ عام 2021. يعالج نموذجهم للقوى العاملة كخدمة بشكل مباشر أزمة المواهب التي تؤثر على 90% من المؤسسات، حيث تتسبب فجوات التوظيف في إدارة البنية التحتية للحوسبة المتخصصة في حدوث تأخيرات في النشر تكلف الشركات 5 ملايين دولار أو أكثر يومياً في الفرص الضائعة.

يكشف النموذج التشغيلي لشركة Introl عن أفضل الممارسات لنشر البنية التحتية للذكاء الاصطناعي. ومع وجود أكثر من 550 مهندساً ميدانياً قادرين على التعبئة في 72 ساعة للمشاريع المهمة، فقد نجحوا في نشر 1024 عقدة وحدة معالجة رسومات H100 في أسبوعين فقط لصالح مزود سحابي رئيسي، مما يدل على سرعة التنفيذ المطلوبة في المشهد التنافسي اليوم. تشمل خبرتهم دورة حياة النشر الكاملة، بدءاً من أكثر من 40,000 ميل من كابلات الألياف البصرية لوحدات توصيل وحدة معالجة الرسومات البينية إلى إدارة الطاقة المتقدمة لخزانات الذكاء الاصطناعي بقدرة 120 كيلو وات. تخلق الشراكات الاستراتيجية مع IBM لتكامل منصة Watsonx وJuniper Networks للتبديل عالي الأداء حلولاً شاملة تلبي متطلبات كل من الأجهزة والبرمجيات.

تفضل أنماط النشر المؤسسي بشكل متزايد النُهج الهجينة، حيث تستخدم 59% من الشركات الكبيرة السحابة العامة للتدريب على الذكاء الاصطناعي، بينما تستخدم 60% من الشركات مزودي خدمات التجميع في مواقع مشتركة و49% منها تحتفظ ببنية تحتية محلية. وتعكس هذه الاستراتيجية متعددة الوسائط المتطلبات المتنوعة لأعباء عمل الذكاء الاصطناعي، بدءًا من متطلبات زمن الاستجابة التي تبلغ 2 ميلي ثانية لتصنيع الروبوتات إلى عمليات التدريب المتوازية الضخمة التي تتطلب الآلاف من وحدات معالجة الرسومات المتزامنة. تشترك المؤسسات التي تحقق النجاح في خصائص مشتركة: منصات الذكاء الاصطناعي المركزية التي تقلل من تكاليف النشر اللاحقة بنسبة 50-80%، وفرق متعددة الوظائف تجمع بين الخبرة في المجال والقدرات التقنية، ونهج التوسع التكراري الذي يثبت القيمة قبل النشر على مستوى المؤسسة.

تأثير الأعمال يبلور حتمية البنية التحتية.

تمتد الآثار المالية لنشر البنية التحتية المناسبة لوحدة معالجة الرسومات إلى ما هو أبعد من المقاييس التقنية. تُظهر المؤسسات الرائدة عوائد قابلة للقياس تتراوح بين 150% إلى أكثر من 350% على استثمارات البنية التحتية للذكاء الاصطناعي، حيث حقق بنك JPMorgan Chase إيرادات إضافية بقيمة 220 مليون دولار من التخصيص القائم على الذكاء الاصطناعي وحقق تحسينات في الإنتاجية بنسبة 90% في معالجة المستندات. يكمن الفرق الضئيل بين النجاح والفشل غالبًا في استراتيجية البنية التحتية، حيث تحقق الأنظمة المنشورة بشكل صحيح معدلات استخدام تتراوح بين 85-96% مقارنةً بنسبة 40-60% في التطبيقات سيئة التخطيط.

يكشف تحليل التكلفة الإجمالية للملكية عن أهمية التخطيط الاستراتيجي. عادةً ما تمثل الأجهزة والبنية التحتية 40-60% من إجمالي تكاليف مشروع الذكاء الاصطناعي، حيث تتراوح تكلفة وحدات معالجة الرسومات المتطورة بين 10,000 دولار إلى أكثر من 100,000 دولار لكل منها. ومع ذلك، يمكن أن تتجاوز التكاليف التشغيلية، بما في ذلك إدارة خط أنابيب البيانات، والتدريب على النماذج، والصيانة المستمرة، الاستثمارات الأولية للبناء بمقدار 3-5 أضعاف دون تخطيط سليم. ويتوقع نموذج ماكنزي المكون من ثلاثة سيناريوهات أن تتراوح استثمارات البنية التحتية للذكاء الاصطناعي بين 3.7 تريليون دولار و7.9 تريليون دولار بحلول عام 2030، مع مواءمة المؤسسات للاستراتيجية والتكنولوجيا وإدارة التغيير، مما يحقق زيادة في القيمة السوقية تصل إلى 3 أضعاف.

يؤدي التحول من نماذج الإنفاق الرأسمالي إلى نماذج الإنفاق التشغيلي إلى إعادة تشكيل استراتيجيات النشر. ويعكس نمو سوق وحدات معالجة الرسومات كخدمة من 3.23 مليار دولار إلى 49.84 مليار دولار بحلول عام 2032 رغبة الشركات في المرونة دون استثمارات ضخمة مقدماً. يقدم المزودون المتخصصون تخفيضات في التكاليف بنسبة 80% مقارنةً بنهج البنية التحتية القديمة مع توفير إمكانية الوصول إلى أحدث جيل من الأجهزة. تضمن استراتيجيات المنصة أولاً، التي تتجسد في أهداف وول مارت الاستراتيجية الخمسة للذكاء الاصطناعي المرتبطة مباشرةً بنتائج الأعمال، ترجمة الاستثمارات التكنولوجية إلى قيمة تجارية قابلة للقياس بدلاً من أن تصبح تجارب مكلفة.

الخاتمة

تتطلب ثورة البنية التحتية للذكاء الاصطناعي إعادة التفكير بشكل أساسي في تصميم مراكز البيانات واستراتيجيات النشر ونماذج الشراكة. تخلق ابتكارات NVIDIA في مجال سلاسة الطاقة GB300 NVL72 من NVIDIA، بالإضافة إلى تحول التبريد السائل في الإدارة الحرارية، إمكانيات لنشر الذكاء الاصطناعي على نطاقات كانت مستحيلة في السابق. ومع ذلك، فإن التكنولوجيا وحدها لا تضمن النجاح - فمعدل فشل مشاريع الذكاء الاصطناعي التي تصل إلى مرحلة الإنتاج بنسبة 85% يسلط الضوء على الأهمية الحاسمة للتميز في التنفيذ.

تشترك المؤسسات التي تنجح في هذا المشهد الجديد في ثلاث خصائص: فهي تستثمر في استراتيجيات البنية التحتية للمنصة أولاً التي تتيح التوسع السريع، وتتعاون مع خبراء متخصصين في النشر للتغلب على ثغرات المواهب والتنفيذ، وترفض بناء أي شيء لا يؤثر بشكل مباشر على الإيرادات أو الكفاءة. لا توجد مشاريع تافهة ولا "مختبرات ابتكار" لا تنتج شيئاً. فقط البنية التحتية التي تجني المال.

شبكات الطاقة تصل إلى الحد الأقصى. أنظمة التبريد تصل إلى حدودها الفيزيائية. الشركات التي تكتشف كيفية جعل كل هذه الأجزاء تعمل معًا - الأجهزة والتبريد والنشر - ستمتلك العقد القادم. وسيتخلف الآخرون عن الركب. ستحدد قرارات البنية التحتية التي يتم اتخاذها اليوم أي المؤسسات ستتمكن من الاستفادة من الإمكانات التحويلية للذكاء الاصطناعي وأيها سيصبح متفرجاً على الثورة.

المراجع

Aethir. "Maximizing ROI: The Business Case for Renting GPUs." Aethir Blog, 2025. https://aethir.com/blog-posts/maximizing-roi-the-business-case-for-renting-gpus. Agility at Scale. "Proving ROI - Measuring the Business Value of Enterprise AI." Agility at Scale, 2025. https://agility-at-scale.com/implementing/roi-of-enterprise-ai/. AI Infrastructure Alliance. "The State of AI Infrastructure at Scale 2024." AI Infrastructure Alliance, 2024. https://ai-infrastructure.org/the-state-of-ai-infrastructure-at-scale-2024/. CIO. "As AI Scales, Infrastructure Challenges Emerge." CIO, 2025. https://www.cio.com/article/3577669/as-ai-scales-infrastructure-challenges-emerge.html. ClearML. "Download the 2024 State of AI Infrastructure Research Report." ClearML Blog, 2024. https://clear.ml/blog/the-state-of-ai-infrastructure-at-scale-2024. Credence Research. "Cloud GPU Market Size, Growth & Forecast to 2032." Credence Research, 2025. https://www.credenceresearch.com/report/cloud-gpu-market. DDN. "Five AI Infrastructure Challenges and Their Solutions." DDN Resources, 2025. https://www.ddn.com/resources/research/artificial-intelligence-success-guide/. Deloitte Insights. "Generating Value from Generative AI." Deloitte, 2025. https://www2.deloitte.com/us/en/insights/topics/digital-transformation/companies-investing-in-ai-to-generate-value.html. Edge AI and Vision Alliance. "The Rise of AI Drives a Ninefold Surge in Liquid Cooling Technology." Edge AI and Vision Alliance, October 2024. https://www.edge-ai-vision.com/2024/10/the-rise-of-ai-drives-a-ninefold-surge-in-liquid-cooling-technology/. Flexential. "State of AI Infrastructure Report 2024." Flexential, 2024. https://www.flexential.com/resources/report/2024-state-ai-infrastructure. Fortune Business Insights. "GPU as a Service Market Size, Growth | Forecast Analysis [2032]." Fortune Business Insights, 2025. https://www.fortunebusinessinsights.com/gpu-as-a-service-market-107797. Gartner. "Gartner Identifies the Top Trends Impacting Infrastructure and Operations for 2025." Gartner Newsroom, December 11, 2024. https://www.gartner.com/en/newsroom/press-releases/2024-12-11-gartner-identifies-the-top-trends-impacting-infrastructure-and-operations-for-2025. GlobeNewswire. "$48.42 Billion Data Center Liquid Cooling Markets 2024-2025 and 2034: Key Growth Drivers Include Advanced Technologies such as Immersion and Direct-to-Chip Cooling." GlobeNewswire, February 5, 2025. https://www.globenewswire.com/news-release/2025/02/05/3021305/0/en/48-42-Billion-Data-Center-Liquid-Cooling-Markets-2024-2025-and-2034.html. Grand View Research. "Data Center GPU Market Size & Share | Industry Report 2033." Grand View Research, 2025. https://www.grandviewresearch.com/industry-analysis/data-center-gpu-market-report. Grand View Research. "GPU As A Service Market Size, Trends | Industry Report 2030." Grand View Research, 2025. https://www.grandviewresearch.com/industry-analysis/gpu-as-a-service-gpuaas-market-report. GR Cooling. "Liquid Immersion Cooling for Data Centers." GR Cooling, 2025. https://www.grcooling.com/. IBM. "What is AI Infrastructure?" IBM Think, 2025. https://www.ibm.com/think/topics/ai-infrastructure. Introl. "GPU Infrastructure, Data Center Solutions & HPC Deployment." Introl Blog, 2025. https://introl.com/blog. Introl. "Introl - GPU Infrastructure & Data Center Deployment Experts." Introl, 2025. https://introl.com. LakeFS. "What Is AI Infrastructure: Benefits & How To Build One." LakeFS Blog, 2025. https://lakefs.io/blog/ai-infrastructure/. MarketsandMarkets. "Data Center GPU Market Size, Share & Trends, 2025 To 2030." MarketsandMarkets, 2025. https://www.marketsandmarkets.com/Market-Reports/data-center-gpu-market-18997435.html. McKinsey & Company. "How Data Centers and the Energy Sector Can Sate AI's Hunger for Power." McKinsey Insights, 2025. https://www.mckinsey.com/industries/private-capital/our-insights/how-data-centers-and-the-energy-sector-can-sate-ais-hunger-for-power. McKinsey & Company. "The Cost of Compute: A $7 Trillion Race to Scale Data Centers." McKinsey Insights, 2025. https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/the-cost-of-compute-a-7-trillion-dollar-race-to-scale-data-centers. NVIDIA. "Designed for AI Reasoning Performance & Efficiency | NVIDIA GB300 NVL72." NVIDIA Data Center, 2025. https://www.nvidia.com/en-us/data-center/gb300-nvl72/. NVIDIA. "GB200 NVL72." NVIDIA Data Center, 2025. https://www.nvidia.com/en-us/data-center/gb200-nvl72/. NVIDIA Developer. "How New GB300 NVL72 Features Provide Steady Power for AI." NVIDIA Technical Blog, 2025. https://developer.nvidia.com/blog/how-new-gb300-nvl72-features-provide-steady-power-for-ai/. NVIDIA Developer. "NVIDIA Blackwell Ultra for the Era of AI Reasoning." NVIDIA Technical Blog, 2025. https://developer.nvidia.com/blog/nvidia-blackwell-ultra-for-the-era-of-ai-reasoning/. Precedence Research. "Data Center GPU Market Size and Growth 2025 to 2034." Precedence Research, 2025. https://www.precedenceresearch.com/data-center-gpu-market. Precedence Research. "GPU as a Service Market Size and Forecast 2025 to 2034." Precedence Research, 2025. https://www.precedenceresearch.com/gpu-as-a-service-market. Supermicro. "Supermicro Solidifies Position as a Leader in Complete Rack Scale Liquid Cooling Solutions -- Currently Shipping Over 100,000 NVIDIA GPUs Per Quarter." Supermicro Press Release, 2025. https://www.supermicro.com/en/pressreleases/supermicro-solidifies-position-leader-complete-rack-scale-liquid-cooling-solutions. Techstack. "Measuring the ROI of AI: Key Metrics and Strategies." Techstack Blog, 2025. https://tech-stack.com/blog/roi-of-ai/. TechTarget. "Liquid Cooling's Moment Comes Courtesy of AI." TechTarget SearchDataCenter, 2025. https://www.techtarget.com/searchdatacenter/feature/Liquid-coolings-moment-comes-courtesy-of-ai. The Register. "AI DC Investment a Gamble as ROI Uncertain, Says McKinsey." The Register, May 1, 2025. https://www.theregister.com/2025/05/01/ai_dc_investment_gamble/. VentureBeat. "5 Ways to Overcome the Barriers of AI Infrastructure Deployments." VentureBeat, 2025. https://venturebeat.com/ai/5-ways-to-overcome-the-barriers-of-ai-infrastructure-deployments/. VentureBeat. "From Pilot to Profit: The Real Path to Scalable, ROI-Positive AI." VentureBeat, 2025. https://venturebeat.com/ai/from-pilot-to-profit-the-real-path-to-scalable-roi-positive-ai/. World Economic Forum. "Why AI Needs Smart Investment Pathways to Ensure a Sustainable Impact." World Economic Forum Stories, June 2025. https://www.weforum.org/stories/2025/06/why-ai-needs-smart-investment-pathways-to-ensure-a-sustainable-impact/.

السابق
السابق

Grok 4 حطم للتو سقف الذكاء الاصطناعي - وإليك السبب في أن ذلك يغير كل شيء

التالي
التالي

بناء مراكز البيانات مع وضع الاستدامة في الاعتبار: ما الذي ينجح