Grok 4 حطم للتو سقف الذكاء الاصطناعي - وإليك السبب في أن ذلك يغير كل شيء

1 أغسطس

نقدم لكم Grok 4، أقوى نموذج ذكاء اصطناعي في العالم. شاهد البث المباشر الآن: https://t.co/59iDX5s2ck
- xAI (@xai) 10 يوليو 2025

حسناً، تصاعد ذلك بسرعة. فقبل ثلاثة أسابيع، أطلق إيلون ماسك و xAI برنامج Grok 4 على عالم غير مرتاب، ولا تزال المعايير تجعل الباحثين المخضرمين في مجال الذكاء الاصطناعي يرددون كلمات مزدوجة. تخيّل ذكاءً اصطناعيًا يتوصل إلى حلول للمشاكل مثل فريق من حملة الدكتوراه الذين يتناولون الكافيين في الثالثة صباحًا. والآن بعد أن هدأت الضجة الأولية واختبار المطورين ل Grok 4، دعوني أشرح لكم لماذا يمثل هذا النموذج أكثر من مجرد إصدار آخر - إنه لمحة عن مستقبل يصبح فيه الذكاء الاصطناعي شريكاً فكرياً حقيقياً.

https://x.com/xai/status/1943158495588815072

الإطلاق الذي حطم الإنترنت (وبعض الأرقام القياسية)

كشفت شركة xAI النقاب عن Grok 4 في 9 يوليو 2025، من خلال بث مباشر جذب 1.5 مليون مشاهد - ليس سيئًا بالنسبة لعرض تقديمي تقني في الليل.¹ كان التوقيت مثيرًا للاهتمام، حيث جاء بعد يوم واحد فقط من تصدر Grok 3 عناوين الأخبار لجميع الأسباب الخاطئة مع بعض المخرجات المثيرة للجدل.² لكن xAI قررت أن أفضل دفاع هو الهجوم الساحق.

قدم ماسك نوعين مختلفين: Grok 4 القياسي و Grok 4 Heavy، حيث يقوم الأخير بنشر العديد من وكلاء الذكاء الاصطناعي الذين يقومون بمراجعة عمل بعضهم البعض مثل مجموعة دراسية حيث يقوم الجميع بالقراءة.³ يتم تشغيل الوصول من خلال تطبيق Grok أو الموقع الإلكتروني أو واجهة برمجة التطبيقات، مع وجود Heavy حصريًا لمشتركي SuperGrok Heavy بسعر 300 دولار شهريًا - وهي نقطة سعر تقول "نحن جادون في هذا الأمر."⁴ للفضوليين: https://x.ai/grok للوصول العام https://x.ai/api للمطورين

ميزات تجعل الذكاء الاصطناعي الأخرى تبدو مثل الآلات الحاسبة

يحتوي Grok 4 على نافذة سياق مكونة من 256,000 رمز (أي ما يعادل تقريبًا نصًا روائيًا يمكنه معالجته في آن واحد)، وتحليل الصور، واستدعاء الوظائف، وأوضاع صوتية طبيعية جدًا لدرجة أنك قد تنسى أنك تتحدث إلى السيليكون.⁵ ولكن هنا حيث يصبح الأمر مثيرًا: استخدام الأداة الأصلية. لقد درّبت xAI هذا الوحش بالتعلم المعزز على استخدام مترجم أكواد وامتدادات تشبه متصفح الويب في عقله.

يحافظ البحث في الوقت الفعلي عبر X والويب والأخبار على تحديث الإجابات - لا مزيد من أعذار "انقطاع معرفتي". تتيح الإمكانيات متعددة الوسائط المزج بين تحليل النص والرؤية بسلاسة، بينما يضيف الوضع الصوتي تحليل المشهد من خلال الكاميرا.⁶ بالنسبة للمؤسسات التي تتعب من أجل الامتثال: SOC 2 من النوع 2، واللائحة العامة لحماية البيانات، وقانون حماية البيانات العامة (GDPR)، وقانون حماية خصوصية المستهلك (CCPA). إنه مثل الحصول على مساعد بحث بارع لا ينام أبداً، ولا يشتكي أبداً من العمل الإضافي، ويفهم خط يدك الرهيب.

الصلصة السرية: عندما تلتقي القوة الغاشمة مع البراعة

ويكمن وراء سحر Grok 4 الحاسوب العملاق Colossus من xAI، وهو عبارة عن حاسوب خارق من شركة xAI، وهو عبارة عن وحش من 200 ألف وحدة معالجة معالجة بيانات تجعل معظم مراكز البيانات تبدو وكأنها حاسبات جيبية.⁷ ولكن القوة الخام لا تروي القصة بأكملها، فقد أحدثت xAI ثورة في نهجها من خلال توسيع نطاق التعلم المعزز ليطابق الحوسبة قبل التدريب، مع التركيز على البيانات القابلة للتحقق من الرياضيات والترميز والمجالات العلمية، مما عزز الكفاءة بمقدار 6 أضعاف، محولةً العضلات الحاسوبية إلى ذكاء مصقول.⁸

الابتكار الحقيقي؟ لقد أنفقوا على التعلم المعزز بعد التدريب بقدر ما أنفقوا على التعلم المعزز قبل التدريب نفسه. ⁹ يأخذ Grok 4 Heavy النهج إلى أبعد من ذلك مع الحوسبة المتوازية في وقت الاختبار - حيث يقوم العديد من وكلاء الذكاء الاصطناعي بمعالجة المشاكل في وقت واحد قبل مقارنة الملاحظات. تخيل الترقية من مخترع منفرد في المرآب إلى أوركسترا متزامنة من الحائزين على جائزة نوبل، كل منهم يتحقق من عمل الآخرين.

التحقق من واقع البنية التحتية

يحتوي الحاسوب العملاق Colossus على 200,000 وحدة معالجة رسوميات، وهو ما يمثل... لا يمكنني حتى استيعاب هذا الرقم. تشعر معظم الشركات بسعادة غامرة عندما تحصل على مجموعة من بضع مئات من وحدات معالجة الرسومات تعمل بسلاسة. لكن 200,000؟ سيكون ناتج الحرارة وحده مثل تشغيل محطة طاقة صغيرة.

وهذا قبل أن تفكر حتى في توصيلها جميعًا بشكل مناسب، وإبقائها مزودة بالبيانات، والتأكد من أن شبكة الطاقة الخاصة بك لا تنقطع عنك.... كل التفاصيل مهمة: كيف تقوم بترتيب الرفوف، ونوع التبريد الذي تستخدمه (ونعم، تحتاج إلى تبريد شديد لأن هذه الأشياء تصبح ساخنة)، بالإضافة إلى جميع كوابيس الشبكات وتوزيع الطاقة التي تأتي معها. إذا أفسدت أي جزء من هذه الأحجية، فإنك ستحرق المال على أجهزة ضعيفة الأداء. تحتاج الشركات التي تتطلع إلى بناء بنية تحتية خاصة بها للذكاء الاصطناعي، سواء كانت 10 وحدات معالجة رسومات أو 10,000,000، إلى خبرة في كل شيء بدءاً من توزيع الطاقة إلى توصيلات الألياف البصرية المعقدة التي تحافظ على تدفق البيانات بسرعة الضوء. هذه هي النقطة التي يُحدث فيها نشر البنية التحتية الاحترافية الفرق بين المواصفات النظرية والأداء في العالم الحقيقي. وكما يعلم الفريق في Introl من خلال نشر عدد لا يحصى من مجموعات الذكاء الاصطناعي، فإن الشيطان يكمن حقاً في التفاصيل، فالبنية التحتية المناسبة يمكن أن تعني الفرق بين وحدات معالجة الرسومات التي تعمل بكفاءة 95% مقابل ترك 30% من أدائك على الطاولة.

الأرقام التي تجعل الإحصائيين يبكون من الفرح

دعونا نتعمق في المعايير التي تثير اهتمام مجتمع الذكاء الاصطناعي. في اختبار ARC-AGI-2 المعروف بوحشيته - حيث يجب على النماذج أن تُظهر التفكير المجرد مع الحد الأدنى من الأمثلة - يتربع بروك 4 (وضع التفكير) على العرش بنسبة 15.9% بحوالي 4 دولارات لكل مهمة.¹⁰ وهذا يضاعف تقريبًا نسبة 8.6% التي حققها كلود أوبوس 4، وقبل أن تسخر من "15.9% فقط"، تذكر أن معظم النماذج تكافح لتجاوز نسبة 5% في هذا الاختبار.¹ إنه مثل مشاهدة شخص ما يحل مكعبات روبيك معصوب العينين بينما لا يزال الجميع يكتشف أي جانب هو الأحمر.

تكشف تجارب القياس عن شيء رائع. باستخدام حوسبة التدريب وحدها، يصل Grok 4 إلى حوالي 50% في اختبار البشرية الأخير (مجموعة فرعية نصية فقط). عند إضافة الأدوات، تقفز النسبة إلى 50.7% ¹²، مما يثبت أن استراتيجيات الاستدلال الأكثر ابتكارًا - وليس فقط إلقاء المزيد من الحوسبة على المشاكل - هي التي تقود إلى تحقيق إنجازات.

في AIME25 (امتحان الرياضيات الدعوي الأمريكي AIME25)، حقق Grok 4 Heavy نسبة 100% كاملة، تاركًا كلود 4 أوبوس (75.5%) وGemini 2.5 Pro (88.0%) في الغبار.¹³ حتى بدون أدوات، حقق Grok 4 القياسي 91.7% - وهذا أفضل من معظم المشاركين في مسابقة الرياضيات البشرية.

ولكن إليك أهم ما في الأمر: اختبار الإنسانية الأخير (مجموعة كاملة). يفصل أكثر من 2500 سؤال في أكثر من 2500 سؤال في العلوم والتكنولوجيا والهندسة والرياضيات والعلوم الإنسانية بين الحفظ والاستنتاج الحقيقي.¹⁴ حقق Grok 4 Heavy نتائج 44.4%، أي ما يقرب من ضعف نتائج Gemini 2.5 Pro بنسبة 25.4% وأكثر من ضعف نتائج o3 بنسبة 21.0%.¹⁵ عندما يتفوق الذكاء الاصطناعي الخاص بك على الآخرين بهذه الهوامش، فأنت لا تقوم بالتكرار - بل تقوم بإحداث ثورة.

الأداء الواقعي المهم في العالم الحقيقي

بعيدًا عن المعايير الأكاديمية، تهيمن Grok 4 على الاختبارات العملية. على Vending-Bench (نعم، هذا معيار حقيقي حول تحسين عمليات ماكينات البيع)، حقق صافي قيمة صافية قدرها 4,694 دولارًا أمريكيًا مع بيع 4,569 وحدة - أكثر من ضعف ما حققته كلود أوبوس 4 البالغة 2,077 دولارًا أمريكيًا وخمسة أضعاف الأداء البشري عند 844 دولارًا أمريكيًا.¹⁶

انتصارات إضافية: USAMO'25 (61.9%)، وGPQA Diamond (88%)، وLiveCodeBench (79.4%)، وMMLU-Pro (87%).¹⁷ يتوج المقيّمون المستقلون في Artificial Analysis Grok 4 بـ 73 على مؤشر الذكاء الخاص بهم، متفوقًا على نموذج OpenAI o3 وجوزاء 2.5 Pro من Google (كلاهما بـ 70).¹⁸ ليس سيئًا بالنسبة لنموذج ظهر قبل ثلاثة أسابيع فقط.

حكم المجتمع: متحمس ومتشكك وكل شيء بينهما

منذ إطلاقه، أصبح X (تويتر سابقًا) ساحة اختبار لقدرات Grok 4. فقد أبلغ المطورون عن لصق قواعد برمجية كاملة لتصحيح الأخطاء، مع نتائج تتفوق على الأدوات المتخصصة مثل Cursor.¹⁹ ووصفه أحد المستخدمين بأنه "أقرب شيء إلى الذكاء الاصطناعي الآلي المُعزز حتى الآن"، بينما يستفسر العلماء عن مشاكل المواد التي لم تُحل ويتلقون رؤى جديدة تتحقق من ذلك.²⁰ بعد ثلاثة أسابيع من الاستخدام في العالم الحقيقي، ظهرت أنماط: يتفوق النموذج في مهام التفكير المعقدة ولكنه يظهر مراوغات مثيرة للاهتمام في التطبيقات الإبداعية.

لكن الأمر ليس كله تصفيق حار. يلاحظ المستخدمون قيود السرعة عند 75 توكن/الثانية (محترمة ولكنها ليست مذهلة)، ولا يزال الإشراف على المحتوى في حده الأدنى - حيث إن Grok 4 أقل تصفية من المنافسين، مما أثار نقاشات حول حيادية الذكاء الاصطناعي مقابل الأمان.²¹ البعض يقدّر الردود الخام غير المشفرة؛ بينما يقلق آخرون بشأن إساءة الاستخدام المحتملة. الديمقراطية في العمل يا رفاق.

ما الذي يعنيه هذا الأمر بالنسبة للغد (المفسد: كل شيء يتغير)

هنا حيث ينطلق تفاؤلي إلى أقصى درجاته. يتجاوز Grok 4 فئة روبوتات الدردشة الآلية - إنه معاينة للذكاء الاصطناعي كشريك فكري. عندما يحرز الذكاء الاصطناعي نتائج على مستوى الدكتوراه في مسابقات الرياضيات ويساعد العلماء على استكشاف المشاكل التي لم تُحل، فإننا نشهد فجر الاكتشاف المعزز.

للعلوم: تخيل الباحثين في جميع أنحاء العالم مع إمكانية الوصول إلى ذكاء اصطناعي يفهم الرياضيات المعقدة حقًا ويمكنه اقتراح فرضيات جديدة. اكتشاف العقاقير ونمذجة المناخ وعلوم المواد - كل ذلك بشكل متسارع.

للهندسة: بعيدًا عن تصحيح الأخطاء، نحن نتحدث عن الذكاء الاصطناعي الذي يستوعب بنية النظام ويمكنه اقتراح تحسينات قد لا يفكر فيها البشر أبدًا. إنه مثل وجود ديكسترا وتورينج على الاتصال الهاتفي السريع.

للتعليم: الدروس الخصوصية المخصصة التي تتكيف ليس فقط مع ما يخطئ فيه الطلاب، ولكن مع طريقة تفكيرهم. يحصل كل متعلم على معلم صبور وبارع مصمم خصيصًا لأسلوبه المعرفي.

للأعمال من التخطيط الاستراتيجي إلى تحليل السوق، يمكن لقدرات Grok 4 المنطقية أن تحوّل عملية اتخاذ القرار من المشاعر الغريزية إلى رؤى قائمة على البيانات بفهم دقيق.

المحاذير (لأن الصدق يغلب الضجيج)

لنبقي الأمر واقعيًا - لا يوجد ذكاء اصطناعي مثالي، وGrok 4 لديه مساحة للنمو. لن تفوز سرعة 75 رمزًا/الثانية بأي سباقات ضد خوادم الاستدلال المتخصصة. على الرغم من انخفاض الهلوسة، إلا أنها لم تختفِ تمامًا (وهو تحدٍ على مستوى الصناعة). يثير الحد الأدنى من تصفية المحتوى مخاوف صحيحة بشأن إمكانية إساءة الاستخدام.

انظر، لم تخبرنا xAI بأي شيء عن بيانات التدريب الخاصة بهم، وهذا ليس بالأمر الرائع. نعلم جميعاً كيف يسير هذا الأمر - تتضخم تحيزات البيانات عندما تتوسع بهذا الحجم. الجميع في مجال الذكاء الاصطناعي يراقبون الذكاء الاصطناعي مثل الصقور في الوقت الحالي. كيف سيتعاملون مع مسألة الأخلاقيات مع انتشار Grok 4؟ سيكون ذلك مهماً - كثيراً.

الطريق إلى الأمام: الأمور على وشك أن تصبح غريبة

لذا، عرضت xAI بعضاً من خططهم خلال العرض التقديمي، وهناك شيء واحد أذهلني تماماً. لقد ذكروا ربط Grok ببرنامج ديناميكيات الموائع الحسابية الخاص بشركة Tesla - وهو نفس برنامج ديناميكيات الموائع الحسابية الذي يستخدمه مهندسو Tesla للديناميكا الهوائية والإدارة الحرارية في السيارات الفعلية.²²

كان عليّ أن أجلس مع ذلك لدقيقة. لقد اعتدنا على الذكاء الاصطناعي الذي يعرف الحقائق، ويجيب عن الأسئلة، ويكتب الأكواد البرمجية. لكن تكامل CFD يمثل شيئاً مختلفاً. إنه شيء واحد أن يكون لديك ذكاء اصطناعي يمكنه شرح كيفية عمل ديناميكيات الموائع. ولكنه شيء مختلف تماماً عندما يستطيع هذا الذكاء الاصطناعي استخدام برنامج CFD لتصميم الأشياء التي تتحرك في الهواء وتبدد الحرارة. هذا ليس تقدماً تدريجياً - هذه قدرة جديدة تماماً.

لن يشاهد OpenAI وAthropic وGoogle من على الهامش. لكن Grok 4 غيرت اللعبة - فقد انتقلنا من منطقة "المساعد المساعد المساعد" مباشرة إلى "الشريك المنطقي". يذكّرني هذا التحول بما تحدث عنه راي كورزويل عن انفجار الذكاء - كل اختراق يجعل الاختراق الذي يليه يحدث بشكل أسرع وأسرع. نحن نشاهد ذلك يحدث في الوقت الفعلي.

دورك: ماذا ستبني؟

لذلك كنت أفكر - ماذا يحدث عندما يتمكن الذكاء الاصطناعي من التفكير على مستوى الدكتوراه في جميع المجالات؟ ما هي المشاكل التي كانت تبدو مستحيلة تنفتح فجأة على مصراعيها؟ ما الذي نكتشفه عندما تتمكن أدواتنا من التفكير إلى جانبنا؟ وبصراحة، ما نوع الحواجز التي نحتاج إلى وضعها عندما يصبح الذكاء الاصطناعي بهذا الذكاء؟

إذا كنت مطورًا، فأنت تخطط بالفعل لما ستبنيه باستخدام واجهات برمجة التطبيقات هذه. من المحتمل أن الباحثين يقضون يومًا حافلًا بالتفكير فيما أصبح ممكنًا فجأة. وإذا كنت جالسًا هنا تفكر، "ماذا تعني قدرة Grok 4 حتى؟ يستغرق المفهوم وقتاً طويلاً لمعالجته.

ولكن إليك الأمر: لقد هبط Grok 4 في أحضاننا سواء كنا مستعدين أم لا. لقد قال الذكاء الاصطناعي للتو، "هذا ما هو ممكن الآن، اكتشفوا ما يمكنكم فعله به."

إذن... ماذا ستفعل به؟ واجهة برمجة تطبيقات Grok موجودة على https://x.ai/apiوهناك مجتمع كامل على X حيث يقوم المطورون والباحثون بالفعل بتخطي الحدود. بعد ثلاثة أسابيع، نرى تطبيقات لم يتوقعها أحد عند الإطلاق. الفرصة هنا هائلة - دعونا لا نضيعها.

المراجع

سكوت روزنبرغ، "Elon Musk's xAI لأول مرة Grok 4، "أذكى ذكاء اصطناعي في العالم"، أكسيوس، 10 يوليو 2025, https://www.axios.com/2025/07/10/grok4-grok-xai-elon-musk.
"ماسك يكشف النقاب عن تحديث Grok 4 بعد يوم واحد من إدلاء روبوت الدردشة xAI بتصريحات معادية للسامية"، CBS News، 10 يوليو 2025, https://www.cbsnews.com/news/elon-musk-grok-4-ai-chatbot-x/.
"إيلون ماسك xAI يطلق Grok 4 إلى جانب اشتراك شهري بقيمة 300 دولار"، TechCrunch، 9 يوليو 2025, https://techcrunch.com/2025/07/09/elon-musks-xai-launches-grok-4-alongside-a-300-monthly-subscription/.
"xAI لإيلون ماسك يطلق Grok 4 إلى جانب اشتراك شهري بقيمة 300 دولار"، TechCrunch.
xAI، "إعلان إصدار Grok 4،" عرض تقديمي مباشر، 9 يوليو 2025.
xAI، "إعلان إصدار Grok 4".
"إصدار Grok 4: xAI يطالب بتاج نموذج الذكاء الاصطناعي رقم 1 في الاختبارات المستقلة"، Gear Musk، 10 يوليو 2025, https://gearmusk.com/2025/07/10/xai-unveils-grok-4/.
xAI، "إعلان إصدار Grok 4".
"ماسك جروك-4 الخاص بـ Musk يحطم المعايير ويتفوق على OpenAI وجوجل في مجال الذكاء الاصطناعي في مجال الذكاء الاصطناعي"، مجلة Analytics India، 10 يوليو 2025, https://analyticsindiamag.com/global-tech/musks-grok-4-crushes-benchmarks-beats-openai-google-in-rl/.
"جائزة ARC"، X (تويتر سابقًا)، 10 يوليو 2025, https://twitter.com/arcprize/status/ [معرف محدد].
فرانسوا شوليه، "ARC-AGI: حدود جديدة في الاستدلال بالذكاء الاصطناعي"، منظمة جائزة ARC، 2025.
xAI، "إعلان إصدار Grok 4".
"نماذج Elon Musk's Grok 4 للذكاء الاصطناعي من إيلون ماسك تسجل أرقامًا قياسية جديدة"، بيبوم، 10 يوليو 2025, https://beebom.com/elon-musk-grok-4-ai-models-set-new-benchmark-records/.
"xAI يضع أرقامًا قياسية للذكاء الاصطناعي مع نموذج Grok 4 الجديد المحسّن للمنطق"، SiliconANGLE، 10 يوليو 2025, https://siliconangle.com/2025/07/10/xai-sets-ai-benchmark-records-new-reasoning-optimized-grok-4-model/.
xAI، "إعلان إصدار Grok 4".
xAI، "إعلان إصدار Grok 4".
xAI، "إعلان إصدار Grok 4".
"مقارنة بين نماذج الذكاء الاصطناعي عبر الذكاء والأداء والسعر"، التحليل الاصطناعي، تم الوصول إليه في 11 يوليو 2025, https://artificialanalysis.ai/models.
شهادات المستخدمين، X (تويتر سابقًا)، 10-11 يوليو 2025.
شهادات المستخدمين، X (تويتر سابقًا)، 10-11 يوليو 2025.
"ما الجديد في Grok 4؟ حقائق الإصدار والمعايير والقيمة"، SmythOS، 10 يوليو 2025, https://smythos.com/developers/ai-models/whats-new-in-grok-4-release-facts-benchmarks-and-value/.
xAI، "إعلان إصدار Grok 4".

بليك كروسلي