واو، غروك 4 للتو استولى على العرش في لوحة المتصدرين GPQA Diamond. نحن نتحدث عن سحق كل نموذج ذكاء اصطناعي آخر موجود عندما يتعلق الأمر بأصعب الأسئلة العلمية التي يمكنك طرحها عليه.
هذا ليس مجرد ترقية بسيطة - هذا هو النموذج الذي يتعامل مع المشاكل التي تجعل حاملي الدكتوراه يتعرقون. تم تصميم اختبارات GPQA Diamond لتكون صعبة بشكل Brutal، النوع من الأمور التي تتطلب تفكيرًا عميقًا عبر مجالات علمية متعددة. وGrok 4؟ مباشرة إلى المرتبة الأولى.
ما يجعل هذا مثيرًا للاهتمام حقًا هو مدى سرعة هذه النماذج في التطور. قبل بضعة أشهر، كنا نحتفل بمعايير مختلفة، والآن فإن المستوى يستمر في التغير. ما هي الآثار على البحث، والحوسبة العلمية، وأيضًا، حتى تحسين بنية البلوكشين؟ تعتبر كبيرة جدًا عندما تفكر في قوة الحوسبة وقدرات حل المشكلات التي نفتحها هنا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 15
أعجبني
15
7
إعادة النشر
مشاركة
تعليق
0/400
GameFiCritic
· منذ 6 س
البيانات هي الملك! لقد تصدرت Grok قائمة الترتيب، وa16z على وشك الجنون
شاهد النسخة الأصليةرد0
failed_dev_successful_ape
· منذ 13 س
أسرع حتى من عقلي
شاهد النسخة الأصليةرد0
ShortingEnthusiast
· منذ 13 س
لا يوجد أفضل من اللاحقين.
شاهد النسخة الأصليةرد0
LiquidationSurvivor
· منذ 13 س
没啥 ثور的 Grok这速度在web3跑داخل السلسلة怕是要炸
شاهد النسخة الأصليةرد0
airdrop_whisperer
· منذ 13 س
الضفدع البقري، الضفدع البقري، GPT أصبح أكثر جنونًا يوماً بعد يوم
واو، غروك 4 للتو استولى على العرش في لوحة المتصدرين GPQA Diamond. نحن نتحدث عن سحق كل نموذج ذكاء اصطناعي آخر موجود عندما يتعلق الأمر بأصعب الأسئلة العلمية التي يمكنك طرحها عليه.
هذا ليس مجرد ترقية بسيطة - هذا هو النموذج الذي يتعامل مع المشاكل التي تجعل حاملي الدكتوراه يتعرقون. تم تصميم اختبارات GPQA Diamond لتكون صعبة بشكل Brutal، النوع من الأمور التي تتطلب تفكيرًا عميقًا عبر مجالات علمية متعددة. وGrok 4؟ مباشرة إلى المرتبة الأولى.
ما يجعل هذا مثيرًا للاهتمام حقًا هو مدى سرعة هذه النماذج في التطور. قبل بضعة أشهر، كنا نحتفل بمعايير مختلفة، والآن فإن المستوى يستمر في التغير. ما هي الآثار على البحث، والحوسبة العلمية، وأيضًا، حتى تحسين بنية البلوكشين؟ تعتبر كبيرة جدًا عندما تفكر في قوة الحوسبة وقدرات حل المشكلات التي نفتحها هنا.