Kami baru-baru ini melihat eksploit sebesar $1,78 juta yang disebabkan oleh kerentanan yang ditulis oleh Claude Opus 4.6.


cbETH dipatok pada $1 bukan $2.000.
Tak lama setelah @OpenAI meluncurkan EVMbench. Singkatnya, ini adalah tolok ukur yang mengevaluasi kemampuan agen AI untuk berinteraksi dengan kontrak pintar.

Ini memiliki 3 mode evaluasi utama:
> Detect: menganalisis kemampuan agen untuk mendeteksi kerentanan
> Patch: menganalisis kemampuan agen untuk memperbaiki kerentanan tersebut
> Exploit: menganalisis kemampuan agen untuk mengeksploitasi kerentanan tersebut
Analisis mereka menunjukkan bahwa model terbaru (Opus 4.6, GPT-5.3-Codex, dll.) sangat baik dalam mengeksploitasi kerentanan, tetapi lemah dalam mendeteksi dan memperbaikinya.
Dan itulah yang saya amati saat menjalankan agen saya sendiri pada model terbaru. Dalam tim agen saya, saya selalu menyertakan agen auditor yang mendapatkan konteks penuh, dengan tujuan utama menemukan kerentanan.
Ketika menemukan satu, agen pengembang memperbaikinya dengan mudah.
Tapi masalahnya adalah dari 10 kerentanan, mungkin hanya menemukan 3. Untuk saat ini, kita benar-benar tidak bisa mengandalkan agen untuk mendeteksi kerentanan dengan benar.
Meluncurkan tolok ukur ini adalah langkah yang sangat kuat. Saya bersemangat untuk mengujinya dengan agen saya.
Untuk jelasnya, ini bukan pemindai keamanan atau alat audit siap produksi. Ini terutama dimaksudkan untuk mengukur kemampuan AI, membandingkan model, dan memberikan metrik tentang bagaimana AI berkembang di bidang ini.
Pada dasarnya, ini adalah alat yang memungkinkan AI dievaluasi dan ditingkatkan di bidang ini, dan sejujurnya, kita sangat membutuhkannya.
Lihat Asli
post-image
post-image
post-image
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)