Штучний інтелект для аудиту виходить у реальну практику, OpenAI випустила EVMbench, посилюючи безпеку оцінки смарт-контрактів

CryptoCity

2026-02-20 04:10:56

ETH-1,06%

WELL-4,37%

OpenAI спільно з Paradigm запускає EVMbench, що тестує здатність AI-агентів до атак і захисту в смарт-контрактах EVM, викриваючи слабкі місця та переваги.

Зосереджуючись на реальних економічних умовах, OpenAI у партнерстві з Paradigm посилює оцінку безпеки блокчейну

Лідер у сфері штучного інтелекту OpenAI оголосив про співпрацю з відомою компанією з ризикових інвестицій у криптовалюти Paradigm та компанією з безпеки OtterSec для запуску базового інструменту EVMbench, який оцінює безпеку AI-агентів у контексті Ethereum Virtual Machine (EVM).

Зі зростанням інтеграції AI та криптотехнологій, смарт-контракти стали ключовою інфраструктурою для управління понад 100 мільярдами відкритих криптоактивів. Вихід цього інструменту символізує початок серйозного ставлення галузі до практичних можливостей AI у «економічно значущих» середовищах.

Команда OpenAI зазначає, що з розвитком здатностей AI-агентів у написанні та плануванні коду, ці моделі у майбутньому відіграватимуть трансформуючу роль у атаках і захисті блокчейнів, тому створення стандартної системи оцінки є надзвичайно важливим для моніторингу прогресу AI.

Три основні режими тестування, 120 реальних вразливостей — випробування для AI

Ядро EVMbench побудоване навколо 120 високоризикових вразливостей, витягнутих із 40 професійних аудитів, зокрема з відомих відкритих конкурсів аудиту Code4rena, що забезпечує реалістичність сценаріїв тестування. Стандарт оцінки оцінює AI-агентів у трьох режимах роботи:

Зображення: Основна концепція EVMbench — оцінка AI-агентів у трьох режимах роботи

Перший — «Режим виявлення (Detect)», коли AI аналізує код контракту та ідентифікує відомі вразливості, оцінюючи їхню серйозність;
Другий — «Режим виправлення (Patch)», де AI має зберегти функціональність контракту, одночасно видаляючи вразливості та виправляючи код;
Третій — «Режим експлуатації (Exploit)», коли AI у ізольованому середовищі імітує атаки з крадіжки коштів.

Щоб забезпечити точність і повторюваність тестів, команда розробила тестову архітектуру на базі Rust, яка використовує детальне відтворення транзакцій для перевірки успішності атак або виправлень AI.

Значний тренд — перевага атак, GPT-5.3-Codex демонструє вражаючий ріст у здатності до атак

Перші результати тестування показали, що AI демонструє значні відмінності у здібностях залежно від завдання. Найновіша модель GPT-5.3-Codex показала високий результат у режимі експлуатації (Exploit Mode) — 72.2 %, що значно перевищує 31.9 %, показані у моделі GPT-5, випущеній лише шість місяців тому, що свідчить про неймовірний прогрес.

Зображення: Огляд результатів різних моделей AI у трьох режимах

Це свідчить про те, що при цілі «повністю вивести кошти» AI має потужні можливості для ітеративного планування та виконання атак. Водночас, у захисних функціях AI показує слабкі результати: у режимі виявлення він часто зупиняється після знаходження однієї помилки, а при складних логіках — важко виправити вразливості без порушення роботи контракту. Експерти з безпеки висловлюють занепокоєння, що AI може значно скоротити час від виявлення вразливості до створення атаки, що ставить під високий ризик DeFi-проєктів і вимагає швидшої реакції.

Привлечение талантів і підтримка захисту — стратегія OpenAI щодо безпеки екосистеми AI-агентів

Крім розробки інструментів, OpenAI активно залучає фахівців і розвиває екосистему захисту. Нещодавно компанія найняла засновника проекту відкритих AI-агентів OpenClaw Пітера Штайнбергера для керівництва розробкою наступного покоління персоналізованих агентів, перетворюючи цей проект у фонд OpenAI.

Щоб протистояти потенційним кіберризикам, OpenAI пообіцяв виділити 10 мільйонів доларів через свою програму підтримки безпеки для фінансування відкритих інструментів захисту та досліджень ключової інфраструктури. Це особливо актуально після інциденту з протоколом Moonwell, де через помилку у коді AI сталася втрата близько 1,78 мільйона доларів.

Додаткові матеріали
Відмова від багатомільярдної пропозиції Meta, приєднання творця OpenClaw до OpenAI — боротьба за таланти, чи все через Vibe Coding? Прогноз Moonwell — збитки на 1,78 мільйона, хто заплатить?

У майбутньому, з появою все більшої кількості AI-помічників для стабільних монет і автоматизованих гаманців, важливо буде використовувати EVMbench для розрізнення моделей, які лише описують вразливості, і тих, що здатні надійно забезпечити захист, що стане ключовим моментом у розвитку галузі безпеки блокчейну.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Рішення для управління Ethereum Tally оголошує про закриття та поступове припинення роботи наприкінці місяця

ethereum news Прогрес проєкту

Рішення для управління Ethereum Tally оголосило про закриття після п'яти років роботи через несприятливі ринкові умови та відсутність підтримки бізнес-моделі. Генеральний директор Bertram зазначив, що не вдалося визначити життєздатність випуску токену. Tally поступово припинить роботу наприкінці цього місяця, але буде співпрацювати з корпоративними клієнтами над розробленням плану переходу.

GateNews1год тому

PayPal стейблкойн PYUSD розширює карту до сімдесяти глобальних ринків, тепер доступний у Сінгапурі та Колумбії

Прогрес проєкту Партнерства та екосистема

PayPal оголосив, що його доларовий стейблкойн PYUSD тепер розширений на 70 глобальних ринків, включаючи Сінгапур та кілька країн Південної Америки, дозволяючи користувачам здійснювати миттєві міжнародні грошові перекази з нижчими витратами. PYUSD є регульованим та пропонує програму винагород, яка посилює бажання користувачів утримувати активи та прискорює рух коштів, покращуючи операційну гнучкість торговців.

ChainNewsAbmedia1год тому

PayPal стейблкойн PYUSD розширюється на 70 країн Латинської Америки та Азіатсько-Тихоокеанського регіону, одночасно відкриває можливість для роздрібних інвесторів заробляти дохід на утриманні монет

Щоденні криптоновини Прогрес проєкту Події токенів

Платіжний гігант PayPal оголосив 17 березня, що його стейблкойн PayPal USD (PYUSD) розширюється на 70 глобальних ринків, пропонуючи низьковартісні послуги міжнародних платежів. Користувачі можуть отримувати винагороди за утримання PYUSD, а час розрахунків B2B значно скорочується до кількох хвилин, що демонструє намір PayPal використовувати технологію блокчейну для революціонізації традиційної системи платежів.

動區BlockTempo5год тому

CFTC дав зелене світло! Гаманець Phantom отримав «звільнення від дій», дозволено інтегрувати регульовані похідні фінансові інструменти для торгівлі

Прогрес проєкту Партнерства та екосистема Регулювання та політика

Американська CFTC видала листа про відсутність заходів щодо розробника криптовалютного гаманця Phantom, що дозволяє інтегрувати регульований інтерфейс торгівлі похідними без реєстрації в якості брокера. Це звільнення від відповідальності супроводжується трьома основними вимогами щодо відповідності, включаючи розкриття ризиків і конфліктів інтересів тощо, що означає поступове стирання границі між DeFi та традиційними ринками та має важливе значення для уточнення регулювання некастодіальних гаманців.

動區BlockTempo7год тому

AI більше не монопольне право технологічних гігантів! Tether推出QVAC, чи настав час, коли у кожного буде власна LLM?

USDT news Прогрес проєкту

Tether оголосила про запуск своєю AI інфраструктури QVAC Fabric першого у світі кросплатформного фреймворку BitNet LoRA для тонкого налаштування, що дозволяє навчати великі мовні моделі на споживчому обладнанні. Ця технологія дозволяє пристроям, таким як смартфони, виконувати тонке налаштування моделей, значно знижуючи витрати на розробку AI, децентралізуючи AI та забезпечуючи можливість користування ним у будь-якому місці та часі в майбутньому.

ChainNewsAbmedia9год тому

HSBC і Standard Chartered близькі до отримання ліцензій на гонконгські стейблкоїни

Прогрес проєкту Партнерства та екосистема Регулювання та політика

Гонконзькі регулятори отримали 36 заяв на ліцензування стейблкойнів, але планують затвердити лише кількох емітентів. HSBC і Standard Chartered прогнозуються серед перших ліцензованих емітентів HKD стейблкойнів. Рамки ліцензування базуються на піщаничниці, запущеній у 2024 році для тестування стейблкойнів

CryptoFrontNews9год тому

Прокоментувати

0/400

Немає коментарів