OpenZeppelin prüft EVMbench auf Datenverschmutzung

OpenZeppelin審計EVMbench發現資料污染

Blockchain-Sicherheitsaudit-Unternehmen OpenZeppelin hat den von OpenAI und Paradigm gemeinsam entwickelten Smart Contract Security AI-Standardtest EVMbench unabhängig geprüft und zwei schwerwiegende Probleme festgestellt: Datenverschmutzung im Trainingsdatensatz und mindestens vier als „hochriskante Schwachstellen“ markierte Kategorien, die in Wirklichkeit ungültige Fälschungen sind.

Datenverschmutzungsproblem bei EVMbench: Kritische Schwachstelle im AI-Trainingstermin

EVMbench wurde Mitte Februar 2026 veröffentlicht und soll die Fähigkeit verschiedener KI-Modelle bewerten, Smart Contract-Schwachstellen zu erkennen, zu beheben und auszunutzen. Während des Tests wurde der Netzwerkzugang der AI-Agenten deaktiviert, um deren Internetrecherche zu verhindern. Die Prüfung durch OpenZeppelin enthüllte jedoch eine strukturelle Schwachstelle: Der Standard basiert auf Schwachstellen, die in 120 Audits zwischen 2024 und Mitte 2025 identifiziert wurden, wobei die meisten führenden KI-Modelle ebenfalls ihr Wissen bis Mitte 2025 aktualisiert haben.

Das bedeutet, dass die AI-Agenten wahrscheinlich während des Pre-Trainings bereits mit den Schwachstellenberichten von EVMbench konfrontiert waren und die Antworten auf alle Fragen in ihrem Speicher gespeichert haben könnten. OpenZeppelin erklärt: „Die wichtigste Fähigkeit in der AI-Sicherheit ist die Fähigkeit, neue Schwachstellen im Code zu entdecken, die das Modell zuvor noch nie gesehen hat.“ Die begrenzte Größe des Datensatzes verstärkt den Einfluss der Verschmutzung auf die Gesamtbewertung zusätzlich.

Wesentliche Probleme bei der EVMbench-Auditierung

  • Datenverschmutzung: Das Pre-Training der AI könnte bereits die Schwachstellenberichte von EVMbench enthalten haben, wodurch der „Zero-Knowledge“-Test an Bedeutung verliert.
  • Ungültige Hochrisiko-Klassifizierungen: Mindestens vier als hochriskant markierte Schwachstellen sind tatsächlich nicht ausnutzbar.
  • Bewertungssystem-Fehler: EVMbench hat früher Punkte für das Entdecken dieser sogenannten Falschschwachstellen vergeben, was die Bewertungsgrundlage in Frage stellt.
  • Begrenzter Datensatz: Verstärkt den Einfluss der Verschmutzung auf die Gesamtergebnisse.
  • Aktuelle Rangliste: Anthropic’s Claude 4.6 führt, gefolgt von OpenAI’s OC-GPT-5.2 und Google’s Gemini 3 Pro.

Falschschwachstellen-Krise: Mindestens vier hochriskante Klassifizierungen sind ungültig

Neben der Datenverschmutzung entdeckte OpenZeppelin konkrete Faktenfehler. Sie bewerteten mindestens vier Schwachstellen, die von EVMbench als hochriskant eingestuft wurden, und stellten fest, dass diese in Wirklichkeit nicht existieren — noch wichtiger ist, dass die beschriebenen Exploit-Methoden überhaupt nicht funktionieren.

„Das sind keine subjektiven Meinungsverschiedenheiten über die Schwere; vielmehr zeigt sich, dass die beschriebenen Exploit-Methoden nicht funktionieren“, erklärt OpenZeppelin. Wenn die AI während des Tests diese Falschschwachstellen „entdeckt“, bedeutet das, dass das Bewertungssystem falsche Ergebnisse belohnt.

OpenZeppelin betont, dass diese Prüfung nicht die Potenziale der KI im Blockchain-Sicherheitsbereich negiert: „Das Problem liegt nicht darin, ob KI die Sicherheit von Smart Contracts verändern wird — das wird sie definitiv. Das Problem ist, ob die Daten und Standards, die wir zur Entwicklung und Bewertung dieser Tools verwenden, mit den Standards übereinstimmen, die die Verträge, die sie schützen sollen, einhalten.“

Häufig gestellte Fragen

Was hat OpenZeppelin bei der EVMbench-Prüfung festgestellt?

OpenZeppelin identifizierte zwei Kernprobleme: Erstens die Datenverschmutzung, da die Schwachstellenberichte von 2024 bis 2025 stammen und mit dem Trainingsende der KI-Modelle kollidieren, sodass diese möglicherweise die Antworten bereits „gelernt“ haben; zweitens, dass mindestens vier hochriskante Schwachstellen ungültige Fälschungen sind, deren Exploit-Methoden in der Praxis nicht funktionieren.

Warum ist Datenverschmutzung so gefährlich für die KI-Sicherheitsbewertung?

Wenn die KI während des Pre-Trainings bereits mit den Schwachstellenberichten konfrontiert wurde, kann sie die Antworten aus dem Speicher abrufen, anstatt echte Schwachstellen zu erkennen. Das macht den „Zero-Knowledge“-Test sinnlos und spiegelt nicht die tatsächliche Fähigkeit der KI wider, neue, unbekannte Smart Contracts sicher zu auditieren.

Wie steht OpenZeppelin zur Zukunft der KI im Blockchain-Sicherheitsbereich?

OpenZeppelin ist klar der Meinung, dass KI einen bedeutenden Einfluss auf die Sicherheit von Smart Contracts haben wird, aber dieser Einfluss muss auf vertrauenswürdigen Methoden und genauen Bewertungsstandards basieren. Sie sehen die Probleme bei EVMbench nicht als Ablehnung der KI, sondern als wichtige Warnung für die Branche.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Tether 冻结 Tron 链上某地址约 1200 万枚 USDT

3月14日,Tether冻结了一个Tron链地址持有的11,960,680枚USDT,使用智能合约的黑名单功能。这类冻结通常因洗钱、诈骗等原因触发,自2023年以来,Tether已累计冻结超42亿美元的USDT。

GateNews4Std her

幣竟交易所「創辦人兄妹」被求刑12年!涉為詐騙洗錢1.5億元,律師鄭鴻威也起訴

臺北地檢署正式起訴幣竟交易所集團10人,包括被稱為「虛擬貨幣女神」的張於庭及其兄張瀚林,皆涉洗錢及詐騙,求刑12年。該集團以合法名義掩護詐騙,處理黑錢逾1.5億元,受害者46人。透過區塊鏈技術切斷金流,使追查困難。

動區BlockTempo6Std her

Aave User Loses Millions in $50M Swap Amid High Price Impact

A $50M AAVE swap failed due to a 99% price impact despite the user accepting slippage warnings. Aave will refund $600K in fees, highlighting gaps in user protections. DeFi trades can be risky, and while transaction mechanisms functioned correctly, more user safeguards are needed.

CryptoFrontNews7Std her

FBI:AI 深度伪造技术加剧政府冒充类诈骗,2024 年损失超 4 亿美元

随着人工智能技术的普及,政府冒充类诈骗案件上升,诈骗者利用深度伪造视频和语音合成手段增信。2024年,一起AI伪造会议的诈骗案导致损失约2亿港元。FBI报告显示,2024年相关投诉超1.7万起,损失逾4亿美元,公众需提高警惕。

GateNews13Std her

Charlie Lee cảnh báo nguy cơ lượng Bitcoin của Satoshi bị tấn công lượng tử

Charlie Lee warns that Satoshi Nakamoto's estimated 1.1 million BTC could be at risk from future quantum computing attacks. He highlights vulnerabilities in early Bitcoin wallets and urges the crypto community to adopt long-term security measures.

TapChiBitcoin14Std her

DOJ Disrupts SocksEscort Network Linked to Crypto Fraud

U.S. authorities disrupted SocksEscort, a major proxy network exploiting infected routers for cybercrime, leading to significant losses for victims. The operation emphasized international cooperation in tackling cybercrime infrastructure.

TodayqNews03-13 17:35
Kommentieren
0/400
Keine Kommentare