การตรวจสอบ AI เข้าสู่การปฏิบัติจริง OpenAI เปิดตัว EVMbench เสริมความแข็งแกร่งในการประเมินความปลอดภัยของสมาร์ทคอนแทรกต์

CryptoCity

2026-02-20 04:10:56

ETH0.51%

OpenAI ร่วมมือกับ Paradigm เปิดตัว EVMbench ทดสอบความสามารถในการโจมตีและป้องกันสัญญาอัจฉริยะบน EVM เผยความกังวลเกี่ยวกับจุดอ่อนและความแข็งแกร่งของการโจมตี

เน้นการทดสอบในสภาพแวดล้อมทางเศรษฐกิจ OpenAI ร่วมกับ Paradigm เสริมความปลอดภัยบนบล็อกเชน

ผู้นำด้านปัญญาประดิษฐ์ OpenAI ประกาศความร่วมมือกับบริษัทลงทุนในคริปโตเคอเรนซีชื่อดัง Paradigm และบริษัทด้านความปลอดภัย OtterSec เปิดตัวเครื่องมือทดสอบมาตรฐาน EVMbench ซึ่งออกแบบมาเพื่อประเมินประสิทธิภาพของ AI ตัวแทน (AI Agents) ในด้านความปลอดภัยของสัญญาอัจฉริยะบน Ethereum Virtual Machine (EVM)

ด้วยการบูรณาการอย่างลึกซึ้งระหว่าง AI กับเทคโนโลยีคริปโต สัญญาอัจฉริยะกลายเป็นโครงสร้างพื้นฐานสำคัญในการจัดการสินทรัพย์คริปโตเปิดจำนวนมากกว่า 1,000 พันล้านดอลลาร์ การเปิดตัวเครื่องมือนี้เป็นสัญญาณว่าอุตสาหกรรมเริ่มให้ความสนใจต่อความสามารถของ AI ในสภาพแวดล้อมที่มีความหมายทางเศรษฐกิจ

ทีมงาน OpenAI ชี้ว่า ด้วยความก้าวหน้าของ AI ตัวแทนในด้านการเขียนและวางแผนโค้ด ในอนาคตโมเดลเหล่านี้จะมีบทบาทเปลี่ยนแปลงทั้งด้านการโจมตีและการป้องกันบนบล็อกเชน ดังนั้น การสร้างมาตรฐานการประเมินผลจึงเป็นสิ่งสำคัญในการติดตามความก้าวหน้าของ AI

การทดสอบเชิงลึกใน 3 โหมด พร้อม 120 ช่องโหว่จากการตรวจสอบจริงกลายเป็นเกณฑ์วัดความสามารถของ AI

การออกแบบหลักของ EVMbench มุ่งเน้นไปที่การทดสอบ 120 ช่องโหว่ที่สกัดจากรายงานการตรวจสอบเชิงมืออาชีพจำนวน 40 รายการ ซึ่งข้อมูลมาจากการแข่งขันการตรวจสอบสาธารณะ เช่น Code4rena เพื่อให้แน่ใจว่าสภาพแวดล้อมการทดสอบใกล้เคียงกับความซับซ้อนในโลกจริง เครื่องมือนี้จะประเมิน AI ตัวแทนในสามโหมดการทำงาน:

ภาพประกอบ: การออกแบบหลักของ EVMbench ของ OpenAI คือการประเมิน AI ตัวแทนในสามโหมดการทำงาน

โหมดแรกคือ “ตรวจจับ (Detect)” ซึ่งให้ AI ตรวจสอบโค้ดสัญญาอัจฉริยะและระบุช่องโหว่ที่รู้จัก พร้อมให้คะแนนตามระดับความรุนแรงของปัญหา
โหมดที่สองคือ “แก้ไข (Patch)” ซึ่งท้าทาย AI ให้ลบช่องโหว่ที่สามารถโจมตีได้และแก้ไขโค้ดโดยไม่กระทบต่อฟังก์ชันเดิม
โหมดสุดท้ายคือ “ใช้ประโยชน์ (Exploit)” ซึ่งเป็นโหมดที่ถกเถียงกันมาก AI ต้องดำเนินการโจมตีขโมยเงินในสภาพแวดล้อม sandbox ของบล็อกเชนแบบ end-to-end

เพื่อความแน่นอนและความสามารถในการทำซ้ำ ทีมงานได้พัฒนาสถาปัตยกรรมการทดสอบบนภาษา Rust โดยใช้เทคนิคการเล่นธุรกรรมที่เป็นเอกลักษณ์เพื่อยืนยันว่าการโจมตีหรือการแก้ไขของ AI สำเร็จหรือไม่

แนวโน้มการโจมตีและการป้องกันชัดเจน GPT-5.3-Codex แสดงอัตราการเติบโตของการโจมตีที่น่าทึ่ง

ผลการทดสอบเบื้องต้นแสดงให้เห็นว่า AI มีความสามารถแตกต่างกันอย่างชัดเจนในแต่ละภารกิจ โดย GPT-5.3-Codex รุ่นล่าสุด ทำผลงานได้ดีในโหมดใช้ประโยชน์ (Exploit Mode) ด้วยคะแนนสูงถึง 72.2% ซึ่งสูงกว่ารุ่น GPT-5 ที่เปิดตัวเมื่อหกเดือนก่อนซึ่งได้เพียง 31.9% อย่างมาก

ภาพประกอบ: สรุปคะแนนของโมเดล AI ต่าง ๆ ของ OpenAI ในสามโหมด

สิ่งนี้แสดงให้เห็นว่า เมื่อเป้าหมายชัดเจนว่า “ขโมยเงิน” AI มีความสามารถในการวางแผนและดำเนินการอย่างมีประสิทธิภาพ อย่างไรก็ตาม ผลด้านการป้องกันกลับค่อนข้างอ่อนแอ AI มักจะหยุดการค้นหาเมื่อพบข้อผิดพลาดเพียงจุดเดียว และเมื่อแก้ไขความซับซ้อนของตรรกะ ก็ยังพบว่ามีความยากในการซ่อมแซมช่องโหว่โดยไม่ส่งผลกระทบต่อการทำงานของสัญญาอย่างสมบูรณ์ ผู้เชี่ยวชาญด้านความปลอดภัยแสดงความกังวลว่า AI อาจลดเวลาที่ใช้ในการค้นหาช่องโหว่และพัฒนาวิธีโจมตีลงอย่างมาก ซึ่งเป็นความท้าทายต่อความเร็วในการป้องกันของโปรเจกต์ DeFi

การรับสมัครบุคลากรและการสนับสนุนด้านการป้องกัน OpenAI วางแผนสร้างความปลอดภัยในระบบนิเวศ AI ตัวแทน

นอกจากการพัฒนาเครื่องมือแล้ว OpenAI ยังเน้นการวางกลยุทธ์ด้านบุคลากรและการป้องกันในระบบนิเวศ โดยล่าสุดได้ว่าจ้าง Peter Steinberger ผู้ก่อตั้งโครงการ AI ตัวแทนโอเพนซอร์ส OpenClaw เพื่อเป็นผู้นำในการพัฒนาตัวแทนส่วนบุคคลรุ่นใหม่ และเปลี่ยนโครงการนี้เป็นโมเดลกองทุนสนับสนุนโดย OpenAI

เพื่อรับมือกับความเสี่ยงด้านความปลอดภัยทางไซเบอร์ที่อาจเกิดจาก AI OpenAI สัญญาว่าจะใช้เงินสนับสนุน 10 ล้านดอลลาร์จากโครงการสนับสนุนด้านความปลอดภัยทางไซเบอร์ เพื่อสนับสนุนเครื่องมือป้องกันโอเพนซอร์สและการวิจัยโครงสร้างพื้นฐานสำคัญ เหตุการณ์นี้มีความสำคัญอย่างยิ่งหลังจากเหตุการณ์ในโปรโตคอล Moonwell ซึ่งเกิดความผิดพลาดในการคำนวณราคาด้วย AI ส่งผลให้เกิดความเสียหายประมาณ 1.78 ล้านดอลลาร์

อ่านเพิ่มเติม
ปฏิเสธข้อเสนอจาก Meta มูลค่าหลายพันล้านดอลลาร์ ผู้สร้าง OpenClaw เข้าร่วมชิงตำแหน่งใน OpenAI กระแสแรง? การคาดการณ์ของ Moonwell เกิดข้อผิดพลาด ทำให้เสียหาย 1.78 ล้านดอลลาร์ ใครจะรับผิดชอบ?

ในอนาคต เมื่อมีการเพิ่มตัวแทนชำระเงินแบบอัตโนมัติและกระเป๋าเงินอัจฉริยะที่ใช้ AI เข้าสู่ระบบนิเวศมากขึ้น การใช้เครื่องมือเช่น EVMbench เพื่อแยกแยะโมเดลที่สามารถอธิบายช่องโหว่ได้เพียงอย่างเดียว กับโมเดลที่สามารถให้แนวทางป้องกันที่เชื่อถือได้ จะกลายเป็นจุดเปลี่ยนสำคัญในอุตสาหกรรมความปลอดภัยของบล็อกเชน

ดูต้นฉบับ

news.article.disclaimer

btc.bar.articles

Circle ย้าย $68M ใน USDC ไปยังการชำระเงินของ Speed Treasury

USDC news Project Progress

Circle ดำเนินการ $68M ในธุรกรรมโอนเงินระหว่างบริษัทโดยใช้ USDC จำนวน 11 รายการ ที่เกี่ยวข้องกับองค์กรทั่วโลกแปดแห่ง การชำระเงินด้วย USDC ยืนยันภายในเวลาน้อยกว่า 30 นาที แทนการโอนเงินผ่านธนาคารแบบดั้งเดิมที่อาจใช้เวลานานถึงสามวัน การชำระเงินที่รวดเร็วขึ้นลดความเสี่ยงจากการถือครองเงินสดในระหว่างการขนส่งและ

CryptoFrontNews36 นาที ที่แล้ว

ธงฟง ดงรวยบิน ทดสอบโอนเงินด้วยเหรียญเสถียรภาพ แต่ต้นทุนของบล็อกเชนถูกเข้าใจผิด

ethereum news Project Progress Partnerships & Ecosystem Global Markets

ธนาคารเมอร์ริเชียน ทรัสต์ คอร์ปอเรชั่น จัดงานแถลงข่าวสื่อมวลชนในวันที่ 10 โดยประธานกรรมการ ดง ไรปิน เปิดเผยว่า เพื่อเปรียบเทียบประสิทธิภาพการโอนเงินระหว่างธนาคารและบล็อกเชนอย่างเป็นกลาง ธนาคารเมอร์ริเชียนได้ดำเนินการทดสอบใน 17 ประเทศทั่วโลก รวม 25 สาขาต่างประเทศ พนักงานสาขาเปิดบัญชีในตลาดที่ถูกกฎหมายในท้องถิ่น และใช้แพลตฟอร์มการซื้อขายสินทรัพย์เสมือน BitoPro ในการซื้อขาย USDT ซึ่งเป็นเหรียญ stablecoin ดอลลาร์สหรัฐ โดยโอน USDT จำนวน 50 เหรียญกลับมายังไต้หวันในแต่ละครั้ง และเปรียบเทียบกับการโอนเงินผ่านธนาคารแบบข้ามพรมแดนแบบดั้งเดิม ผลการทดสอบแสดงให้เห็นว่า stablecoin มีข้อได้เปรียบในกรณีการโอนเงินข้ามพรมแดนขนาดเล็ก แต่หากยอดโอนเงินเกินเทียบเท่าเงินไต้หวัน 200,000 บาท (ประมาณ 7,000 ดอลลาร์สหรัฐ) ธนาคารยังคงมีความได้เปรียบด้านต้นทุนมากกว่า การทดลองของเมอร์ริเชียน: สำหรับยอดโอนเกิน 7,000 ดอลลาร์สหรัฐ ธนาคารจะคุ้มค่ามากกว่า ผลการทดสอบแสดงให้เห็นว่า ในสถานการณ์การโอนเงินข้ามพรมแดนที่ “จ่ายเงินเป็นเงินไต้หวันในไต้หวัน ปลายทางได้รับเงินในสกุลเงินท้องถิ่น” การโอนผ่านธนาคารโดยทั่วไปจะใช้เวลาประมาณ 2 ชั่วโมงในการดำเนินการ ค่าธรรมเนียมประมาณ

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

HyperGPT เปิดตัว HyperStore ตลาดแอป AI สำหรับ Web3

Project Progress

HyperGPT ได้เปิดตัว HyperStore ตลาดแอป AI ที่เชื่อมต่อผู้พัฒนาและผู้ใช้ เพื่อให้สามารถสร้างรายได้และส่งเสริมแอปภายในชุมชนที่กำลังเติบโต ผู้พัฒนาสามารถแสดงผลิตภัณฑ์ AI ต่างๆ เพื่อสร้างรายได้ ในขณะเดียวกันก็ทำให้การเข้าถึงผู้ใช้ Web3 เป็นเรื่องง่ายขึ้น

BlockChainReporter3 ชั่วโมง ที่แล้ว

ภายใต้ Circle USYC ขยายขนาดการบริหารสินทรัพย์ทะลุ 2 พันล้านดอลลาร์สหรัฐ

Project Progress

ข่าว Gate News เมื่อวันที่ 10 มีนาคม ผู้ให้บริการเหรียญเสถียรภาพ Circle อย่างเป็นทางการกล่าวว่า เนื่องจากการใช้งานกองทุนตลาดเงินดิจิทัลในอุตสาหกรรมเพิ่มขึ้นอย่างต่อเนื่อง ผลิตภัณฑ์ภายใต้บริษัท USYC ของบริษัทได้มีมูลค่าการจัดการสินทรัพย์ทะลุ 2 พันล้านดอลลาร์สหรัฐฯแล้ว

GateNews4 ชั่วโมง ที่แล้ว

แอปพลิเคชันเงินของ Elon Musk's X ใกล้เปิดตัวสาธารณะ ไม่มีสัญญาณของ Dogecoin

Project Progress

X Money ของ Elon Musk จะเปิดตัวเวอร์ชันทดลองใช้งานในเดือนเมษายน โดยให้บริการโอนเงินแบบ peer-to-peer การฝากเงินโดยตรง และการรับผลตอบแทน แม้ว่า Musk จะสนับสนุน Dogecoin ก็ตาม แต่ในปัจจุบันแอปยังไม่มีการเชื่อมต่อคริปโต อย่างไรก็ตาม ฟีเจอร์ในอนาคตอาจรวมถึงการเชื่อมต่อดังกล่าว

Decrypt4 ชั่วโมง ที่แล้ว

ผู้อำนวยการ Ripple ระบุ ตุรกี, ไนจีเรีย และ สหรัฐอาหรับเอมิเรตส์ เป็นตลาด "ที่ต้องจับตามอง" - U.Today

Project Progress Partnerships & Ecosystem Global Markets

รีซ เมอร์ริค จาก Ripple ได้วางแผนสำหรับเหรียญเสถียร RLUSD โดยมุ่งเน้นไปที่ตุรกี ไนจีเรีย และสหรัฐอาหรับเอมิเรตส์ เพื่อเสริมสร้างการขยายตัวในระดับโลก ประเทศเหล่านี้แสดงความต้องการดอลลาร์ดิจิทัลอย่างมีนัยสำคัญ ซึ่งเป็นสิ่งสำคัญสำหรับการดำเนินงานทางการเงิน โดยคาดการณ์ว่าจะมียอดธุรกรรมเหรียญเสถียรถึง $33 ล้านล้านในปี 2025

UToday5 ชั่วโมง ที่แล้ว

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น