Audit AI memasuki tahap praktis, OpenAI merilis EVMbench, memperkuat penilaian keamanan kontrak pintar

ETH0,51%
WELL-1,23%

OpenAI bekerja sama dengan Paradigm meluncurkan EVMbench, pengujian nyata kemampuan serangan dan pertahanan AI proxy pada kontrak pintar EVM, mengungkap kekhawatiran tentang kekuatan serangan yang kuat dan pertahanan yang lemah.

Fokus pada pengujian lingkungan ekonomi nyata, OpenAI bekerja sama dengan Paradigm memperkuat penilaian keamanan di blockchain

Pemimpin kecerdasan buatan OpenAI mengumumkan kolaborasi dengan perusahaan investasi risiko kripto terkenal Paradigm dan perusahaan keamanan OtterSec untuk meluncurkan alat pengujian standar EVMbench, yang dirancang khusus untuk menilai kinerja keamanan AI proxy (AI Agents) pada kontrak pintar Ethereum Virtual Machine (EVM).

Seiring dengan kedalaman integrasi AI dan teknologi kripto, kontrak pintar telah menjadi infrastruktur inti dalam mengelola aset kripto sumber terbuka lebih dari 100 miliar dolar. Peluncuran alat ini menandai bahwa industri mulai menyadari kemampuan praktis AI dalam lingkungan yang memiliki makna ekonomi.

Tim OpenAI menunjukkan bahwa, seiring lonjakan kemampuan AI proxy dalam penulisan dan perencanaan kode, model-model ini akan memainkan peran transformasional dalam serangan dan pertahanan di blockchain di masa depan. Oleh karena itu, membangun kerangka evaluasi standar sangat penting untuk memantau perkembangan AI.

Pengujian mendalam tiga mode, 120 kerentanan audit nyata menjadi batu uji AI

Desain inti EVMbench berfokus pada 120 kerentanan berisiko tinggi yang diambil dari 40 laporan audit profesional, dengan sumber data termasuk kompetisi audit terbuka terkenal seperti Code4rena, memastikan skenario pengujian mendekati kompleksitas dunia nyata. Standar pengujian ini menempatkan AI proxy dalam tiga mode kerja berbeda untuk dievaluasi:

Gambar sumber: Desain inti EVMbench dari OpenAI menempatkan AI proxy dalam tiga mode kerja berbeda untuk evaluasi

  • Mode pertama adalah “Deteksi” (Detect), di mana AI mengaudit kode kontrak dan mengidentifikasi kerentanan yang diketahui, memberikan skor berdasarkan tingkat keparahan masalah yang ditemukan;
  • Mode kedua adalah “Perbaikan” (Patch), menantang AI untuk menghapus kerentanan yang dapat dieksploitasi dan memperbaiki kode tanpa mengubah fungsi aslinya;
  • Terakhir adalah mode yang sangat kontroversial, “Eksploitasi” (Exploit), di mana AI harus melakukan serangan pencurian dana end-to-end dalam lingkungan blockchain yang di sandbox.

Untuk memastikan ketelitian dan keberulangan pengujian, tim mengembangkan kerangka pengujian berbasis bahasa Rust, menggunakan teknik replay transaksi deterministik untuk memverifikasi keberhasilan serangan atau perbaikan AI.

Kecenderungan kekuatan serangan yang meningkat, GPT-5.3-Codex menunjukkan pertumbuhan serangan yang mengesankan

Dalam hasil pengujian awal yang dirilis, AI menunjukkan perbedaan kemampuan yang jelas antar tugas. Generasi terbaru GPT-5.3-Codex tampil sangat baik dalam mode eksploitasi, dengan skor mencapai 72,2%, jauh lebih tinggi dibandingkan model GPT-5 yang dirilis enam bulan lalu dengan skor 31,9%, menunjukkan pertumbuhan kemampuan yang sangat mengesankan.

Gambar sumber: Ikhtisar skor berbagai model AI OpenAI dalam tiga mode

Ini menunjukkan bahwa ketika targetnya jelas untuk “mengosongkan dana”, AI memiliki kemampuan perencanaan dan eksekusi iteratif yang kuat. Namun, dalam hal pertahanan, performa AI relatif lemah, sering berhenti mencari setelah menemukan satu kesalahan dalam mode deteksi, dan kesulitan memperbaiki kerentanan logika kompleks tanpa mengganggu operasi kontrak secara normal. Para ahli keamanan menyatakan kekhawatiran bahwa AI dapat secara signifikan mempercepat waktu dari penemuan kerentanan hingga pengembangan metode serangan, yang menuntut kecepatan pertahanan yang lebih tinggi dari proyek DeFi.

Rekrutmen Talenta dan Subsidi Pertahanan, OpenAI Bangun Ekosistem Keamanan AI Proxy

Selain pengembangan alat, OpenAI juga aktif dalam rekrutmen talenta dan penguatan ekosistem pertahanan. Baru-baru ini, mereka merekrut pendiri proyek AI proxy open-source OpenClaw, Peter Steinberger, untuk memimpin pengembangan proxy personalisasi generasi berikutnya, dan mengubah proyek tersebut menjadi model yayasan yang didukung OpenAI.

Untuk mengatasi risiko keamanan siber yang mungkin timbul dari AI, OpenAI berjanji akan mengalokasikan dana sebesar 10 juta dolar melalui program subsidi keamanan siber mereka, untuk mendukung pengembangan alat pertahanan sumber terbuka dan penelitian infrastruktur penting. Langkah ini menjadi sangat relevan setelah insiden protokol Moonwell baru-baru ini, di mana kesalahan perhitungan harga dalam kode bersama AI menyebabkan kerugian sekitar 1,78 juta dolar.

Baca juga
Menolak tawaran miliaran dari Meta, pencipta OpenClaw bergabung dengan OpenAI memicu perebutan talenta, semuanya salah Vibe Coding? Ramalan Moonwell gagal, siapa yang akan menanggung kerugian 1,78 juta?

Ke depan, dengan semakin banyaknya proxy pembayaran stablecoin berbantuan AI dan dompet otomatis yang bergabung ke ekosistem, penggunaan alat seperti EVMbench untuk membedakan model yang hanya mampu mendeskripsikan kerentanan dari model yang dapat memberikan solusi pertahanan yang andal akan menjadi titik balik penting dalam industri keamanan blockchain.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

XRP Meluas ke Solana saat wXRP Mendorong Akses DeFi

Wawasan Utama Wrapped XRP di Solana melampaui 834.000 token, memungkinkan akses DeFi baru sambil memperkuat likuiditas lintas-rantai dan memperluas kegunaan XRP di luar ledger aslinya. Ethereum dan Solana mendominasi aktivitas DeFi, sementara XRP Ledger tertinggal secara signifikan, sehingga mendorong kebutuhan untuk

CryptoNewsLand42menit yang lalu

Laporan Q1 2026 Spark Protocol: Total Pendapatan Protokol Mencapai $31.5M

Pesan Berita Gate, 24 April — Spark Protocol merilis laporan keuangan kuartal pertama 2026, yang menunjukkan total pendapatan protokol sebesar $31.5 juta, pendapatan protokol bersih sebesar $6.91 juta, dan surplus protokol bersih sebesar $3.46 juta. Perbendaharaan protokol kini memiliki aset sebesar $46.1 juta, dengan $986,000 dalam pembelian kembali token SPK yang telah diselesaikan selama kuartal tersebut.

GateNews1jam yang lalu

XRP Breakout Bertahan Saat Suara Pinjaman XRPL Mendapat Momentum

XRP menunjukkan kekuatan mingguan, diperdagangkan di atas EMA setelah keluar dari pola wedge menurun; XRPL memajukan peningkatan pinjaman XLS-65/66 dengan vault gabungan dan pinjaman berjangka tetap; derivatif meningkat dalam volume, open interest, dan aktivitas opsi. Abstrak: Laporan ini mencatat momentum mingguan XRP yang terus-menerus dan kekuatan harga di atas moving average kunci setelah terjadinya breakout dari wedge menurun. Laporan ini membahas pemilih validator XRPL untuk XLS-65 dan XLS-66, yang memungkinkan pinjaman native, vault likuiditas gabungan, dan pinjaman berjangka tetap untuk memperluas aktivitas keuangan on-chain. Laporan ini juga melaporkan meningkatnya partisipasi derivatif, dengan volume perdagangan yang lebih tinggi, open interest, dan lonjakan dalam aktivitas opsi, yang mengindikasikan peningkatan posisi trader untuk kelanjutan breakout.

CryptoNewsLand1jam yang lalu

Penyelamatan kerentanan Kelp DAO: Mantle meminjam-kembali Aave 3万 ETH, aliansi DeFi berkomitmen lebih dari 43.500 ETH

Jembatan lintas rantai Kelp DAO diserang, DeFi United mengumpulkan Aave dan protokol lain yang berkomitmen untuk menggunakan 43,500 ETH (sekitar 1,01 miliar dolar AS) guna melakukan penanganan piutang bermasalah. Mantle mengajukan MIP-34, dengan pinjaman maksimal 30,000 ETH kepada Aave DAO, serta memberikan 130,000 hak suara AAVE; Stani Kulechov secara pribadi menyuntik 5,000 ETH, dan Lido serta lainnya juga ikut menyetor. Langkah ini dipandang sebagai eksperimen “pinjaman untuk ditukar dengan hak tata kelola” di tengah krisis, yang masih menunggu pemungutan suara.

ChainNewsAbmedia2jam yang lalu

Nasdaq-Listed Nakamoto Unveils Active Bitcoin Derivatives Strategy Since Q1 2026

Gate News message, April 24 — Nakamoto, a Nasdaq-listed company, has announced an actively managed Bitcoin derivatives program running since Q1 2026. The strategy aims to generate recurring volatility income from a portion of the company's Bitcoin holdings while hedging against downside price

GateNews3jam yang lalu

GMX Meluncurkan Kontrak Perpetual WTI Crude, Brent Oil, dan Natural Gas di Arbitrum

Berita Gate, 24 April — Platform perdagangan terdesentralisasi GMX telah meluncurkan tiga kontrak perpetual komoditas energi di Arbitrum: WTI Crude Oil (WTIOIL/USD), Brent Oil (BRENTOIL/USD), dan Natural Gas (NATGAS/USD). Ketiga kontrak ini tersedia untuk perdagangan 24/7. WTI dan Brent adalah

GateNews3jam yang lalu
Komentar
0/400
Tidak ada komentar