OpenAI, Paradigm & OtterSec merilis EVMbench, pengujian kinerja agen AI pada keamanan kontrak pintar dengan 120 kerentanan dari 40 audit nyata. Claude Opus memimpin penghargaan deteksi sebesar $37,824, OC-GPT-5.2 dari OpenAI sebesar $31,623, Gemini 3 Pro sebesar $25,112. #AI #Blockchain
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
OpenAI, Paradigm & OtterSec merilis EVMbench, pengujian kinerja agen AI pada keamanan kontrak pintar dengan 120 kerentanan dari 40 audit nyata. Claude Opus memimpin penghargaan deteksi sebesar $37,824, OC-GPT-5.2 dari OpenAI sebesar $31,623, Gemini 3 Pro sebesar $25,112. #AI #Blockchain