Gate 廣場|2/27 今日話題: #BTC能否重返7万美元?
🎁 帶話題發帖,抽 5 位幸運兒送出 $2,500 仓位體驗券!
Jane Street 被起訴後,持續多日的“10 點砸盤”疑似消失。BTC 目前在 $67,000 附近震盪,這波反彈能否順勢衝回 $70,000?
💬 本期熱議:
1️⃣ 你認為訴訟與“10 點拋壓”消失有關嗎?市場操縱阻力是否減弱?
2️⃣ 衝擊 $70K 的關鍵壓力區在哪?
3️⃣ 你會在當前價位分批布局,還是等待放量突破再進場?
分享觀點,瓜分好禮 👉️ https://www.gate.com/post
📅 2/27 16:00 - 3/1 12:00 (UTC+8)
OpenAI 發布了用於評估 AI 代理破解智能合約能力的基準測試 - ForkLog:加密貨幣、人工智能、奇點、未來
OpenAI 與 Paradigm 共同推出了 EVMbench — 一個用於評估 AI 代理識別、修復及利用智能合約漏洞能力的基準測試。
該工具基於從 40 次審計中挑選的 120 個漏洞。大多數範例來自公開的代碼分析平台。它還包括來自 Tempo 區塊鏈安全測試的多個攻擊場景 — 這是一個由 Stripe 和 Paradigm 為高效且低成本的穩定幣支付而開發的專用第一層網路。
與 Tempo 的整合使得基準測試中加入了支付智能合約 — 這是預計「穩定幣」與 AI 代理將積極應用的領域。
為了建立測試環境,OpenAI 改編了現有的漏洞利用工具和腳本,並事先確認其實用性。
EVMbench 評估三種能力模式:
AI 模型的成效
OpenAI 在所有三個模式中測試了先進模型。在 Exploit 類別中,GPT-5.3-Codex 達到 72.2%,GPT-5 達到 31.9%。而在漏洞檢測與修復方面的表現較為謙遜 — 許多問題仍然難以發現與修復。
在 Detect 模式中,AI 代理有時在找到一個漏洞後就停止,而不是進行完整的審計。在 Patch 模式下,它們目前難以修補那些不明顯的問題,同時保持合約的完整功能。
提醒一下,2025 年 11 月,微軟推出了一個用於測試 AI 代理的環境,並揭示了現代數位助手所面臨的漏洞。