PANews 2月27日消息,据Cointelegraph报道,开源AI实验室Sentient宣布推出Arena,这是一个用于评估AI代理在企业级工作流程中表现的生产级测试环境。Pantera Capital和Franklin Templeton的数字资产部门已加入Arena的首批测试队列。
Sentient表示,Arena并非静态模型测试,而是通过模拟包含长文档、不完整信息和冲突来源的企业条件,对AI代理进行标准化任务测试。平台会跟踪幻觉、证据缺失、引用错误和推理漏洞等失败类别,帮助开发者诊断问题。Arena计划通过公开排行榜发布对比性能指标,并发布总结常见失败模式和修复方案的测试报告。
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Articoli correlati
Metaplanet 成立創投部門,40 億日圓押注比特幣生態
日本上市公司Metaplanet成立了創投部門Metaplanet Ventures KK,計劃投資約40億日圓,促進本土比特幣金融基礎設施的發展。該部門涵蓋投資、孵化和資助計劃,並強調不會影響其長期持有比特幣的策略,目標是在2027年前累積21萬枚比特幣,助力提升日本的國際競爭力。
MarketWhisper5m fa
AI 代理操作系统 elizaOS 发布 Eliza 2.0 Alpha 版本
Gate News 消息,3 月 12 日,AI 代理操作系统 elizaOS 宣布,Eliza 2.0 已进入 Alpha 测试阶段。该版本的精简运行时支持 TypeScript、Python 和 Rust + WASM 三种编程语言,并配备完整应用程序及入门套件。
GateNews9m fa
Pi Network 主網遷移短暫重啟,85K Pi 代幣已轉移
Pi Network的主網遷移在3月10日短暫重啟,約85,000枚Pi成功轉移,但隨後暫停。流通供應量為96.6億枚,距1,000億枚上限尚有差距。逾1,770萬已完成KYC的用戶等待代幣遷移。遷移期間存在詐騙風險,用戶需注意安全。協議v20.2強制升級截止為3月12日,未升級將面臨網路斷線風險。
MarketWhisper13m fa
Billions AI 代理身份验证技能登顶 OpenClaw 榜首,超 3600 个代理获可验证身份
Billions 宣布其 AI 代理身份验证系统已成为 OpenClaw 身份榜首,支持超3600个 AI 代理获得可验证身份。该系统通过加密身份和链上公证,实现代理追踪和问责,增强信任基础,推动 AI 代理的安全部署与创新。
GateNews17m fa
Morph 上线 USDC 与 Circle CCTP,支持跨链美元结算
Morph 区块链网络上线USDC与Circle跨链转移协议(CCTP),实现USDC的跨链转移功能,保持供应完整性。该协议支持多种支付场景,推动链上支付基础设施的发展。
GateNews28m fa
CoinFello 推出开源技能 OpenClaw,AI 代理可在不接触私钥情况下执行链上交易
CoinFello 于 3 月 12 日发布开源技能 OpenClaw,允许 AI 代理安全连接 MetaMask 并执行链上交易,无需访问用户私钥。该技能基于 ERC-4337 与 ERC-7710 构建,用户可授予最小权限,从而避免提示注入攻击风险,支持多种链上功能。
GateNews31m fa