PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
L’ingénieur de Ripple explique le rythme des mises à jour de XRPL, l’attention se déplace vers la correction de bugs et la fiabilité - U.Today
Un ingénieur de RippleX, Mayukha Vadari, a répondu aux préoccupations des développeurs pendant que le XRP Ledger subit d’importantes améliorations. Les principaux axes de travail incluent la télémétrie, la nomenclature, la sécurité des types, le refactoring, la journalisation et la documentation afin d’améliorer la stabilité et de faciliter la correction des bugs, rendant la plateforme plus robuste et plus accessible pour les développeurs.
UTodayIl y a 35m
« La nuit ne nuit pas à Cardano », un initié défend la vision de Charles Hoskinson - U.Today
Le DRep de Cardano, dori, défend la chaîne de confidentialité Midnight, déclarant qu’elle complète plutôt qu’elle n’entre en concurrence avec Cardano. Il souligne le rôle de Midnight dans l’amélioration de la confidentialité et de la scalabilité, en répondant aux attentes du marché pour les utilisateurs institutionnels. Dori soutient la vision de Hoskinson, mettant en avant l’importance de Midnight dans l’écosystème Cardano, en particulier avec son lancement récent sur le mainnet.
UTodayIl y a 1h
La blockchain résistante aux attaques quantiques de Naoris Protocol se lance alors que Bitcoin et Ethereum font face à des menaces de « Q-Day »
Naoris Protocol a lancé une blockchain résistante aux attaques quantiques, conçue pour sécuriser les transactions contre les menaces quantiques futures. Elle utilise la cryptographie post-quantique et a validé plus de 100 millions de transactions, se préparant à protéger les actifs numériques malgré les vulnérabilités des systèmes existants comme Bitcoin et Ethereum.
CoinDeskIl y a 1h
Polkadot met en œuvre des réformes du staking pour la durabilité et un écosystème $DOT solide
Polkadot a introduit des réformes du staking visant à améliorer la durabilité et à affiner les incitations. Les changements clés incluent un minimum de mise en jeu par les validateurs, la réduction des risques pour les nominateurs et une phase de désengagement plus rapide. Ces ajustements visent à favoriser l’adoption de $DOT et à créer une base économique plus solide tout en rationalisant les opérations de staking.
BlockChainReporterIl y a 2h
Stablecoins productifs : combler l’écart d’efficacité de 300 Md$
À savoir :
Le problème : 90 % des stablecoins sont une « charge morte ». Les émetteurs prennent votre monnaie fiduciaire, achètent des bons du Trésor (T-bills) et conservent 100 % du rendement : un énorme « impôt caché » pour les utilisateurs.
L’opportunité : plus de 11B$ dans les trésoreries de DAO et 1,2B$ dans la liquidité des DEX ne sont actuellement pas productifs.
Solutions émergentes :
I
CoinDeskIl y a 4h
Pi Network distribue des récompenses KYC à 1M de validateurs
La première grande distribution de récompenses de Pi Network à l’échelle pour les validateurs KYC a mobilisé plus d’un million d’utilisateurs ayant accompli 526 millions de tâches de validation. Cette approche décentralisée renforce la sécurité et encourage la participation des utilisateurs, ouvrant la voie à de futures expansions.
CoinfomaniaIl y a 4h