Pantera y Franklin Templeton se unen a Sentient Arena para probar conjuntamente el rendimiento de agentes de IA a nivel empresarial

PANews informó el 27 de febrero que, según Cointelegraph, el laboratorio de IA de código abierto Sentient anunció el lanzamiento de Arena, un entorno de pruebas de nivel producción para evaluar el rendimiento de agentes de IA en flujos de trabajo a nivel empresarial. Las divisiones de activos digitales de Pantera Capital y Franklin Templeton se han unido a la primera cohorte de pruebas de Arena. Sentient afirmó que Arena no es una prueba de modelo estático, sino que prueba al agente de IA en una tarea estandarizada simulando condiciones empresariales con documentos extensos, información incompleta y fuentes contradictorias. La plataforma rastrea categorías de fallo como alucinaciones, pruebas faltantes, errores de citación y vulnerabilidades de razonamiento para ayudar a los desarrolladores a diagnosticar problemas. Arena planea publicar métricas comparativas de rendimiento a través de clasificaciones públicas y publicar informes de prueba que resuman patrones y soluciones comunes de fallos.

Ver originales
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Fundación Ethereum presenta visión de colaboración entre L1 y L2, aclarando los roles de cada capa y la hoja de ruta de desarrollo

La Fundación Ethereum señala que el objetivo de L2 se orienta hacia proporcionar funcionalidades diferenciadas y estrategias de mercado, mientras que L1 continúa como un centro de liquidación sin permisos. El artículo enfatiza que L2 debe lograr interoperabilidad y salidas seguras, e indica que se expandirá la capacidad de L1 y se investigará la tecnología Rollup para mejorar la experiencia de la plataforma y la liquidez.

GateNewsHace7m

Plataforma nueva permite inversión en acciones estadounidenses tokenizadas sin necesidad de intermediarios

Glider y Ondo Finance lanzaron una plataforma que permite a inversores individuales construir y automatizar carteras tokenizadas de acciones estadounidenses sin una cuenta de corretaje, con canastas en cadena, ponderación flexible y operaciones fuera de horario, mientras abordan problemas de liquidez de modelos de ETF anteriores.

TapChiBitcoinHace42m

Pi Network Cae 6% Semanalmente, RSI Alcista Enfrenta Presión de Desbloqueo de Mil Millones de Tokens

Pi Network ha enfrentado recientemente una caída de precios, pero indicadores técnicos como el RSI están cerca del sobreventa, y el sentimiento comunitario sigue siendo positivo. A pesar de las señales alcistas, el aumento de las reservas en intercambios y los tokens a punto de desbloquearse presentan riesgos bajistas, y la posible presión vendedora podría comprimir los precios. La situación del mercado requiere seguimiento cercano.

MarketWhisperHace49m

Tally cierra después de 5 años, el sueño de la infraestructura de gobernanza cripto aún no se ha hecho realidad

La plataforma de gestión de criptografía Tally cerrará después de más de 5 años, según anuncia el CEO Dennison Bertram. A pesar de procesar más de $1 mil millones en transacciones y atraer a más de 1 millón de usuarios, las condiciones del mercado obstaculizaron el crecimiento adicional y el lanzamiento del token.

TapChiBitcoinhace1h

Fundación Solana lanza marco de privacidad institucional respaldado por pruebas de conocimiento cero para cumplimiento regulatorio

La Fundación Solana publicó un informe que señala que la demanda institucional de criptodivisas no dependerá únicamente de la transparencia, sino que requerirá un control flexible sobre la divulgación de privacidad. El informe define cuatro modos de privacidad y enfatiza que la tecnología de alto rendimiento puede soportar pruebas de conocimiento cero para equilibrar la privacidad con los requisitos de cumplimiento normativo, proponiendo un mecanismo de "clave de auditoría" para abordar los desafíos regulatorios.

MarketWhisperhace1h

Fundación Solana publica informe de marco de privacidad empresarial, propone cuatro modos de privacidad

La Fundación Solana publicó un informe que enfatiza que las empresas necesitan controles de privacidad flexibles, considerando la privacidad como una función personalizable. El informe presenta cuatro modos de privacidad, reconociendo que no existe un único modelo óptimo, e incentiva a las empresas a combinar opciones según sus necesidades. El alto rendimiento de Solana puede respaldar la aplicación de tecnologías de privacidad, proponiendo un mecanismo de "claves de auditoría" para lograr la coexistencia de privacidad y cumplimiento normativo.

GateNewshace2h
Comentar
0/400
Sin comentarios