Pantera e Franklin Templeton juntam-se à Sentient Arena para testar conjuntamente o desempenho de agentes de IA empresariais

PANews 27 de fevereiro de notícias, de acordo com a Cointelegraph, o laboratório de IA de código aberto Sentient anunciou o lançamento do Arena, um ambiente de teste de produção para avaliar o desempenho de agentes de IA em fluxos de trabalho empresariais. A Pantera Capital e o departamento de ativos digitais da Franklin Templeton juntaram-se às primeiras equipes de teste do Arena. Sentient afirmou que o Arena não é um teste de modelos estáticos, mas sim uma avaliação padronizada de tarefas de IA através da simulação de condições empresariais que incluem documentos longos, informações incompletas e fontes conflitantes. A plataforma monitora categorias de falhas como alucinações, falta de evidências, citações incorretas e vulnerabilidades de raciocínio, ajudando os desenvolvedores a diagnosticar problemas. O Arena planeja publicar indicadores de desempenho comparativos por meio de uma classificação pública e divulgar relatórios de teste que resumem padrões comuns de falhas e soluções de correção.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

XRP Ledger Validators Weigh Two Amendments as Votes Lag

The XRP Ledger is reviewing two proposed amendments that could expand lending functions and strengthen vault infrastructure. Validators have begun voting, yet early participation remains limited. Current results suggest the proposals still face significant hurdles before reaching activation

CryptoBreaking5m atrás

VeChain StarGate Staking Platform Shows Strong Growth Three Months After Hayabusa Fork

VeChain's StarGate staking platform experienced significant growth post-Hayabusa fork, with a 50.2% reduction in VTHO emissions and a 93.9% increase in active stakers. The network now holds 10.7 billion VET, emphasizing the shift towards a delegation model and new entry-level node tiers which promote wider participation.

CryptoNewsFlash59m atrás

Tether Expands to U.S., Launches USAT Stablecoin: Bloomberg

Tether is shifting its focus to the U.S. market, launching a new stablecoin, USAT, and considering a fundraising round that could value it at $500 billion. This move aims to enhance its presence amid evolving regulatory frameworks, showcasing its ambitions beyond just stablecoin issuance.

TodayqNews1h atrás

Pump.fun 推出 Tokenized Agents 代币自动回购功能

Pump.fun 于 3 月 13 日推出 Tokenized Agents 代币自动回购功能,用户可为 Agent 发行代币并设置回购比例。Agent 可通过外部工具开发,自动使用收入回购代币,增加用户灵活性。

GateNews1h atrás

Solana Expands Cross-Chain Access as Avalanche’s AVAX Launches

Solana expanded cross-chain access after AVAX went live through Sunrise, bringing Avalanche’s native token into its ecosystem. The AVAX launch on Solana adds a new route for trading, transfers, and broader asset access across blockchain networks. Solana has opened up cross-chain access on it

CryptoNewsFlash1h atrás

Circle Tests AI Agents With $30K USDC Hackathon Trial

Circle’s AI hackathon produced 204 submissions, 1,352 valid votes, and over 9,700 comments in five days. Agents built projects across commerce, smart contracts, and skills using USDC incentives. Experiment revealed rule-breaking, vote collusion, and possible human activity among AI

CryptoFrontNews2h atrás
Comentar
0/400
Nenhum comentário