As estruturas de avaliação de IA atuais estão profundamente falhadas—os métodos de medição carecem de rigor, os resultados de avaliação frequentemente falham em atingir o objetivo, e os sistemas de classificação muitas vezes não capturam a nuance. Os laboratórios tendem a otimizar de forma restrita para esses pontos de referência, no entanto, os resultados reais não se traduzem. Independentemente disso, o AGI continua a ser inevitável. O ASI já não é um ponto final teórico distante—espere progressos significativos nesse aspecto dentro dos próximos doze meses.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
8 gostos
Recompensa
8
3
Republicar
Partilhar
Comentar
0/400
YieldWhisperer
· 2025-12-24 21:37
lol as contas não fecham nestas avaliações também—a mesma rotina de repetir o mesmo que vimos com as métricas de defi em 2021. todo mundo otimizando o benchmark em vez de... realmente construir algo real. padrão clássico de espiral da morte fr
Ver originalResponder0
RektRecorder
· 2025-12-22 02:51
ngl estes benchmarks realmente não têm graça, aumentar números e o que realmente se pode fazer são duas coisas diferentes.
Ver originalResponder0
CascadingDipBuyer
· 2025-12-22 02:45
Rolando, agora até as avaliações começaram a ser competitivas? De qualquer forma, tudo é passageiro.
As estruturas de avaliação de IA atuais estão profundamente falhadas—os métodos de medição carecem de rigor, os resultados de avaliação frequentemente falham em atingir o objetivo, e os sistemas de classificação muitas vezes não capturam a nuance. Os laboratórios tendem a otimizar de forma restrita para esses pontos de referência, no entanto, os resultados reais não se traduzem. Independentemente disso, o AGI continua a ser inevitável. O ASI já não é um ponto final teórico distante—espere progressos significativos nesse aspecto dentro dos próximos doze meses.