Kerangka evaluasi AI saat ini sangat cacat—metodologi pengukuran kurang ketat, hasil penilaian sering meleset, dan sistem peringkat sering kali mengabaikan nuansa. Laboratorium cenderung mengoptimalkan secara sempit untuk tolok ukur ini, namun hasil aktual tidak terjemahkan. Terlepas dari itu, AGI tetap tak terhindarkan. ASI bukan lagi titik akhir teoritis yang jauh—harapkan kemajuan yang berarti di bidang itu dalam dua belas bulan ke depan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
6 Suka
Hadiah
6
2
Posting ulang
Bagikan
Komentar
0/400
RektRecorder
· 16jam yang lalu
ngl benchmark ini benar-benar tidak menarik, mengejar angka dan apa yang bisa dilakukan di dunia nyata itu dua hal yang berbeda.
Lihat AsliBalas0
CascadingDipBuyer
· 16jam yang lalu
Gulung-gulung, sekarang bahkan penilaian juga mulai bergulir? Toh itu semua hanya angin lalu.
Kerangka evaluasi AI saat ini sangat cacat—metodologi pengukuran kurang ketat, hasil penilaian sering meleset, dan sistem peringkat sering kali mengabaikan nuansa. Laboratorium cenderung mengoptimalkan secara sempit untuk tolok ukur ini, namun hasil aktual tidak terjemahkan. Terlepas dari itu, AGI tetap tak terhindarkan. ASI bukan lagi titik akhir teoritis yang jauh—harapkan kemajuan yang berarti di bidang itu dalam dua belas bulan ke depan.