Sebuah penelitian bersama antara Akademi Internet di Oxford dan institusi lainnya menunjukkan bahwa metode evaluasi kecerdasan buatan sering kali melebih-lebihkan kinerjanya, dan kurang dalam akurasi ilmiah dan ketelitian. Para peneliti menganalisis 445 tes standar, dan menemukan bahwa banyak tujuan dalam tes tersebut tidak jelas, dan kurang dalam keandalan, yang menimbulkan keraguan tentang efektivitasnya. Para peneliti menyerukan dilakukannya tinjauan mendalam terhadap tes-tes tersebut.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Sebuah penelitian bersama antara Akademi Internet di Oxford dan institusi lainnya menunjukkan bahwa metode evaluasi kecerdasan buatan sering kali melebih-lebihkan kinerjanya, dan kurang dalam akurasi ilmiah dan ketelitian. Para peneliti menganalisis 445 tes standar, dan menemukan bahwa banyak tujuan dalam tes tersebut tidak jelas, dan kurang dalam keandalan, yang menimbulkan keraguan tentang efektivitasnya. Para peneliti menyerukan dilakukannya tinjauan mendalam terhadap tes-tes tersebut.