Una investigación conjunta entre la Academia de Internet de Oxford y otras instituciones indicó que los métodos de evaluación de la inteligencia artificial a menudo exageran su desempeño y carecen de precisión científica y rigor. Los investigadores analizaron 445 pruebas estandarizadas y encontraron que muchos de los objetivos en estas pruebas no estaban claros y carecían de fiabilidad, lo que suscita dudas sobre su efectividad. Los investigadores pidieron una revisión profunda de estas pruebas.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Una investigación conjunta entre la Academia de Internet de Oxford y otras instituciones indicó que los métodos de evaluación de la inteligencia artificial a menudo exageran su desempeño y carecen de precisión científica y rigor. Los investigadores analizaron 445 pruebas estandarizadas y encontraron que muchos de los objetivos en estas pruebas no estaban claros y carecían de fiabilidad, lo que suscita dudas sobre su efectividad. Los investigadores pidieron una revisión profunda de estas pruebas.