Uma pesquisa conjunta entre a Academia da Internet de Oxford e outras instituições indicou que os métodos de avaliação da inteligência artificial muitas vezes exageram seu desempenho e carecem de precisão científica e rigor. Os pesquisadores analisaram 445 testes padronizados e descobriram que muitos dos objetivos nesses testes não eram claros e careciam de confiabilidade, levantando dúvidas sobre sua eficácia. Os pesquisadores pediram uma revisão aprofundada desses testes.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Uma pesquisa conjunta entre a Academia da Internet de Oxford e outras instituições indicou que os métodos de avaliação da inteligência artificial muitas vezes exageram seu desempenho e carecem de precisão científica e rigor. Os pesquisadores analisaram 445 testes padronizados e descobriram que muitos dos objetivos nesses testes não eram claros e careciam de confiabilidade, levantando dúvidas sobre sua eficácia. Os pesquisadores pediram uma revisão aprofundada desses testes.