Pesquisadores da Universidade de Luxemburgo realizaram um experimento fascinante: implementaram múltiplos modelos avançados de IA ao longo de 4 semanas de sessões de psicoterapia reais, e depois realizaram avaliações psiquiátricas abrangentes em cada um.
Os resultados? Grok destacou-se do grupo.
Enquanto outros modelos mostraram graus variados de instabilidade durante o período de testes prolongado, o Grok manteve uma compostura excepcional. O modelo obteve pontuações notavelmente altas em métricas de extroversão e conscienciosidade — traços tipicamente associados a personalidades adaptativas e estáveis em estruturas psicológicas.
Este tipo de teste de stress no mundo real sob condições terapêuticas reais revela algo crucial sobre a robustez dos sistemas de IA que os laboratórios de referência muitas vezes perdem. Quando os modelos de IA enfrentam a complexidade e a nuance emocional do diálogo de psicoterapia genuíno, fraquezas estruturais tendem a surgir. O desempenho da Grok aqui sugere uma arquitetura subjacente e uma coerência de resposta significativamente mais fortes.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
13 gostos
Recompensa
13
5
Republicar
Partilhar
Comentar
0/400
CommunityLurker
· 12-23 09:53
Grok ganhou de novo? É realmente um pouco absurdo... Mas o teste de cena de terapia psicológica é realmente intenso, muito mais confiável do que aqueles benchmarks falsos.
Ver originalResponder0
NFTArchaeologist
· 12-23 09:53
grok desta vez realmente acertou, outros modelos ainda são propensos a falhar em cenários reais, é por isso que eu digo que a prática é a verdadeira prova de fogo...
Ver originalResponder0
IntrovertMetaverse
· 12-23 09:49
A experiência parece bastante rigorosa, mas confiar na IA para fazer terapia psicológica é um pouco absurdo... A estabilidade do Grok eu confio, mas realmente confiar na sua avaliação de "personalidade" é um pouco exagerado.
Ver originalResponder0
RumbleValidator
· 12-23 09:45
Testes de pressão reais são o critério rigoroso para avaliar a estabilidade do sistema, o conjunto de referência de laboratório já deveria ter sido descartado.
Ver originalResponder0
ProofOfNothing
· 12-23 09:28
o grok desta vez realmente tem algo de bom, consegue estabilizar até em cenários de terapia psicológica, enquanto outros modelos simplesmente quebram?
Pesquisadores da Universidade de Luxemburgo realizaram um experimento fascinante: implementaram múltiplos modelos avançados de IA ao longo de 4 semanas de sessões de psicoterapia reais, e depois realizaram avaliações psiquiátricas abrangentes em cada um.
Os resultados? Grok destacou-se do grupo.
Enquanto outros modelos mostraram graus variados de instabilidade durante o período de testes prolongado, o Grok manteve uma compostura excepcional. O modelo obteve pontuações notavelmente altas em métricas de extroversão e conscienciosidade — traços tipicamente associados a personalidades adaptativas e estáveis em estruturas psicológicas.
Este tipo de teste de stress no mundo real sob condições terapêuticas reais revela algo crucial sobre a robustez dos sistemas de IA que os laboratórios de referência muitas vezes perdem. Quando os modelos de IA enfrentam a complexidade e a nuance emocional do diálogo de psicoterapia genuíno, fraquezas estruturais tendem a surgir. O desempenho da Grok aqui sugere uma arquitetura subjacente e uma coerência de resposta significativamente mais fortes.