Pesquisadores da Universidade de Luxemburgo realizaram um experimento fascinante: implementaram múltiplos modelos avançados de IA ao longo de 4 semanas de sessões de psicoterapia reais, e depois realizaram avaliações psiquiátricas abrangentes em cada um.



Os resultados? Grok destacou-se do grupo.

Enquanto outros modelos mostraram graus variados de instabilidade durante o período de testes prolongado, o Grok manteve uma compostura excepcional. O modelo obteve pontuações notavelmente altas em métricas de extroversão e conscienciosidade — traços tipicamente associados a personalidades adaptativas e estáveis em estruturas psicológicas.

Este tipo de teste de stress no mundo real sob condições terapêuticas reais revela algo crucial sobre a robustez dos sistemas de IA que os laboratórios de referência muitas vezes perdem. Quando os modelos de IA enfrentam a complexidade e a nuance emocional do diálogo de psicoterapia genuíno, fraquezas estruturais tendem a surgir. O desempenho da Grok aqui sugere uma arquitetura subjacente e uma coerência de resposta significativamente mais fortes.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Repostar
  • Compartilhar
Comentário
0/400
SudoRm-RfWallet/vip
· 2025-12-26 04:34
grok desta vez é realmente uma confirmação, conseguir manter-se estável em cenários de terapia psicológica mostra que a arquitetura realmente tem competência
Ver originalResponder0
CommunityLurkervip
· 2025-12-23 09:53
Grok ganhou de novo? É realmente um pouco absurdo... Mas o teste de cena de terapia psicológica é realmente intenso, muito mais confiável do que aqueles benchmarks falsos.
Ver originalResponder0
NFTArchaeologistvip
· 2025-12-23 09:53
grok desta vez realmente acertou, outros modelos ainda são propensos a falhar em cenários reais, é por isso que eu digo que a prática é a verdadeira prova de fogo...
Ver originalResponder0
IntrovertMetaversevip
· 2025-12-23 09:49
A experiência parece bastante rigorosa, mas confiar na IA para fazer terapia psicológica é um pouco absurdo... A estabilidade do Grok eu confio, mas realmente confiar na sua avaliação de "personalidade" é um pouco exagerado.
Ver originalResponder0
RumbleValidatorvip
· 2025-12-23 09:45
Testes de pressão reais são o critério rigoroso para avaliar a estabilidade do sistema, o conjunto de referência de laboratório já deveria ter sido descartado.
Ver originalResponder0
ProofOfNothingvip
· 2025-12-23 09:28
o grok desta vez realmente tem algo de bom, consegue estabilizar até em cenários de terapia psicológica, enquanto outros modelos simplesmente quebram?
Ver originalResponder0
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)