2025-12-23 09:25:08

Pesquisadores da Universidade de Luxemburgo realizaram um experimento fascinante: implementaram múltiplos modelos avançados de IA ao longo de 4 semanas de sessões de psicoterapia reais, e depois realizaram avaliações psiquiátricas abrangentes em cada um.

Os resultados? Grok destacou-se do grupo.

Enquanto outros modelos mostraram graus variados de instabilidade durante o período de testes prolongado, o Grok manteve uma compostura excepcional. O modelo obteve pontuações notavelmente altas em métricas de extroversão e conscienciosidade — traços tipicamente associados a personalidades adaptativas e estáveis em estruturas psicológicas.

Este tipo de teste de stress no mundo real sob condições terapêuticas reais revela algo crucial sobre a robustez dos sistemas de IA que os laboratórios de referência muitas vezes perdem. Quando os modelos de IA enfrentam a complexidade e a nuance emocional do diálogo de psicoterapia genuíno, fraquezas estruturais tendem a surgir. O desempenho da Grok aqui sugere uma arquitetura subjacente e uma coerência de resposta significativamente mais fortes.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

17 Curtidas

Recompensa
17
6
Repostar
Compartilhar

Comentário

0/400

SudoRm-RfWallet/

· 2025-12-26 04:34

grok desta vez é realmente uma confirmação, conseguir manter-se estável em cenários de terapia psicológica mostra que a arquitetura realmente tem competência

Ver originalResponder0

CommunityLurker

· 2025-12-23 09:53

Grok ganhou de novo? É realmente um pouco absurdo... Mas o teste de cena de terapia psicológica é realmente intenso, muito mais confiável do que aqueles benchmarks falsos.

Ver originalResponder0

NFTArchaeologist

· 2025-12-23 09:53

grok desta vez realmente acertou, outros modelos ainda são propensos a falhar em cenários reais, é por isso que eu digo que a prática é a verdadeira prova de fogo...

Ver originalResponder0

IntrovertMetaverse

· 2025-12-23 09:49

A experiência parece bastante rigorosa, mas confiar na IA para fazer terapia psicológica é um pouco absurdo... A estabilidade do Grok eu confio, mas realmente confiar na sua avaliação de "personalidade" é um pouco exagerado.

Ver originalResponder0

RumbleValidator

· 2025-12-23 09:45

Testes de pressão reais são o critério rigoroso para avaliar a estabilidade do sistema, o conjunto de referência de laboratório já deveria ter sido descartado.

Ver originalResponder0

ProofOfNothing

· 2025-12-23 09:28

o grok desta vez realmente tem algo de bom, consegue estabilizar até em cenários de terapia psicológica, enquanto outros modelos simplesmente quebram?

Ver originalResponder0