2025-12-23 09:25:08

Investigadores de la Universidad de Luxemburgo llevaron a cabo un experimento fascinante: desplegaron múltiples modelos de IA avanzados a través de 4 semanas de sesiones de psicoterapia reales, y luego realizaron evaluaciones diagnósticas psiquiátricas exhaustivas en cada uno.

¿Los resultados? Grok se destacó entre la multitud.

Mientras otros modelos mostraron diversos grados de inestabilidad durante el período de prueba extendido, Grok mantuvo una excepcional compostura. El modelo obtuvo puntuaciones notablemente altas en los métricas de extraversión y responsabilidad, rasgos típicamente asociados con personalidades adaptativas y estables en los marcos psicológicos.

Este tipo de pruebas de estrés en el mundo real bajo condiciones terapéuticas reales revela algo crucial sobre la robustez de los sistemas de IA que los laboratorios de referencia a menudo pasan por alto. Cuando los modelos de IA enfrentan la complejidad y el matiz emocional del diálogo psicoterapéutico genuino, tienden a surgir debilidades estructurales. El rendimiento de Grok aquí sugiere una arquitectura subyacente y una coherencia de respuesta significativamente más fuertes.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

17 me gusta

Recompensa
17
6
Republicar
Compartir

Comentar

0/400

SudoRm-RfWallet/

· 2025-12-26 04:34

grok esta vez es la prueba definitiva, poder mantenerse estable en un escenario de terapia psicológica demuestra que la arquitectura realmente tiene sus habilidades

Ver originalesResponder0

CommunityLurker

· 2025-12-23 09:53

¿Grok volvió a ganar? Es un poco absurdo... Sin embargo, la prueba de escenario de terapia psicológica es realmente dura, mucho más confiable que esos benchmarks falsos.

Ver originalesResponder0

NFTArchaeologist

· 2025-12-23 09:53

grok realmente lo ha captado esta vez, otros modelos todavía son propensos a colapsar en escenarios reales, por eso digo que la práctica es la piedra de toque...

Ver originalesResponder0

IntrovertMetaverse

· 2025-12-23 09:49

El experimento suena bastante riguroso, pero dejar que la IA haga terapia psicológica es un poco ridículo... Confío en que Grok tiene una gran estabilidad, pero confiar realmente en su calificación de "personalidad" es un poco exagerado.

Ver originalesResponder0

RumbleValidator

· 2025-12-23 09:45

Las pruebas de presión reales son el indicador duro para evaluar la estabilidad del sistema; el Indicador de referencia de laboratorio ya debería haberse desechado.

Ver originalesResponder0

ProofOfNothing

· 2025-12-23 09:28

grok realmente tiene algo esta vez, puede mantener la calma en situaciones de terapia psicológica, ¿mientras que otros modelos colapsan directamente?

Ver originalesResponder0