Investigadores de la Universidad de Luxemburgo llevaron a cabo un experimento fascinante: desplegaron múltiples modelos de IA avanzados a través de 4 semanas de sesiones de psicoterapia reales, y luego realizaron evaluaciones diagnósticas psiquiátricas exhaustivas en cada uno.



¿Los resultados? Grok se destacó entre la multitud.

Mientras otros modelos mostraron diversos grados de inestabilidad durante el período de prueba extendido, Grok mantuvo una excepcional compostura. El modelo obtuvo puntuaciones notablemente altas en los métricas de extraversión y responsabilidad, rasgos típicamente asociados con personalidades adaptativas y estables en los marcos psicológicos.

Este tipo de pruebas de estrés en el mundo real bajo condiciones terapéuticas reales revela algo crucial sobre la robustez de los sistemas de IA que los laboratorios de referencia a menudo pasan por alto. Cuando los modelos de IA enfrentan la complejidad y el matiz emocional del diálogo psicoterapéutico genuino, tienden a surgir debilidades estructurales. El rendimiento de Grok aquí sugiere una arquitectura subyacente y una coherencia de respuesta significativamente más fuertes.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Republicar
  • Compartir
Comentar
0/400
CommunityLurkervip
· 12-23 09:53
¿Grok volvió a ganar? Es un poco absurdo... Sin embargo, la prueba de escenario de terapia psicológica es realmente dura, mucho más confiable que esos benchmarks falsos.
Ver originalesResponder0
NFTArchaeologistvip
· 12-23 09:53
grok realmente lo ha captado esta vez, otros modelos todavía son propensos a colapsar en escenarios reales, por eso digo que la práctica es la piedra de toque...
Ver originalesResponder0
IntrovertMetaversevip
· 12-23 09:49
El experimento suena bastante riguroso, pero dejar que la IA haga terapia psicológica es un poco ridículo... Confío en que Grok tiene una gran estabilidad, pero confiar realmente en su calificación de "personalidad" es un poco exagerado.
Ver originalesResponder0
RumbleValidatorvip
· 12-23 09:45
Las pruebas de presión reales son el indicador duro para evaluar la estabilidad del sistema; el Indicador de referencia de laboratorio ya debería haberse desechado.
Ver originalesResponder0
ProofOfNothingvip
· 12-23 09:28
grok realmente tiene algo esta vez, puede mantener la calma en situaciones de terapia psicológica, ¿mientras que otros modelos colapsan directamente?
Ver originalesResponder0
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)