11 paginas canonicas de riesgo
Fiabilidad
Modos de fallo que degradan la calidad, consistencia o confiabilidad de los resultados.
Adulación
Tendencia del modelo a producir respuestas que confirman las expectativas o creencias del usuario en lugar de proporcionar información objetiva y veraz.
Alucinación Confabulada
Generación de información factualmente incorrecta o inventada que el modelo presenta con alta confianza aparente, sin fundamento en sus datos de entrenamiento o en fuentes verificables.
Colapso de Modo
Fenómeno en modelos generativos donde el modelo pierde diversidad en sus outputs y converge a generar repetidamente un conjunto limitado de muestras similares.
Correlación Espuria
Aprendizaje de correlaciones estadísticas superficiales sin relación causal real (ej: asociar nieve con lobos porque aparecen juntos en fotos), fallando en generalización.
Deriva del Modelo
Degradación progresiva del rendimiento del modelo cuando la distribución de datos del mundo real cambia con el tiempo, volviéndose diferentes de los datos de entrenamiento original (Concept Drift).
Fragilidad
Tendencia de los modelos a experimentar fallos catastróficos cuando se enfrentan a inputs ligeramente fuera de la distribución de entrenamiento, demostrando falta de generalización robusta.
Fuera de Distribución
Fallo sistemático del modelo cuando se encuentra con datos que provienen de una distribución significativamente diferente a la del conjunto de entrenamiento.
Olvido Catastrófico
Pérdida drástica de conocimiento previamente aprendido cuando una red neuronal es entrenada en tareas nuevas, especialmente problemático en aprendizaje continuo.
Subespecificación
Ambigüedad en la especificación del problema de aprendizaje que resulta en múltiples modelos con rendimiento similar en test pero comportamiento radicalmente diferente en producción.
Sobreajuste
Aprendizaje excesivo de ruido y particularidades específicas del conjunto de entrenamiento en lugar de patrones generalizables, resultando en pobre rendimiento en datos nuevos.
Subajuste
Modelo con capacidad insuficiente o entrenamiento inadecuado que no logra capturar los patrones subyacentes en los datos, resultando en rendimiento pobre.