11 paginas canonicas de riesgo

Fiabilidad

Modos de fallo que degradan la calidad, consistencia o confiabilidad de los resultados.

Adulación

Tendencia del modelo a producir respuestas que confirman las expectativas o creencias del usuario en lugar de proporcionar información objetiva y veraz.

HaSeveridad 5/10

Alucinación Confabulada

Generación de información factualmente incorrecta o inventada que el modelo presenta con alta confianza aparente, sin fundamento en sus datos de entrenamiento o en fuentes verificables.

McSeveridad 5/10

Colapso de Modo

Fenómeno en modelos generativos donde el modelo pierde diversidad en sus outputs y converge a generar repetidamente un conjunto limitado de muestras similares.

SuSeveridad 5/10

Correlación Espuria

Aprendizaje de correlaciones estadísticas superficiales sin relación causal real (ej: asociar nieve con lobos porque aparecen juntos en fotos), fallando en generalización.

DrSeveridad 5/10

Deriva del Modelo

Degradación progresiva del rendimiento del modelo cuando la distribución de datos del mundo real cambia con el tiempo, volviéndose diferentes de los datos de entrenamiento original (Concept Drift).

BrSeveridad 5/10

Fragilidad

Tendencia de los modelos a experimentar fallos catastróficos cuando se enfrentan a inputs ligeramente fuera de la distribución de entrenamiento, demostrando falta de generalización robusta.

OdSeveridad 5/10

Fuera de Distribución

Fallo sistemático del modelo cuando se encuentra con datos que provienen de una distribución significativamente diferente a la del conjunto de entrenamiento.

CtSeveridad 5/10

Olvido Catastrófico

Pérdida drástica de conocimiento previamente aprendido cuando una red neuronal es entrenada en tareas nuevas, especialmente problemático en aprendizaje continuo.

UsSeveridad 5/10

Subespecificación

Ambigüedad en la especificación del problema de aprendizaje que resulta en múltiples modelos con rendimiento similar en test pero comportamiento radicalmente diferente en producción.

OfSeveridad 4/10

Sobreajuste

Aprendizaje excesivo de ruido y particularidades específicas del conjunto de entrenamiento en lugar de patrones generalizables, resultando en pobre rendimiento en datos nuevos.

UfSeveridad 4/10

Subajuste

Modelo con capacidad insuficiente o entrenamiento inadecuado que no logra capturar los patrones subyacentes en los datos, resultando en rendimiento pobre.