7. Seguridad, Fallos y Limitaciones del Sistema de IA2 - Post-despliegue

Atribución de fuente no fiable

La atribución de fuente es un área crítica de la seguridad en IA que se enfoca en la **trazabilidad del origen de los datos** empleados por el sistema para generar su producción. Formalmente, describe la capacidad de un modelo de inteligencia artificial de especificar a partir de qué porciones de su conjunto de entrenamiento ha derivado una respuesta o un contenido generado. Sin embargo, debido a que las técnicas implementadas actualmente se fundamentan en aproximaciones algorítmicas y no en un registro determinístico, existe un riesgo inherente de que estas atribuciones sean imprecisas o francamente erróneas

Fuente: MIT AI Risk Repositorymit1183

ENTIDAD

2 - IA

INTENCIÓN

2 - Involuntario

TIEMPO

2 - Post-despliegue

ID del riesgo

mit1183

Linea de dominio

7. Seguridad, Fallos y Limitaciones del Sistema de IA

375 riesgos mapeados

7.4 > Falta de transparencia o interpretabilidad

Estrategia de mitigacion

1. Desarrollo e Implementación de Mecanismos de Atribución Determinísticos Priorizar la investigación y adopción de técnicas que permitan una trazabilidad de la procedencia de los datos más allá de las aproximaciones algorítmicas. Esto incluye la implementación de sistemas robustos de *data lineage* y la exploración de arquitecturas (como RAG o sistemas de indexación con metadatos de alta fidelidad) que garanticen una vinculación directa entre la salida generada y el segmento específico del *dataset* de entrenamiento utilizado. 2. Protocolos de Verificación y Auditoría Externa Establecer procedimientos rigurosos de gobernanza que requieran la validación por parte de expertos (auditores, oficiales de riesgo) de la fiabilidad de la atribución de fuentes en casos críticos o de alto impacto. Este proceso debe integrarse en el ciclo de vida del modelo (post-despliegue) y sustentarse en métricas de explicabilidad, como *Degrees of Explanation (DoX)* o *Local and Global Explanation Fidelity (LGEF)*, para monitorear continuamente la transparencia del sistema. 3. Gestión y Etiquetado de Datos Sintéticos Implementar una política estricta de curación de datos que exija la documentación exhaustiva, la identificación y el etiquetado inequívoco de cualquier dato sintético utilizado en el entrenamiento del modelo. Esta acción mitiga la complejidad en la atribución de fuentes amplificada por los datos generados, al tiempo que permite rastrear la fuente original utilizada para su creación.