3. Desinformación2 - Post-despliegue

Desinformación

El fenómeno de los resultados inexactos, a menudo denominados "alucinaciones", de los grandes modelos de lenguaje (LLM) como Bard o ChatGPT, constituye un desafío de seguridad ya ampliamente documentado. Es crucial entender que estas herramientas de IA generativa, incluso sin la intención de mentir o desorientar, son capaces de generar información errónea con consecuencias perjudiciales. La gravedad de este riesgo se intensifica por el estilo sofisticado y pulcro de la redacción de la IA, y su capacidad de mezclar datos falsos dentro de un contexto de información verídica, lo que confiere a las falsedades un peligroso barniz de verosimilitud. Un ejemplo tangible de este impacto, reportado por The Washington Post, fue la inclusión errónea de un profesor de derecho en una lista generada por IA de "académicos legales que habían acosado sexualmente a alguien", a pesar de la inexistencia de tales alegaciones.

Fuente: MIT AI Risk Repositorymit481

ENTIDAD

2 - IA

INTENCIÓN

2 - Involuntario

TIEMPO

2 - Post-despliegue

ID del riesgo

mit481

Linea de dominio

3. Desinformación

74 riesgos mapeados

3.1 > Información falsa o engañosa

Estrategia de mitigacion

1. Implementación de la Generación Aumentada por Recuperación (RAG) para vincular las respuestas del LLM a fuentes de conocimiento externas y verificables en tiempo real, garantizando el anclaje fáctico del contenido generado y minimizando la dependencia de la memoria interna del modelo. 2. Afinar el modelo (fine-tuning) con conjuntos de datos cuidadosamente seleccionados y específicos de dominio. Este proceso debe enfocarse en mejorar la calidad y la coherencia de los datos para reducir la probabilidad de generar información incorrecta o irrelevante en áreas especializadas. 3. Establecimiento de protocolos de supervisión humana y validación de resultados (Human-in-the-Loop) posteriores a la generación, lo cual es crucial en aplicaciones de alto riesgo (ej. legal o médica) para detectar y corregir alucinaciones sutiles antes de que causen daños.