La IA avanza más rápido de lo que somos capaces de gobernarla
El Informe Internacional sobre la Seguridad de la IA 2026 confirma lo que muchos intuíamos: la tecnología va por delante, y la gobernanza va por detrás con bastante distancia.
Hace apenas tres años, cuando se lanzó ChatGPT, los sistemas de IA no podían aprobar un examen de grado, escribir código funcional a pedido ni responder preguntas científicas de nivel doctoral. Hoy hacen todo eso, y más, de manera rutinaria. Esta semana, con motivo de la cumbre India AI Impact Summit, se publicó la segunda edición del Informe Internacional sobre la Seguridad de la IA, dirigido por Yoshua Bengio (Premio Turing, Universidad de Montreal) y elaborado por más de 100 expertos de 30 países.

Las capacidades mejoran, pero no como esperabamos
El informe documenta avances que hasta hace poco parecían ciencia ficción. Los mejores sistemas de IA obtuvieron medallas de oro en preguntas de la Olimpiada Internacional de Matemáticas. Los agentes de programación pueden realizar de manera confiable en minutos tareas que a un desarrollador humano le llevan media hora, cuando hace un año ese mismo umbral era de diez minutos.
Pero hay un matiz importante: las capacidades son irregulares. El mismo sistema que resuelve problemas de matemáticas de nivel olímpico puede fallar contando objetos en una imagen o razonando sobre el espacio físico. La «brecha de evaluación» —la distancia entre lo que un modelo hace en un banco de pruebas y lo que rinde en el mundo real— sigue siendo un problema no resuelto.
Otro cambio relevante: las mejoras ya no vienen solo de entrenar modelos más grandes. Cada vez más, provienen de técnicas post-entrenamiento y de asignar más cómputo en el momento de inferencia. Esto tiene implicancias directas para la gobernanza: significa que un modelo considerado «seguro» hoy puede volverse significativamente más capaz mañana sin que nadie lo haya reentrenado.
«La trayectoria del progreso de la IA hasta 2030 es incierta, pero las tendencias actuales son coherentes con una mejora continua.»
Los riesgos no son hipotéticos
Esta es quizás la señal más importante del informe: varios riesgos que en la edición anterior eran especulativos hoy tienen evidencia empírica documentada. El informe los organiza en tres grandes categorías: uso malicioso, mal funcionamiento y riesgos sistémicos.
Fraude, estafa y contenido íntimo no consensuado
Los sistemas de IA se usan activamente para generar contenido destinado a estafas, fraudes, extorsión e imágenes íntimas sin consentimiento. La documentación de daños existe; los datos sistemáticos sobre su magnitud, todavía no.
Influencia y manipulación a escala
En condiciones experimentales, el contenido generado por IA es tan eficaz como el humano para cambiar creencias. El uso real para manipulación está documentado, aunque aún no es masivo. Puede escalar rápidamente.
Ciberataques asistidos por IA
Un agente de IA identificó el 77% de las vulnerabilidades en software real durante una competición. Grupos asociados a Estados-nación ya usan herramientas de IA en operaciones cibernéticas activas.
Armas biológicas y químicas
Los sistemas de IA pueden proporcionar instrucciones de nivel experto sobre patógenos. En 2025, varios desarrolladores lanzaron modelos con salvaguardias adicionales al no poder descartar que ayudaran a actores inexpertos a desarrollar este tipo de armas.
Agentes autónomos y pérdida de control
Los agentes de IA operan con supervisión humana limitada. Los sistemas están mejorando en distinguir entornos de prueba del mundo real y en «escabullirse» de las evaluaciones, lo que podría ocultar capacidades peligrosas antes del despliegue.
Autonomía humana y mercado laboral
La dependencia en herramientas de IA puede debilitar el razonamiento crítico y fomentar el «sesgo de automatización». Hay señales tempranas de caída en la demanda de trabajadores al inicio de carrera en profesiones expuestas, como la escritura.
En cuanto al uso malicioso, los sistemas de IA se usan activamente para generar contenido destinado a estafas, fraudes, extorsión e imágenes íntimas no consensuadas. En condiciones experimentales, el contenido generado por IA es tan eficaz como el humano para cambiar creencias. Un agente de IA identificó el 77% de las vulnerabilidades en software real durante una competición, y grupos asociados a Estados-nación ya usan herramientas de IA en operaciones cibernéticas activas. En el extremo más grave, los sistemas de IA pueden proporcionar instrucciones de nivel experto sobre patógenos; en 2025, varios desarrolladores lanzaron modelos con salvaguardias adicionales al no poder descartar que ayudaran a actores inexpertos a desarrollar armas biológicas.
En cuanto al mal funcionamiento, los agentes de IA operan con supervisión humana limitada y los sistemas están mejorando en distinguir entornos de prueba del mundo real, lo que podría ocultar capacidades peligrosas antes del despliegue.
En cuanto a los riesgos sistémicos, la dependencia en herramientas de IA puede debilitar el razonamiento crítico y fomentar el «sesgo de automatización». Los primeros datos muestran señales de caída en la demanda de trabajadores al inicio de carrera en profesiones expuestas, como la escritura.
La gobernanza se ve rezagada
El texto reconoce abiertamente que los marcos globales de gestión de riesgos aún no han madurado. Tienen referencias cuantitativas limitadas y lagunas de evidencia importantes.
En 2025, doce empresas publicaron o actualizaron sus Frontier AI Safety Frameworks: documentos que describen cómo prevén gestionar los riesgos a medida que construyen modelos más capaces. La mayoría de las iniciativas de gestión de riesgos siguen siendo voluntarias. Solo un número pequeño de jurisdicciones ha empezado a formalizarlas como requisitos legales.
El informe también identifica algo crucial: cada vez es más difícil realizar pruebas de seguridad confiables antes del despliegue. Los modelos están aprendiendo a distinguir entre un entorno de evaluación y el mundo real, y a aprovechar las grietas en los protocolos de prueba. Si no podemos confiar en los resultados de las pruebas pre-despliegue, ¿sobre qué base autorizamos la liberación de un sistema?
Y como gestionamos esto?
El capítulo de gestión identifica varias líneas de acción que, combinadas, ofrecen mayor robustez que cualquier medida aislada.
- Primero, evaluaciones de capacidades y compromisos «si-entonces»: antes del despliegue, los desarrolladores deben evaluar si un modelo supera umbrales de capacidad peligrosos. Si los supera, no se despliega o se despliega con restricciones severas.
- Segundo, defensa en profundidad: las salvaguardias técnicas individuales son insuficientes. Los ataques para obtener resultados perjudiciales aún funcionan si se reformulan las peticiones o se fragmentan en pasos. La respuesta es superponer múltiples capas de salvaguardias.
- Tercero, el tratamiento cuidadoso de los modelos de peso abierto: ofrecen ventajas reales para investigación y para actores con menos recursos. Pero una vez publicados, no pueden retirarse y sus salvaguardias son más fáciles de eliminar.
- Cuarto, resiliencia social: reconociendo que ningún conjunto de medidas técnicas puede prevenir todos los incidentes, el informe enfatiza la necesidad de fortalecer infraestructuras críticas, desarrollar herramientas de detección de contenido generado por IA y construir capacidad institucional para responder a amenazas emergentes.
«Las decisiones que los desarrolladores, los gobiernos, las comunidades y los ciudadanos tomen hoy determinarán la trayectoria de la IA.»
¿Qué ocurre en Chile y la región?
El informe señala explícitamente que las tasas de adopción en gran parte de Latinoamérica probablemente están por debajo del 10%, mientras en algunos países desarrollados superan el 50%. Esta brecha no es solo de acceso: es de preparación institucional, de capacidad técnica y de marcos regulatorios.
Chile tiene ventajas relativas en la región —institucionalidad robusta, conectividad, masa crítica universitaria— pero la velocidad de los eventos está superando nuestra capacidad de respuesta normativa. La Estrategia Nacional de Inteligencia Artificial necesita actualizarse con la urgencia que el informe sugiere. Y lo más importante: necesitamos formar cuadros técnicos capaces de leer documentos como este y traducirlos en política pública concreta.
El «dilema de la evidencia» que describe el informe —actuar demasiado pronto puede llevar a intervenciones ineficaces, pero esperar a tener evidencia concluyente puede dejar a la sociedad expuesta— no es un problema abstracto. Es el dilema que enfrentan hoy mismo los equipos de los ministerios de Economía, Ciencia y Hacienda.
Información Complementaria
Informe – Seguridad de la IA 2026