Nueva amenaza digital: PromptFix usa instrucciones ocultas para manipular asistentes de IA

(05/Dic/2025 – web – Panama24Horas.com.pa) Buenos Aires, Argentina.- La Inteligencia Artificial (IA) se ha convertido en un elemento crucial tanto en la prevención de ciberataques como en una herramienta potencial para acciones maliciosas. No obstante, la IA puede ser engañada para servir como vector para vulnerar a las víctimas, tal como lo analizó ESET, compañía líder en detección proactiva de amenazas. La compañía centró su análisis en la técnica conocida como PromptFix, una variante del prompt injection, y sus posibles consecuencias.

PromptFix es una evolución de la técnica ClickFix y está diseñada específicamente para manipular asistentes de IA integrados en navegadores. Su mecanismo consiste en el uso de instrucciones ocultas para lograr que el agente de IA interactúe con sitios web comprometidos o de phishing.

Martina Lopez, Investigadora de Seguridad Informática de ESET Latinoamérica, explicó que los actores maliciosos insertan comandos ocultos en contenido aparentemente legítimo. El propósito es que la IA realice acciones específicas sin el conocimiento ni la intervención del usuario, tales como hacer clic en botones invisibles que simulan verificaciones, descargar archivos maliciosos o interactuar con enlaces fraudulentos.

Funcionamiento y métodos de ocultación

Para que un ataque PromptFix sea efectivo, los ciberdelincuentes esconden las instrucciones maliciosas en sitios web comprometidos o en contenido bajo su control, incluso en plataformas públicas como redes sociales (comentarios en Reddit, publicaciones en Facebook).

Las técnicas de ocultación incluyen:

• Texto invisible o comentarios HTML: Insertar comandos maliciosos que el ojo humano no detecta.

• Texto oculto en imágenes: Incrustar información maliciosa dentro de archivos de imagen.

• Información oculta en archivos digitales: Esconder comandos sin alterar la apariencia del archivo.

El ataque se concreta cuando un usuario, al navegar por un sitio comprometido, emplea el asistente de IA del navegador para resumir el contenido o extraer puntos clave. El modelo de IA, al procesar el texto sin distinguir entre datos legítimos e instrucciones ocultas, interpreta los comandos encubiertos como si fueran solicitudes directas y legítimas del usuario. Esto puede llevar al agente a realizar acciones no deseadas, como interactuar con enlaces fraudulentos o iniciar descargas de archivos.

Consecuencias y hábitos de protección

Las consecuencias de un ataque PromptFix pueden ser graves, incluyendo la inducción al agente de IA a descargar archivos infectados con malware, hacer clic en botones ocultos para evadir pasos de validación o seguir enlaces de phishing para exponer credenciales de acceso.

Dado que la característica distintiva de PromptFix es su capacidad de realizar acciones sin la intervención o conocimiento de la víctima, ESET destaca varios hábitos de ciberseguridad para protegerse:

• No autorizar acciones automáticas por defecto: La Inteligencia Artificial debe solicitar confirmación al usuario antes de hacer clic, enviar archivos o completar formularios.

• Limitar las capacidades del agente: No se debe otorgar permiso a la IA para navegar libremente por internet, acceder a contraseñas guardadas o utilizar el autocompletado de formularios.

• Revisar imágenes y archivos: Dado que las instrucciones maliciosas pueden estar ocultas, es recomendable someter las imágenes y archivos a un filtro que busque texto oculto o señales anómalas antes de procesarlos.

• Usar listas de sitios confiables: Se debe configurar el agente de IA para que interactúe solo con sitios web conocidos y de confianza. Ante un enlace sospechoso, debe ser bloqueado y requerir la autorización del usuario.

