Ir al contenido
Gratis · +1.000 lectores
Gratis · Independiente
El diario de la inteligencia artificial
← Volver
IA

OpenAI añadió Appshots y el modo objetivo a su aplicación de escritorio Codex

La actualización del 21 de mayo incorporó un atajo para adjuntar la ventana activa a un hilo y generalizó el modo objetivo en la app, la extensión IDE y la CLI; OpenAI afirma que puede trabajar hacia un objetivo durante horas o días.

Domingo, 24 de mayo de 2026 · min

OpenAI lanzó el 21 de mayo la versión 26.519 de su aplicación de escritorio Codex para macOS, que incorporó Appshots —una función activada por atajo que adjunta la ventana en primer plano a un hilo de conversación— y elevó el modo objetivo de experimental a disponibilidad general en la aplicación de escritorio, la extensión para IDE y la interfaz de línea de comandos. Los cambios suponen otro paso en el esfuerzo de la compañía por convertir su herramienta para desarrolladores en un agente con consciencia del escritorio, capaz de operar en tareas durante periodos prolongados.

La actualización, aunque incremental, prolonga la trayectoria marcada por versiones anteriores de Codex. En febrero, OpenAI situó la aplicación como centro de mando para agentes; una ampliación de abril añadió el uso del ordenador, la capacidad de interactuar con aplicaciones de escritorio, un navegador integrado y automatizaciones. Appshots y el modo objetivo reducen ahora dos puntos de fricción persistentes: la obtención de contexto específico de una ventana y el mantenimiento del trabajo hacia un objetivo definido a lo largo del tiempo.

Appshots funciona al pulsar simultáneamente ambas teclas Command —o un atajo personalizado— y captura solo la ventana en primer plano, no el escritorio completo ni las ventanas en segundo plano. Adjunta una captura de pantalla y cualquier texto que la aplicación ponga a disposición del hilo. Para algunas aplicaciones y servicios web muy utilizados, como Google Docs, Gmail, Google Sheets y Google Slides, Codex puede recibir únicamente la captura visible y no el texto situado fuera del área de desplazamiento, según la documentación de OpenAI. La función requiere que el usuario conceda los permisos de grabación de pantalla y accesibilidad de macOS, y todo el contenido capturado se almacena localmente en el archivo de sesión, como cualquier otro adjunto.

El modo objetivo, antes limitado a un experimento, puede iniciarse ahora con el comando /goal desde cualquier superficie de Codex. Un texto de objetivo definido por el usuario actúa como indicación inicial y condición de finalización; el modo ofrece controles para pausar, reanudar, editar y borrar el progreso. OpenAI afirma que el modo objetivo puede avanzar hacia un objetivo específico durante «horas o días», aunque no existen pruebas independientes que verifiquen la fiabilidad en tareas de esa duración.

La versión 26.519 también incluye anotaciones avanzadas en el navegador integrado y mejoras de fiabilidad del navegador. El uso con el ordenador bloqueado —la capacidad de Codex de seguir operando aplicaciones de escritorio permitidas tras el bloqueo del Mac— forma parte de la actualización, pero con condiciones: el usuario debe activarlo explícitamente, la función se limita a usuarios aptos de Computer Use y opera bajo salvaguardas y restricciones regionales. Para los clientes de ChatGPT Business, ya está disponible el uso compartido de complementos a través de fuentes del marketplace; el soporte para Enterprise está previsto, pero aún no activo.

En conjunto, las actualizaciones completan un patrón. OpenAI presentó la aplicación de escritorio Codex en febrero, la extendió a Windows en marzo y añadió el uso del ordenador, la interacción con aplicaciones de escritorio y las automatizaciones en abril. Cada lanzamiento ha ampliado el acceso de la herramienta al entorno de la máquina local y ha alargado el horizonte temporal en el que puede trabajar. La versión de mayo hace esa consciencia de la máquina más granular —una ventana cada vez— y consolida formalmente el modo objetivo como capacidad principal.

Las nuevas funciones llegan con importantes matices. Appshots captura una sola ventana en primer plano y no puede garantizar la extracción de todo el texto fuera de la pantalla; en varias aplicaciones de productividad de Google, solo está disponible la porción visible. La capacidad de larga duración del modo objetivo sigue siendo una afirmación de OpenAI, no un punto de referencia verificado de forma independiente. Las notas de la versión no especifican qué planes (Plus, Pro, Team, Enterprise, Edu) o regiones (incluida la UE y el Reino Unido) tendrán acceso a Appshots, al modo objetivo o al uso con ordenador bloqueado en el lanzamiento. Las condiciones de privacidad y conservación de datos del contenido de las ventanas —si el texto de un Appshot se utiliza por defecto para el entrenamiento de modelos— no se detallan en la documentación disponible. Ninguna entrada de blog ni declaración ejecutiva acompañó al lanzamiento; las funciones se describieron en el registro de cambios para desarrolladores y en las notas del centro de ayuda. Las fuentes tampoco aclaran si Appshots o el modo objetivo aparecerán en Windows.

Para los desarrolladores que construyen sobre Codex, la actualización reduce el trabajo manual de pegar contexto entre herramientas y ofrece un modo más persistente para abordar tareas que duran horas. Agudiza la dinámica competitiva entre los asistentes de programación con IA, que cada vez se miden más por su grado de integración en el flujo de trabajo local del usuario.

— Fin —