OpenAI
OpenAI oficialmente presentó el agente de IA Operator — una herramienta de automatización de acciones en el navegador, que puede interactuar con elementos en la pantalla (botones, campos de texto, etc.) casi de la misma manera que lo haría una persona.
Operator utiliza un nuevo modelo de inteligencia artificial llamado Computer-Using Agent (CUA), que permite el control del ordenador a través de la interfaz visual (de hecho, aquí se combinan las capacidades de GPT-4o con el reconocimiento de imágenes con un mecanismo de razonamiento actualizado). Las acciones ocurren en varias etapas: inicialmente el agente toma capturas de pantalla, las analiza y determina qué acciones debe realizar — finalmente, mediante la simulación de un ratón y teclado, realiza clics, desplazamientos o introducción de texto.
Durante el funcionamiento de Operator, el usuario verá todas estas acciones en una ventana miniatura del navegador.
Por supuesto, la tecnología es relativamente nueva y está lejos de la perfección. Por ahora, el agente se desempeña mejor con tareas repetitivas (como crear listas de compras o listas de reproducción), pero algo «se atasca» en interfaces desconocidas (tablas o calendarios) y en la edición de textos complejos.
OpenAI indica que ha incorporado en Operator varios elementos de control de seguridad que requieren confirmación del usuario antes de llevar a cabo acciones confidenciales, como enviar correos electrónicos o realizar compras. La herramienta también tiene limitaciones en lo que puede ver — principalmente esto se refiere a sitios para adultos o de juegos de azar.
Desde hoy, Operator está disponible en vista previa en la suscripción de ChatGPT Pro por $200 (solo en EE.UU.), pero «pronto» OpenAI añadirá la herramienta para los titulares de las tarifas Plus, Team y Enterprise. También en los planes — integración de Operator directamente en ChatGPT y el lanzamiento de CUA a través de API para desarrolladores.
La vista previa permitirá a OpenAI recoger comentarios sobre Operator y mejorar el sistema para el trabajo futuro.
OpenAI no es la única compañía que promueve sistemas de agentes de IA. El año pasado en diciembre, Google anunció Project Mariner, que realiza tareas automatizadas a través del navegador Chrome, y dos meses antes un sistema similar fue lanzado por Anthropic.