
OpenAI ha lanzado un nuevo agente de inteligencia artificial (IA) diseñado para realizar diversas tareas en línea en nombre de los usuarios. El producto se conoce como Operator y “usando su propio navegador, puede mirar una página web e interactuar con ella escribiendo, haciendo clic y desplazándose”, según el startup.
Operator es uno de los primeros asistentes de IA de la firma enfocado en la ejecución independiente de múltiples tareas, refirió Wired en su sitio web.
Diversas tareas en línea
Diseñado para automatizar actividades repetitivas en cualquier navegador. Es capaz de completar formularios, realizar pedidos de comestibles, gestionar reservaciones de servicios o programar reuniones virtuales con una sola indicación.
El recurso está disponible en una “versión preliminar de investigación, lo que implica limitaciones en su funcionalidad y capacidad de procesamiento. La organización dirigida por Sam Altman promete que su producto evolucionará “en función de los comentarios” recibidos.
¿Cómo funciona la nueva IA de OpenAI?
El funcionamiento de Operator está basado en el modelo de IA Computer-Using Agent (CUA) que combina las capacidades de visión y razonamiento de GPT-4o mediante una técnica de aprendizaje por refuerzo. Esto significa que CUA está capacitado para interactuar con los botones, menús y campos de texto que las personas ven en una pantalla, sin necesidad de integrar API’s personalizadas.
Los desarrolladores señalan que el asistente usa “sus capacidades de razonamiento para autocorregirse”. Cuando no puede cumplir con una tarea, devuelve el control al usuario para garantizar una experiencia fluida y colaborativa.
Disponibilidad y uso
Los interesados en usar Operator solo deben ingresar al portal ‘operator.chatgpt.com’ y describir la tarea que desean realizar. En cualquier momento, pueden tomar el control del navegador remoto. Recibirán alertas proactivas cuando se requieran acciones específicas que involucran información sensible, como calves de acceso y datos para procesar pagos. El programa permite configurar instrucciones específicas para sitios web concretos.