OpenAI hat in den USA den neuen KI-Agenten „Operator“ vorgestellt, der alltägliche Aufgaben im Internet eigenständig ausführen kann. Der Dienst befindet sich derzeit in einer Forschungsphase und steht Pro-Nutzern in den Vereinigten Staaten zur Verfügung. Ziel ist es, repetitive Browser-Tätigkeiten zu automatisieren und so Arbeitsprozesse effizienter zu gestalten.

„Operator“ basiert auf einem Modell namens „Computer-Using Agent“ (CUA), das sowohl die visuelle Erkennung von Webseiten als auch die Interaktion mit Benutzeroberflächen wie Buttons oder Textfeldern ermöglicht. Der Agent kann Webseiten wie ein Mensch „sehen“ und mit Maus- und Tastatureingaben Aktionen durchführen. Im Gegensatz zu anderen Systemen benötigt „Operator“ keine speziellen Schnittstellen, sondern arbeitet direkt mit grafischen Oberflächen, was ihn besonders flexibel macht.
Die Einsatzmöglichkeiten sind breit gefächert. Nutzer können den KI-Agenten beispielsweise für das Ausfüllen von Formularen, die Buchung von Reisen oder die Organisation von Einkäufen nutzen. Darüber hinaus kann „Operator“ mehrere Aufgaben gleichzeitig ausführen und diese bei Bedarf an den Nutzer übergeben, wenn Eingaben wie Login-Daten oder Zahlungsinformationen erforderlich sind.
Momentan ist der Dienst ausschließlich für Pro-Nutzer in den USA verfügbar. OpenAI verfolgt mit der schrittweisen Einführung das Ziel, aus Nutzererfahrungen zu lernen und mögliche Fehler zu beheben, bevor der Dienst für ein breiteres Publikum zugänglich gemacht wird. Weitere Nutzergruppen wie Plus-, Team- und Enterprise-Nutzer sollen in Zukunft ebenfalls Zugriff erhalten.
Der US-Start von „Operator“ ist ein deutlicher Schritt in Richtung einer neuen Art der Automatisierung, bei der KI eigenständig Aufgaben übernehmen kann, die zuvor manuelle Eingriffe erforderten. Ob und wann der Dienst auch außerhalb der USA verfügbar sein wird, ist bislang unklar. In der aktuellen Testphase liegt der Fokus darauf, die Technologie zu optimieren und mögliche Einsatzbereiche weiter auszuloten.