Diese Technologie, die oft als K.I. Agent bezeichnet wird, geht über die bisherigen Fähigkeiten traditioneller Chatbots hinaus. Während Chatbots Fragen beantworten oder Texte generieren können, interagieren A.I. Agents wie Operator direkt mit anderen Softwareanwendungen im Internet.
In einer Demonstration zeigte OpenAI, wie Operator eine Restaurantreservierung in San Francisco über die Website OpenTable vornahm und Einkäufe über Instacart tätigte. Die Benutzer geben ihre Wünsche in ein Chatfenster ein, und das System versucht, sie zu erfüllen. Dazu öffnet es einen Webbrowser und navigiert zu den entsprechenden WebsOpenAI hat ein neues Tool namens „Operator“ vorgestellt, das in der Lage ist, selbständig Online-Aufgaben wie z.B. die Reservierung von Restaurants oder den Einkauf von Lebensmitteln zu übernehmen. Vorerst allerdings nur in den USA für Nutzer des Pro-Abonnements von ChatGPT. Operator ist unter https://operator.chatgpt.com/ verfügbar.ites, um die Aufgaben auszuführen. Dabei kann es zu Fehlern kommen, die das System jedoch in einigen Fällen selbst korrigiert. In anderen Situationen ist jedoch ein Eingreifen des Benutzers erforderlich, um die Anweisungen zu präzisieren oder Anpassungen vorzunehmen.
Operator agiert jedoch nicht vollständig autonom und ist auf Benutzereingaben angewiesen, um Fehler zu korrigieren und Aufgaben zu verfeinern. Bei Diensten wie OpenTable oder Instacart müssen die Nutzer ihre Zugangsdaten angeben. OpenAI betont jedoch, dass keine privaten Informationen, die mit dem Tool geteilt werden, gespeichert werden.
Diese Entwicklung stellt einen bedeutenden Fortschritt bei der Integration von KI in alltägliche Online-Aktivitäten dar und schließt die Lücke zwischen passiven Chatbots und aktiven, aufgabenorientierten Agenten.
Das Tool funktioniert über einen Remote-Browser, der im Operator-Fenster angezeigt wird, und Aufgaben so erledigt, wie es ein Mensch tun würde. Da Operator mit einem entfernten Browser verbunden ist, kann der Benutzer andere Eingabeaufforderungen machen oder andere Computeraufgaben erledigen, während Operator arbeitet. Operator kann Aufgaben in verschiedenen Kategorien erledigen, die auf der Homepage aufgelistet sind, darunter Reisen und Essen und Veranstaltungen.
Auf der Homepage von Operator ist ein Video mit einer Reisedemo zu sehen, das im Mittelpunkt steht. Zunächst zeigt das Video, dass ein Klick auf die Kategorie „Reisen“ mehrere vorausgefüllte Eingabeaufforderungen anzeigt, die jeweils zusammen mit einem Reiseunternehmen angezeigt werden, auf das der Chatbot zugreift, um die Aufgabe zu erledigen. Zum Beispiel wird das Priceline-Logo mit der Aufforderung „Finde ein Drei-Sterne-Hotel in der Nähe von Grand Central in New York für weniger als 400 Dollar pro Nacht“ verknüpft.