De tool, Operator genaamd, wordt aangedreven door een model dat interactie mogelijk maakt met knoppen, menu's en tekstvelden op het scherm.
"Deze mogelijkheid markeert de volgende stap in de ontwikkeling van AI, waardoor modellen dezelfde tools kunnen gebruiken waar mensen dagelijks op vertrouwen en waardoor de deur wordt geopend naar een groot aantal nieuwe toepassingen," aldus het bedrijf in een blogbericht.
Operator kan verschillende taken uitvoeren, zoals het maken van to-do lijsten of het helpen met vakantieplannen. Het neemt ook gebruikersinvoer zodra het besluit dat een taak voltooid is en vraagt om bevestiging voor sommige taken, zoals het invoeren van inloggegevens op een website.
De tool is momenteel beschikbaar voor Pro-gebruikers in de VS als onderzoeksvoorvertoning, aldus de door Microsoft gesteunde startup.
Agenten, dit zijn systemen die acties kunnen uitvoeren zoals het doen van aankopen en het plannen van vergaderingen zonder directe menselijke tussenkomst, staan nu vooraan op de AI-agenda van bedrijven.
OpenAI-concurrent Perplexity lanceerde eerder op donderdag een agentgebaseerde assistent voor Android-apparaten. Deze assistent kan onder andere dinerreserveringen boeken, app-ritten regelen en herinneringen instellen.
Vorig jaar verwerkte Apple Apple Intelligence in zijn spraakassistent Siri en - in een samenwerkingsverband met OpenAI - introduceerde de iPhone-maker ook het gebruik van ChatGPT, met toestemming van de gebruiker.
Hoewel dergelijke agents lange tijd moeilijk te vinden waren voor onderzoekers, zou de opkomst van stapsgewijze redeneermethoden zoals die gebruikt worden in het o1-model van OpenAI dergelijke taken mogelijk kunnen maken, vertelden bedrijfsleiders in december aan Reuters.