ChatGPT-maker OpenAI heeft dinsdag gezegd dat het de release van zijn "Voice Mode"-functie met een maand uitstelt tot juli vanwege technische problemen.

Het bedrijf was oorspronkelijk van plan om de realistische spraakgesprekservaring eind juni uit te rollen naar een kleine groep ChatGPT Plus-gebruikers, maar zei dat het dit uitstelde omdat het tijd nodig had om de lanceringsstandaard te halen.

"We zijn bijvoorbeeld bezig met het verbeteren van het vermogen van het model om bepaalde inhoud te detecteren en te weigeren. We werken ook aan het verbeteren van de gebruikerservaring en bereiden onze infrastructuur voor op het schalen naar miljoenen met behoud van realtime reacties," zei OpenAI in een bericht op social media platform X.

De functie zal in eerste instantie worden vrijgegeven aan een kleine groep gebruikers om feedback te verzamelen en zal in de herfst beschikbaar worden gemaakt voor alle Plus-gebruikers, afhankelijk van veiligheids- en betrouwbaarheidscontroles, aldus het bedrijf.

OpenAI werkt ook aan de uitrol van nieuwe video- en schermdelende mogelijkheden.

In mei zei het bedrijf dat het een nieuw AI-model zou uitbrengen, GPT-4o genaamd, dat in staat is realistische spraakgesprekken te voeren en in staat is tot interactie met tekst en beeld.

De nieuwe audiomogelijkheden stellen gebruikers in staat om tegen ChatGPT te praten en zonder vertraging realtime antwoorden te krijgen, maar ook om ChatGPT te onderbreken terwijl deze aan het praten is - beide kenmerken van realistische gesprekken die voor AI-spraakassistenten een uitdaging vormen. (Verslag door Juby Babu in Mexico City; Bewerking door Pooja Desai)