Meta Platforms heeft donderdag vroege versies vrijgegeven van zijn nieuwste grote taalmodel, Llama 3, en een afbeeldingsgenerator die afbeeldingen in realtime bijwerkt terwijl gebruikers aanwijzingen intypen, in een race om de achterstand op generatieve AI-marktleider OpenAI in te lopen.

De modellen zullen worden geïntegreerd in de virtuele assistent Meta AI, die het bedrijf aanprijst als de meest geavanceerde van zijn gratis te gebruiken collega's, waarbij het prestatievergelijkingen aanhaalt voor onderwerpen als redeneren, coderen en creatief schrijven in vergelijking met het aanbod van rivalen zoals Alphabet's Google en de Franse startup Mistral AI.

De bijgewerkte Meta AI-assistent zal een prominentere plaats krijgen binnen de Facebook-, Instagram-, WhatsApp- en Messenger-apps van Meta, evenals op een nieuwe, op zichzelf staande website waarmee het directer kan concurreren met OpenAI, de grote hit van Microsoft, ChatGPT.

Een landingspagina die bezoekers op die site begroet, vraagt hen om te proberen de assistent een vakantielijst te laten maken, trivia over muziek uit 1990 met hen te laten spelen, huiswerkhulp te geven en foto's van de skyline van New York City te laten schilderen.

Meta heeft alles in het werk gesteld om generatieve AI-producten aan haar miljarden gebruikers aan te bieden om de leidende positie van OpenAI op het gebied van technologie uit te dagen, wat een dure revisie van de computerinfrastructuur en de consolidatie van voorheen afzonderlijke onderzoeks- en productteams met zich meebracht.

De sociale mediagigant heeft zijn Llama-modellen openlijk vrijgegeven voor gebruik door ontwikkelaars die AI-apps bouwen als onderdeel van zijn inhaalslag, omdat een krachtige gratis optie de plannen van rivalen om geld te verdienen aan hun propriëtaire technologie zou kunnen dwarsbomen. De strategie heeft geleid tot bezorgdheid over de veiligheid van critici die bang zijn voor wat gewetenloze acteurs met het model zouden kunnen bouwen.

Meta heeft Llama 3 uitgerust met nieuwe mogelijkheden voor computercodering en heeft het model deze keer zowel afbeeldingen als tekst gegeven tijdens de training, hoewel het model voorlopig alleen tekst zal uitvoeren, zei Chris Cox, Chief Product Officer van Meta, in een interview.

Meer geavanceerde redeneringen, zoals de mogelijkheid om langere meerstappenplannen te maken, zullen in volgende versies volgen, voegde hij eraan toe. Versies die gepland staan voor de komende maanden zullen ook "multimodaal" zijn, wat betekent dat ze zowel tekst als afbeeldingen kunnen genereren, aldus Meta in blogberichten.

"Het uiteindelijke doel is om u dingen uit handen te nemen en uw leven gemakkelijker te maken, of het nu gaat om de interactie met bedrijven, het schrijven van iets of het plannen van een reis," zei Cox.

Cox zei dat het opnemen van afbeeldingen in de training van Llama 3 een verbetering zou zijn voor een update die dit jaar wordt uitgerold voor de Ray-Ban Meta smart glasses, een product dat samen met brillenmaker Essilor Luxoticca is gemaakt, waardoor Meta AI objecten kan identificeren die door de drager worden gezien en er vragen over kan beantwoorden.

Meta-aandelen noteerden donderdag laat 1,8% hoger.

Meta kondigde ook een samenwerking aan met Google om de realtime zoekresultaten van Google op te nemen in de antwoorden van de assistent, als aanvulling op een bestaande overeenkomst met Microsofts zoekmachine Bing.

De Meta AI-assistent breidt met de update uit naar meer dan een dozijn markten buiten de VS, waaronder Australië, Canada, Singapore, Nigeria en Pakistan. Meta "werkt nog aan de juiste manier om dit in Europa te doen," zei Cox, waar de privacyregels strenger zijn en de aankomende AI-wet eisen zal stellen, zoals openbaarmaking van de trainingsgegevens van modellen.

De vraatzuchtige behoefte aan gegevens van generatieve AI-modellen is een grote bron van spanning gebleken in de ontwikkeling van de technologie.

Mark Zuckerberg, CEO van Meta, knikte naar de concurrentie met OpenAI in een video bij de aankondiging, waarin hij Meta AI "de meest intelligente AI-assistent die u vrij kunt gebruiken" noemde.

Zuckerberg zei dat de twee kleinere versies van Llama 3 die nu worden uitgerold, met 8 miljard parameters en 70 miljard parameters, gunstig scoren ten opzichte van andere gratis modellen op prestatiebenchmarks die vaak worden gebruikt om de kwaliteit van modellen te beoordelen. De grootste versie van Llama 3 wordt nog getraind, met 400 miljard parameters, zei hij.

Deze resultaten waren "ongetwijfeld indrukwekkend", maar ook indicatief voor een groeiende prestatiekloof tussen vrije en propriëtaire modellen, zei Nathan Benaich, oprichter van het op AI gerichte venturebedrijf Air Street Capital.

Ontwikkelaars hebben geklaagd dat de vorige Llama 2-versie van het model basiscontext niet begreep en zoekopdrachten over hoe een computerprogramma te "doden" verwarde met verzoeken om instructies voor het plegen van een moord. Concurrent Google is tegen soortgelijke problemen aangelopen en heeft onlangs het gebruik van zijn Gemini AI-hulpmiddel voor het genereren van afbeeldingen stopgezet nadat het kritiek had gekregen omdat het onnauwkeurige afbeeldingen van historische figuren had gemaakt.

Meta zei dat het deze problemen in Llama 3 heeft verminderd door "gegevens van hoge kwaliteit" te gebruiken om het model nuance te laten herkennen. Het bedrijf is niet nader ingegaan op de gebruikte datasets, hoewel het zei dat het zeven keer meer gegevens in Llama 3 had ingevoerd dan het gebruikte voor Llama 2. (Verslaggeving door Katie Paul in New York Aanvullende rapportage door Jeffrey Dastin in San Francisco Bewerking door Nick Zieminski en Matthew Lewis)