Meta Platforms heeft donderdag vroege versies vrijgegeven van zijn nieuwste grote taalmodel, Llama 3, en een afbeeldingsgenerator die afbeeldingen in realtime bijwerkt terwijl gebruikers aanwijzingen intypen, in een race om de achterstand op generatieve AI-marktleider OpenAI in te lopen.

De modellen zullen worden geïntegreerd in de virtuele assistent Meta AI, die het bedrijf aanprijst als de meest geavanceerde van zijn gratis te gebruiken gelijken. De assistent zal een prominentere plaats krijgen binnen Meta's Facebook, Instagram, WhatsApp en Messenger apps, evenals op een nieuwe, op zichzelf staande website die de assistent positioneert om directer te concurreren met OpenAI's doorbraakhit ChatGPT, dat door Microsoft wordt gesteund.

De aankondiging komt op een moment dat Meta druk bezig is geweest om generatieve AI-producten aan haar miljarden gebruikers aan te bieden om OpenAI's leidende positie in deze technologie uit te dagen, wat een revisie van de computerinfrastructuur en de consolidatie van voorheen afzonderlijke onderzoeks- en productteams met zich meebrengt.

De sociale mediagigant rustte Llama 3 uit met nieuwe computercoderingsmogelijkheden en voerde het deze keer zowel afbeeldingen als tekst toe, hoewel het model voorlopig alleen tekst zal uitvoeren, zei Meta Chief Product Officer Chris Cox in een interview.

Meer geavanceerde redeneringen, zoals de mogelijkheid om langere meerstappenplannen te maken, zullen in volgende versies volgen, voegde hij eraan toe. Versies die gepland staan voor de komende maanden zullen ook "multimodaal" zijn, wat betekent dat ze zowel tekst als afbeeldingen kunnen genereren, aldus Meta in blogberichten.

"Het uiteindelijke doel is om u dingen uit handen te nemen en uw leven gemakkelijker te maken, of het nu gaat om de interactie met bedrijven, het schrijven van iets of het plannen van een reis," zei Cox.

Cox zei dat het opnemen van afbeeldingen in de training van Llama 3 een verbetering zou zijn van een update die dit jaar wordt uitgerold voor de Ray-Ban Meta slimme bril, een samenwerking met brillenmaker Essilor Luxoticca, waardoor Meta AI objecten kan identificeren die door de drager worden gezien en er vragen over kan beantwoorden.

Meta kondigde ook een nieuwe samenwerking aan met Alphabet's Google om real-time zoekresultaten op te nemen in de antwoorden van de assistent, als aanvulling op een bestaande overeenkomst met Microsoft's Bing.

De Meta AI-assistent breidt met de update uit naar meer dan een dozijn markten buiten de VS, waaronder Australië, Canada, Singapore, Nigeria en Pakistan. Meta "werkt nog aan de juiste manier om dit in Europa te doen," zei Cox, waar de privacyregels strenger zijn en de aankomende AI-wet eisen zal stellen zoals de openbaarmaking van de trainingsgegevens van modellen.

De vraatzuchtige behoefte aan gegevens van generatieve AI-modellen is een grote bron van spanning gebleken in de ontwikkeling van de technologie.

Meta heeft modellen zoals Llama 3 vrijgegeven voor gratis commercieel gebruik door ontwikkelaars als onderdeel van haar inhaalslag, omdat het succes van een krachtige gratis optie de plannen van rivalen om inkomsten te verdienen aan hun propriëtaire technologie zou kunnen dwarsbomen. De strategie heeft ook veiligheidszorgen opgeroepen bij critici die bang zijn voor wat gewetenloze ontwikkelaars met het model zouden kunnen bouwen.

Mark Zuckerberg, CEO van Meta, knikte naar die concurrentie in een video bij de aankondiging, waarin hij Meta AI "de meest intelligente AI-assistent die u vrij kunt gebruiken" noemde.

Zuckerberg zei dat de grootste versie van Llama 3 op dit moment getraind wordt met 400 miljard parameters en al 85 MMLU scoort, waarbij hij metrics aanhaalde die gebruikt worden om de kracht en prestatiekwaliteit van AI-modellen weer te geven. De twee kleinere versies die nu worden uitgerold hebben 8 miljard parameters en 70 miljard parameters, en de laatste scoorde ongeveer 82 MMLU, of Massive Multitask Language Understanding, zei hij.

Ontwikkelaars hebben geklaagd dat de vorige Llama 2-versie van het model de basiscontext niet begreep en zoekopdrachten over hoe een computerprogramma te "doden" verwarde met verzoeken om instructies voor het plegen van een moord. Concurrent Google is tegen soortgelijke problemen aangelopen en heeft onlangs het gebruik van zijn Gemini AI-tool voor het genereren van afbeeldingen stopgezet nadat het kritiek had gekregen omdat het onnauwkeurige afbeeldingen van historische figuren had gemaakt.

Meta zei dat het deze problemen in Llama 3 heeft verminderd door "gegevens van hoge kwaliteit" te gebruiken om het model nuance te laten herkennen. Het bedrijf ging niet dieper in op de gebruikte datasets, maar zei dat het zeven keer meer gegevens in Llama 3 had ingevoerd dan het voor Llama 2 had gebruikt en "synthetische" of door AI gecreëerde gegevens had gebruikt om gebieden als codering en redenering te versterken.

Cox zei dat er "geen grote verandering in houding" was wat betreft de manier waarop het bedrijf zijn trainingsgegevens betrok. (Verslag door Katie Paul, Bewerking door Nick Zieminski)