Een nieuwe reeks wetten die het gebruik van kunstmatige intelligentie (AI) in de Europese Unie regelt, dwingt bedrijven om transparanter te zijn over de gegevens die gebruikt worden om hun systemen te trainen, waardoor een van de strengst bewaakte geheimen van de sector aan het licht komt.

In de 18 maanden sinds de door Microsoft gesteunde OpenAI ChatGPT aan het publiek onthulde, is er een golf van publieke betrokkenheid en investeringen geweest in generatieve AI, een reeks toepassingen die gebruikt kan worden om snel tekst, afbeeldingen en audio-inhoud te produceren.

Maar terwijl de industrie floreert, zijn er vragen gerezen over hoe AI-bedrijven aan de gegevens komen die gebruikt worden om hun modellen te trainen en of het voeden van bestsellers en Hollywood-films zonder toestemming van de makers een schending van het auteursrecht is.

De AI-wet die de EU onlangs heeft aangenomen, wordt de komende twee jaar gefaseerd ingevoerd, zodat toezichthouders de tijd hebben om de nieuwe wetten te implementeren terwijl bedrijven worstelen met een nieuwe reeks verplichtingen. Maar hoe sommige van deze regels in de praktijk zullen werken, is nog onbekend.

Een van de meer omstreden secties van de wet stelt dat organisaties die AI-modellen voor algemene doeleinden inzetten, zoals ChatGPT, "gedetailleerde samenvattingen" moeten geven van de inhoud die gebruikt is om ze te trainen. Het onlangs opgerichte AI Office zei dat het van plan is om begin 2025 een sjabloon uit te brengen dat organisaties kunnen volgen, na overleg met belanghebbenden.

Hoewel de details nog moeten worden uitgewerkt, verzetten AI-bedrijven zich ertegen om te onthullen waarop hun modellen zijn getraind. Ze beschrijven de informatie als een handelsgeheim dat concurrenten een oneerlijk voordeel zou geven als het openbaar zou worden gemaakt.

"Het zou een droom zijn die uitkomt als ik de datasets van mijn concurrenten zou zien, en evenzo als zij de onze zouden zien," aldus Matthieu Riouf, CEO van het AI-bewerkingsbedrijf Photoroom.

"Het is net als koken," voegde hij eraan toe. "Er is een geheim deel van het recept dat de beste chef-koks niet willen delen, het je ne sais quoi dat het anders maakt."

Hoe gedetailleerd deze transparantierapporten uiteindelijk zullen zijn, zal grote gevolgen hebben voor kleinere AI-startups en grote techbedrijven zoals Google en Meta, die de technologie in het middelpunt van hun toekomstige activiteiten hebben geplaatst.

BEDRIJFSGEHEIMEN DELEN

In het afgelopen jaar zijn een aantal prominente techbedrijven, waaronder Google, OpenAI en Stability AI, geconfronteerd met rechtszaken van makers die beweerden dat hun inhoud onjuist was gebruikt om hun modellen te trainen.

Hoewel de Amerikaanse president Joe Biden een aantal uitvoeringsbevelen heeft uitgevaardigd die gericht zijn op de veiligheidsrisico's van AI, zijn vragen over auteursrechten nog niet volledig getest. Oproepen aan techbedrijven om rechthebbenden te betalen voor gegevens hebben tweepartijdige steun gekregen in het Congres.

Te midden van de toenemende controle hebben techbedrijven een stortvloed aan content-licentieovereenkomsten gesloten met media en websites. OpenAI tekende onder andere deals met de Financial Times en The Atlantic, terwijl Google deals sloot met de sociale mediasite Reddit van NewsCorp.

Ondanks deze stappen kreeg OpenAI in maart kritiek toen CTO Mira Murati weigerde te antwoorden op een vraag van de Wall Street Journal of YouTube-video's waren gebruikt om zijn videogeneratietool Sora te trainen, wat volgens het bedrijf een schending van zijn algemene voorwaarden zou zijn.

Vorige maand kreeg OpenAI nog meer kritiek te verwerken toen het een AI-stem gebruikte die door actrice Scarlett Johansson als "griezelig gelijkend" op haar eigen stem werd beschreven in een openbare demonstratie van de nieuwste versie van ChatGPT.

Thomas Wolf, medeoprichter van de toonaangevende AI-startup Hugging Face, zei dat hij voorstander was van meer transparantie, maar dat dit gevoel niet door de hele industrie gedeeld werd. "Het is moeilijk om te weten hoe het zal uitpakken. Er moet nog veel besloten worden," zei hij.

Hooggeplaatste wetgevers over het hele continent blijven verdeeld.

Dragos Tudorache, een van de wetgevers die toezicht hield op het opstellen van de AI-wet in het Europees Parlement, zei dat AI-bedrijven verplicht moeten worden om hun datasets openbaar te maken.

"Ze moeten gedetailleerd genoeg zijn zodat Scarlett Johansson, Beyonce of wie dan ook kan weten of hun werk, hun liedjes, hun stem, hun kunst of hun wetenschap gebruikt is bij het trainen van het algoritme," zei hij.

Een ambtenaar van de Commissie zei: "De AI-wet erkent de noodzaak om te zorgen voor een passend evenwicht tussen enerzijds de legitieme noodzaak om bedrijfsgeheimen te beschermen en anderzijds de noodzaak om het voor partijen met legitieme belangen, waaronder houders van auteursrechten, gemakkelijker te maken om hun rechten onder het recht van de Unie uit te oefenen."

Onder president Emmanuel Macron heeft de Franse regering zich privé verzet tegen de invoering van regels die het concurrentievermogen van Europese AI-startups zouden kunnen belemmeren.

Tijdens een toespraak op de Viva Technology-conferentie in Parijs in mei zei de Franse minister van Financiën Bruno Le Maire dat hij wilde dat Europa een wereldleider op het gebied van AI zou worden, en niet alleen een consument van Amerikaanse en Chinese producten.

"Voor één keer moet Europa, dat controles en normen heeft gecreëerd, begrijpen dat je moet innoveren voordat je gaat reguleren," zei hij. "Anders loop je het risico dat je technologieën reguleert die je niet beheerst, of dat je ze slecht reguleert omdat je ze niet beheerst." (Verslaggeving door Martin Coulter, aanvullend verslag door Leigh Thomas; Bewerking door Matt Scuffham en Elaine Hardcastle)