OkSeven verkopers van inhoudlicenties voor muziek-, beeld-, video- en andere datasets voor gebruik bij het trainen van kunstmatige intelligentiesystemen hebben de eerste handelsgroep van de sector opgericht, zo lieten ze woensdag weten.

De Dataset Providers Alliance (DPA) zal pleiten voor "ethisch verantwoord datasourcen" bij het trainen van AI-systemen, inclusief rechten voor mensen die in datasets worden afgebeeld en de bescherming van intellectuele eigendomsrechten van contenteigenaren, aldus de bedrijven in een verklaring.

Oprichtende leden zijn onder andere het Amerikaanse muziekdatasetbedrijf Rightsify, afbeeldingslicentieservice vAIsual, de Japanse stockfotoprovider Pixta en de in Duitsland gevestigde datamarktplaats Datarade.

De opkomst van generatieve AI-technologieën die menselijke creativiteit kunnen nabootsen heeft de afgelopen jaren geleid tot verontwaardiging bij makers van inhoud en een reeks rechtszaken over auteursrecht tegen techbedrijven als Google, Meta en ChatGPT-maker OpenAI, dat wordt gesteund door Microsoft.

Ontwikkelaars hebben modellen getraind door ze te voeden met enorme hoeveelheden inhoud, waarvan een groot deel gratis van het internet is gehaald zonder toestemming van degenen die de werken hebben gemaakt of de rechten erop bezitten.

Technologiebedrijven, die beweren dat het gebruik legaal is, betalen ook stilletjes voor toegang tot privéverzamelingen van inhoud, zowel om te voldoen aan de behoefte aan bepaalde soorten gegevens als om zich in te dekken tegen wettelijke en regelgevende risico's.

Het vooruitzicht dat de vraag naar gelicentieerde gegevens zal toenemen als de eigenaren van auteursrechten winnen in hun juridische strijd, heeft geleid tot de opkomst van een opkomende industrie van bedrijven die inhoud verpakken en de toegang ertoe verkopen voor gebruik door AI-systemen.

Als gevolg hiervan zijn er groepen opgericht om ethische normen op te stellen voor die handel, zoals Fairly Trained, een non-profit organisatie die dit jaar is opgericht om modellen te certificeren die geen auteursrechtelijk beschermd materiaal hebben gebruikt zonder licentie.

De DPA richt zich op de inhoud van deze transacties en eist bijvoorbeeld dat haar leden ermee instemmen geen tekstgegevens te verkopen die zijn verkregen door het web af te zoeken of audio met de stem van mensen zonder hun uitdrukkelijke toestemming.

Een belangrijk aandachtspunt zal zijn om aan te dringen op wetgeving zoals de NO FAKES Act, een Amerikaans wetsvoorstel dat vorig jaar werd geïntroduceerd om straffen in te stellen voor het genereren van ongeautoriseerde digitale replica's van stemmen of gelijkenissen van mensen, zei Alex Bestall, CEO van Rightsify en haar licentiedochter GCX, die de oprichting van de groep leidde.

"Belangenbehartiging zal er een groot deel van uitmaken, omdat iedereen zijn standpunt heeft ingenomen over AI en auteursrecht, maar veel van deze gevechten moeten nog worden opgelost en het zal nog wel even duren voordat dat gebeurt," zei Bestall.

De DPA zal ook aandringen op meer transparantievereisten voor trainingsgegevens, zoals die in de AI Act van de Europese Unie en een vergelijkbaar wetsvoorstel in de VS dat in april werd geïntroduceerd, de Generative AI Copyright Disclosure Act, voegde hij eraan toe.

De groep is van plan om in juli een witboek te publiceren met de standpunten, zei hij. (Verslaggeving door Katie Paul; Bewerking door Richard Chang)