Cultuur & Media
EO

Illegaal gekopieerde boeken van tientallen Nederlandse en Vlaamse schrijvers gebruikt voor trainen AI

foto: ANP
  1. Nieuwschevron right
  2. Illegaal gekopieerde boeken van tientallen Nederlandse en Vlaamse schrijvers gebruikt voor trainen AI

Meta (het moederbedrijf van Facebook) en Bloomberg hebben voor het trainen van hun kunstmatige intelligentie-tools gebruikgemaakt van een database met illegaal gekopieerde boeken. Daar zitten ook boeken van ten minste 40 Nederlandse en Vlaamse auteurs tussen, blijkt uit onderzoek van Dit is de Dag, waaronder Ilja Leonard Pfeijffer (foto), Geert Mak en Annie M.G. Schmidt.

Schrijver Niña Weijers noemt het 'ontluisterend' dat haar boek De Consequenties gebruikt wordt om kunstmatige intelligentie mee te voeden. "Ik kan me niet voorstellen dat dit geen schending van auteursrechten is." Ook Jeroen Smit en Martin Bossenbroek reageren geschrokken. "Als mijn werk verder wordt uitgebaat, wil ik eerst toestemming kunnen geven", zegt Smit. Schrijvers maken zich hier onder meer druk om omdat de vrees is dat AI doordat het met hun boeken gevoed wordt, net zo goed kan gaan schrijven als zijzelf.

Een lijst van alle schrijvers die Dit is de Dag in de database aantrof is onderaan dit artikel te vinden. Van sommige boeken is de originele Nederlandse versie in de database aangetroffen, bij andere boeken betreft het een vertaling.

De database waar het om gaat wordt de 'Books3-database' genoemd en bevat meer dan 191.000 boeken. Een journalist van het Amerikaanse tijdschrift The Atlantic wist de auteursnamen van 183.000 van de boeken vast te stellen. Bij ongeveer een derde van de boeken gaat het om fictie, bij de rest om non-fictie.

Grote hoeveelheden tekst

Kunstmatige intelligentie-taalmodellen, zoals ChatGPT, hebben grote hoeveelheden teksten nodig om zo realistisch mogelijke antwoorden te genereren op verzoeken van gebruikers. De maker van de Books3-database, Shawn Presser, heeft hem online gezet omdat boeken teksten van hoge kwaliteit zijn die de antwoorden van AI-modellen sterk kunnen verbeteren.

Al eerder stapten verschillende auteurs in de Verenigde Staten naar de rechter omdat ze vermoedden dat hun boeken als trainingsdata worden gebruikt. Dat vermoeden werd bevestigd toen het Amerikaanse tijdschrift The Atlantic deze database in handen kreeg en daar een serie artikelen over schreef. Deze week is de database doorzoekbaar gemaakt, waardoor Dit is de Dag erachterkwam dat er ook boeken van Nederlandse schrijvers instaan.

ChatGPT

Van ChatGPT, het bekendste kunstmatige intelligentie-taalmodel, is niet bekend welke bronnen gebruikt zijn voor het trainen ervan en dus ook niet of deze database daarbij hoort. De Auteursbond is wel bezig met het opstellen van een handleiding waarin vragen staan die schrijvers kunnen stellen aan modellen als ChatGPT om erachter te komen of hun boeken ervoor gebruikt zijn, zegt voorzitter Miro Lucassen.

Bloomberg heeft aangegeven geen gebruik meer te maken van de Books3-database bij het ontwikkelen van toekomstige versies van zijn AI-taalmodel. Volgens Erna Sattler, copyright-expert van de Universiteit Leiden, betekent dat niet dat de teksten daarmee uit het model verdwijnen. "Als het systeem dat eenmaal geleerd heeft, kan het dat niet meer 'onleren', je kunt het dus niet uitwissen. Dat kan alleen door helemaal opnieuw beginnen met het systeem."

Dit is een artikel uit Dit is de Dag (EO), dagelijks van 18.30 tot 19.00 op NPO Radio 1. Abonneer je in je favoriete podcastapp om niks te missen. Op het interactieve platform DIT kun je meepraten over het nieuws.

Nederlandse en Vlaamse schrijvers wiens boeken gebruikt zijn om de AI van oa Bloomberg en Meta mee te trainen:

Lize Spit

· Het smelt

Niña Weijers

· The Consequences

Geert Mak

· Amsterdam: A brief life of the city

· In Europe: Travels Through the Twentieth Century

· The Bridge

Harry Mulisch

· El juich el eichmann

· The Assault

Herman Koch

· De Greppel

· Dear Mr. M: A Novel

· The Ditch: A Novel

Gerard Reve

· The Evenings

Jan Terlouw

· Invierno en tiempo de guerra (Juvenil) (Spanish Edition)

Hendrik Groen

· On The Bright Side

· The Secret Diary Of Hendrik Groen, 831⁄4 Years Old

Jan Wolkers

· Turkish Delight

Janwillem van de wetering

· Outsider in Amsterdam (Amsterdam Cops Book 1)

· The Corpse on the Dike

· The Streetbird (Amsterdam Cops)

· Tumbleweed (Amsterdam Cops)

Martijn van Calmthout

· Sam Goudsmit and the Hunt for Hitler's Atom Bomb

John van den Heuvel

· Kogels voor de kroongetuige

· Tijdperk Willem Holleeder (Dutch Edition)

Simone van der Vlugt

· Azul de medianoche (NEFELIBATA) (Spanish Edition)

· Midnight Blue: A Novel

David van Reybrouck

· Against Elections

· Congo: The Epic History of a People

· Contra las elecciones: Cómo salvar la democracia (Spanish Edition)

· Gegen Wahlen: Warum Abstimmen nicht demokratisch ist

Peter Buwalda

· Bonita Avenue: A Novel

Tim Krabbé

· The Rider

Arthur Japin

· Director's Cut

Erwin Mortier

· While the Gods Were Sleeping

Kader Abdolah

· My Father's Notebook

· The King: A Novel

Kees Boterbloem

· A History of Russia and Its Empire: From Mikhail Romanov to Vladimir Putin

Renate Dorrestein

· Herz Aus Stein

· Mein Sohn Hat Ein Sexleben Und Ich Lese Meiner Mutter Rotkäppchen Vor

· The Darkness That Divides Us

Jeroen Duindam

· Dynasty: A Very Short Introduction (Very Short Introductions)

Dimitri Verhulst

· The Misfortunates: A Novel

Cees Nooteboom

· All Souls' Day

· El Caballero Ha Muerto

· En Sång Om Sken Och Vara

· Roads To Berlin

Ilja Leonard Pfeijffer

· La Superba

Gerard Reve

· The Evenings

Annie M.G. Schmidt

· The Cat Who Came In Off The Roof

Griet op de Beeck

· Gij Nu

· Let Op Mijn Woorden

Martin Bossenbroek

· De Boerenoorlog

· The Boer War

Esther Gerritsen

· Craving

Erwin Mortier

· While the Gods Were Sleeping

Willem Frederik Hermans

· Beyond Sleep

· The Darkroom of Damocles: A Novel

Tonke Dragt

· The Letter for the King

· The Song of Seven

Rutger Bregman

· Utopia För Realister : Argumenten För Basinkomst, öppna G

· Utopia for Realists: How We Can Build the Ideal World

Jeroen Smit

· The Perfect Prey: The Fall of Abn Amro, Or What Went Wrong in the Banking Industry

Peter Verhelst

· The Man I Became

Kees van der Heijden

· Scenarios: The Art of Strategic Conversation

Saskia Wieringa, Horacio Sívori

· The Sexual History of the Global South

Gerbrand Bakker

· The Detour

Joris Luyendijk

· Swimming With Sharks

· Among The Bankers

Guido Eekhaut

· Absinthe: A Thriller

· Purgatory: A Thriller

Ster advertentie
Ster advertentie