zelfs de filosoof leibniz, die droomde van een automaat die geschillen zou kunnen beslechten in de rechtbank of in de wetenschap, had nooit kunnen vermoeden dat we ooit in natuurlijke taal vragen zouden kunnen stellen aan een rekenmachine en al helemaal niet dat die ons in volzinnen zou antwoorden. hoewel de interne werking van tekstgeneratoren haar blijft fascineren, heeft sylvia wenmackers stevige bedenkingen bij heel wat aspecten van generatieve artificiële intelligentie.
De vrije hand. Computergeneratie schrijft door
Jim ik zou willen weten
wat maakt het de moeite waard
dat je door blijft schrijven
Zo begint een gedicht van Hans Lodeizen, gepubliceerd in 1950. Zijn vertwijfelde vraag resoneert in onze tijd, ook bij academici. Waarom zouden we zelf nog essays schrijven als generatieve artificiële intelligentie het zoveel sneller kan?
Een essay is een probeersel, het resultaat van een moeizame poging een beter essay te schrijven. Elk essay is dus een overwinning op de verlokking om het niet eens te proberen. Die verlokking is wellicht zo oud als het schrift, maar ze evolueert mee met haar tijd en laat zich nu gelden via grote taalmodellen. In combinatie met een bepaald type neuraal netwerk vormen ze een generatieve, vooraf getrainde transformator (GPT), die op basis van een vraag of opdracht (de zogeheten prompt) moeiteloos tekst genereert. Wie een GPT inroept, krijgt dus een tekst die per definitie geen essay is.
Als onderzoeker ervaar ik schrijven als een integraal onderdeel van mijn denken, iets dat ik liever niet uitbesteed. Onderzoekend schrijven is vloeken, schrappen en opnieuw beginnen. Vooral de eerste glimp van een idee laat zich moeilijk in woorden vangen. Toch loont die worsteling. Eens je je gedachten in een extern medium gevat hebt, kun je ze daar herordenen en confronteren met eerdere gedachten. Zo ontstaan nieuwe combinaties, die je weer aan het denken zetten.
Academisch werk vereist bovendien dat we in dialoog gaan met ideeën uit bronnen, die we zorgvuldig selecteren en citeren. Studenten moeten nog leren om hun eigen gedachten te vormen en die van anderen adequaat weer te geven. Om die redenen schreef Iris van Rooij eind 2022 al een stuk ‘tegen geautomatiseerd plagiaat’, waarin ze elk gebruik van grote taalmodellen bij het schrijven van academische essays afwijst.
Mensen fantaseren al eeuwen over automaten die kunnen rekenen of zelfs redeneren
Iris van Rooij is professor in de computationele cognitiewetenschappen, een fascinerend vakgebied. Mensen fantaseren namelijk al eeuwen over automaten die kunnen rekenen of zelfs redeneren. Gottfried Leibniz bijvoorbeeld droomde van een logische methode die voor- en tegenargumenten zou kunnen afwegen. Hij werkte aan een universele, formele taal om de argumenten in uit te drukken. Ook liet hij een analoge rekenmachine bouwen, een frustrerend proces dat meer dan twintig jaar duurde. In 1694 was de machine klaar: ze kon de vier hoofdbewerkingen uitvoeren op twee getallen van twaalf of zestien cijfers – soms althans, want meestal liep het raderwerk vast. Het resultaat stond mijlenver af van de eigenlijke droom van Leibniz: een automaat die geschillen zou kunnen beslechten in de rechtbank of in de wetenschap.
Zelfs Leibniz kon niet vermoeden dat we onze vragen ooit in natuurlijke taal zouden stellen aan een rekenmachine, laat staan dat die ons in volzinnen zou antwoorden. Mijn eerste ervaringen met computergegenereerde teksten dateren van eind de jaren 1990. Rosemary West had een randomgenerator voor poëzie beschikbaar gemaakt als freeware. Op basis van zinsstructuren uit gedichten vulde haar algoritme grammaticaal passende frases in, lukraak getrokken uit een voorgeprogrammeerde lijst. Dat was leuk voor even, maar veel langer heb ik gespeeld met Thunder Thought van Thomas Easton. Thunder Thought werkte slechts halfautomatisch: je moest eigen woorden invoeren, die aansloten bij het thema waar je over wou brainstormen. Het programma trok dan willekeurige woorden uit die lijst om er zinnen mee te maken. De meeste resultaten betekenden niet veel, dus moest je zelf de toevalstreffers selecteren. In een interview voor Scientific American sprak Easton van een symbiotische relatie tussen mens en computer. Volgens hem kon de computer ons creatieve ‘popcornbrein’ wel gedeeltelijk vervangen door willekeurige combinaties voor te stellen, maar moesten mensen hun eigen kritische brein laten oordelen over wat ze bruikbaar vonden.
Inmiddels kunnen GPT-4 en andere generatieve-AI-toepassingen meer, veel meer. Desgevraagd bekritiseren ze zelfs hun eerdere output, al is er nog steeds geen garantie dat het antwoord steekhoudt. Deze taalmodellen werken niet met voorgeprogrammeerde lijsten, maar op basis van hoogdimensionale vectorvoorstellingen van brokjes natuurlijke taal. Door bakken talige uitdrukkingen door een lerend algoritme te laten sijpelen is er een nieuw type artefact uitgekristalliseerd. Elke interactie ermee is als een lichtstraal die een complex pad aflegt in het inwendige van het kristal. Het pad is telkens anders en het resultaat dus ook.
De rijkste mensen op aarde investeren zwaar in GenAI, en dat niet louter uit liefhebberij
Hoewel de interne werking van tekstgeneratoren me nog altijd fascineert, is de lust om ze te gebruiken me wel vergaan. ChatGPT bijvoorbeeld is (vooralsnog) gratis, maar in tegenstelling tot Thunder Thought bepaald geen freeware. Het bedrijf erachter, OpenAI, werd mede opgericht door Elon Musk. Het zijn dus de rijkste mensen op aarde die zwaar investeren in generatieve AI. Dat doen ze niet louter uit liefhebberij, maar omdat ze geloven dat de technologie vele sectoren voor altijd zal veranderen – ook creatieve sectoren die tot nu toe veilig leken voor automatisatie. Op zoek naar het citaat van Lodeizen lees ik dat de ‘Jim’ uit zijn gedicht James Merrill was, zoon van een multimiljonair. Dat maakt het des te frappanter dat hij door bleef schrijven!
Mijn ervaring met de huidige tekstgeneratoren beperkt zich tot een korte reeks experimenten met GPT-3 in 2022. Gelukkig koos ik een onderwerp dat ver van mijn onderzoek afstaat, want al na enkele sessies merkte ik dat de output evenveel impact had op mijn denken als een intens gesprek. Als je met andere mensen praat, beïnvloeden zij je ideeën ook, maar je kunt doorvragen waarom ze iets denken. Bovendien leer je uit ervaring wiens uitspraken over welke onderwerpen je best met een korrel zout neemt. gpt-output klinkt echter altijd even stellig, terwijl het onmogelijk is om te traceren waar die inhoud precies ontstaan is: in welke bronnen, of tijdens het transformatieproces. Als je de bronnen niet kent, kun je ze niet vermelden en ook niet met voldoende kritische afstand analyseren.
Bovendien is er zeker werk gebruikt van levende schrijvers en onderzoekers die daar expliciet bezwaar tegen hebben gemaakt. Zelfs experten over wettelijke aspecten van AI, zoals Nathalie Smuha, wijzen erop dat het nog geen uitgemaakte zaak is of dit massale gebruik van teksten waar copyright op rust wel legaal is. Je kunt je geweten proberen te sussen door bijvoorbeeld te vragen een antwoord te geven in de stijl van Leibniz of Lodeizen: schrijvers wier werk tot het publieke domein behoort. Toch blijft een stevige dosis hypocrisie aangewezen, omdat het model een geheel vormt, waarvan elk onderdeel mede gevormd is door alle teksten waarop het is getraind.
Voor gebruikers van generatieve AI blijft een stevige dosis hypocrisie aangewezen
De trainingsdata komen van het internet en bevatten dus racistische, seksistische en gewelddadige teksten, die ook in de uitvoer van generatieve AI tot uiting kunnen komen. Begin 2023 rapporteerde Time hoe OpenAI deze toxische praat uit ChatGPT gefilterd heeft: via een onderaannemer liet het bedrijf Keniaanse arbeiders GPT-output labelen. Zij lazen de ranzige zooi voor minder dan 2 dollar per uur. Wat de kost is in termen van grondstoffen en energie blijft intussen koffiedik kijken, maar ik vrees dat duurzaamheid geen prioriteit is voor miljardairs die hun AI-bedrijven aansturen vanuit privéjets.
Mijn GPT-sessies gaven me ook een onbehaaglijk gevoel omdat ik toen niet wist of OpenAI de invoer van gebruikers logt en gebruikt. Computerwetenschapper Michael Wooldridge raadt ons in elk geval aan daar wel van uit te gaan. Bovendien kan het bedrijf zowel het taalmodel zelf als de toegangsvoorwaarden op elk moment aanpassen, zodat je als gebruiker voor vervelende verrassingen kunt komen te staan.
Al doende ervaar je hoe het resultaat varieert naargelang van de prompt. Zo leer je het creatieve proces sturen, maar gaandeweg passen ook je verwachtingen zich aan. Dat brengt me bij een laatste zorg: wat gebeurt er als we ons schrijven collectief laten inperken tot mogelijke GPT-output?
Alles went, zelfs de kloof tussen wat je wou zeggen en wat het systeem opdist. Andrew Perfors noemt AI daarom het junkfood van de betekenisgeving. Zijn essay ‘The work of creation in the age of AI’ erkent dat een lezer weliswaar betekenis kan projecteren op een automatisch geproduceerde tekst, maar zonder auteur vervalt de mogelijkheid tot echte communicatie. Diepe betekenis ontstaat volgens Perfors pas als de intentie om iets uit te drukken samengaat met de wil die creatie goed te begrijpen. Generatieve technologie vergroot echter de afstand tussen zender en ontvanger dermate dat de taal haar oerfunctie als betekenisdrager nog nauwelijks kan vervullen.
Mijn AI-experimenten genereerden in mij een dwingend verlangen om naar wolken te kijken. Ik sloot mijn computer af en ging wandelen. Gelukkig waren er wolken, telkens andere, in veranderend avondlicht. Dat luchtte op en maakte ruimte voor positievere gedachten.
Mijn AI-experimenten genereerden in mij een dwingend verlangen om naar wolken te kijken
Generatieve AI staat niet per definitie haaks op academisch gebruik: er bestaan al toepassingen die gericht zijn op het traceren van bronnen. Non-profitorganisaties maken modellen op basis van bewust gecureerde en goed gedocumenteerde trainingsdata. Nooit eerder was er zoveel aandacht voor algoritmische bias en de kwalijke gevolgen ervan. Van bekende toepassingen van grote bedrijven, zoals ChatGPT van Open AI, worden er alternatieve modellen ontwikkeld die je zelf lokaal kunt installeren. Hiermee heb je steeds toegang tot een stabiele versie, zonder dat de informatie die je invoert gebruikt kan worden om het volgende model mee te voeden.
Ook betwist ik niet dat je met behulp van AI werkelijk originele dingen kunt creëren. De huidige toepassingen vervangen ons ‘popcornbrein’ nog beter dan Thunder Thought ooit deed. Wiskundige Terence Tao combineert zijn expertise bijvoorbeeld met ChatGPT om vermoedens te formuleren of om sneller de syntaxis van een computerbewijstaal te leren. Maar hoe moeten jongeren die expertise verwerven? Een veelgehoord advies is om studenten de gegenereerde resultaten kritisch te laten evalueren, maar daarmee zetten we de classificatie van leerdoelen (volgens de taxonomie van Bloom) op zijn kop: kritische evaluatie staat helemaal bovenaan en vereist een grondige beheersing van basisvaardigheden.
Er is dus ruimte voor optimisme, maar dan moet er wel een kentering komen in de keuzes die we maken. Tonen we studenten enkel hoe ze hun prompts kunnen optimaliseren, in de hoop dat ze er alsnog iets van leren? Of sporen we hen aan om zich andere vragen te stellen, zoals: wie wordt er beter van als je deze toepassingen gebruikt? En: heb je wel AI nodig voor de taak? Uiteindelijk komt het neer op de vraag van Lodeizen.
Jim wat maakt het de moeite waard
dat je door blijft schrijven
brieven, opstellen en gedichten… etc.
In onze tijd lijken zijn slotregels geen einde maar een prompt. De cursor knippert. Weldra vult het scherm zich met nieuwe strofes. Ik kijk weg, naar de wolken die voorbijglijden. De wereld en hoe wij haar ervaren is met geen pen te beschrijven! Ik hoop dat we het toch blijven proberen.
Sylvia Wenmackers is onderzoeksprofessor aan het Centrum voor Logica en Filosofie van de Wetenschappen aan KU Leuven. Ze is gespecialiseerd in grondslagen van de kansrekening en schrijft naast essays ook artikels, korte verhalen en een maandelijkse column voor Eos magazine.
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License