Het Nederlands kan alleen overleven met eigen AI-modellen
ChatGPT en andere modellen beheersen het Nederlands uitstekend, maar de digitale toekomst van onze taal én cultuur is daarmee niet verzekerd. Vlaanderen en Nederland moeten de handen in elkaar slaan voor duurzame en cultureel verankerde alternatieven.
Artificiële intelligentie: gangbaar afgekort als AI, en ook wel kunstmatige intelligentie of KI genoemd. Jarenlang een term die je weleens tegenkwam, maar die niet alomtegenwoordig was. Iets voor computerspecialisten. Totdat hij opeens wél overal was. Door een opeenvolging van in elkaar grijpende ontwikkelingen en snel opeenvolgende innovaties, zoals deep learning en verbeterde computerchips, konden makers van AI vanaf ongeveer 2012 enorme stappen voorwaarts zetten.
Sinds de jaren 2020 zijn AI-toepassingen ook voor iedere internetgebruiker beschikbaar. Opeens kun je met een druk op de knop nieuwe schilderijen maken in de stijl van Picasso, kun je hele verhalen of toespraken laten schrijven, spelen acteurs in scènes die ze nooit echt hadden opgenomen. Iedere leerling, content writer, vertaler, jurist, onderzoeker en beleidsmaker kan iets met AI, en moet er vooral ook iets mee.
De gevolgen van de vlucht die AI in de afgelopen jaren genomen heeft, zijn nog niet te overzien. Het staat wel vast dat ze ongelooflijk verregaand zullen zijn. Het is daarom goed te reflecteren op de gevolgen van AI voor de Nederlandse taal. Is onze taal hier klaar voor? Hoe zit het met de large language models (LLM’s) van het Nederlands? Wat doet de politiek?
Geïnspireerd op onze hersenen
Eerst even een stapje terug naar de termen. Zeker AI wordt zó veel gebruikt, dat het vrijwel onmogelijk is geworden er één dekkende uitleg op te plakken. In de meest basale betekenis is een artificiële intelligentie simpelweg een door mensen gemaakt computersysteem dat taken uitvoert die we normaal gesproken associëren met menselijke intelligentie. Denk aan redeneren, kunst maken, tekst produceren, of gegevens analyseren. Een deel van die dingen kunnen computers al veel langer, maar voor een deel zijn de breed toegankelijke toepassingen pas iets van de afgelopen vijf à tien jaar.
In de praktijk bedoelen mensen vaak iets veel specifiekers dan dit. Stel dat je iemand hoort zeggen “ik heb AI gebruikt om mijn sollicitatiebrief te schrijven”, of “AI is een grote bedreiging voor vertalers”. In beide gevallen bedoelen ze met de term AI een stuk software of een applicatie die op een ogenschijnlijk menselijke manier tekst, beeld of video produceert, verwerkt of aanpast. Het gaat hier om generatieve AI. Die is er voor allerlei zaken, maar in zijn algemeenheid is deze vorm van AI relevant voor de Nederlandse taal, cultuur en letteren. In de context van dit artikel richten we ons primair op taal. En heb je het over taal, dan heb je het onvermijdelijk over LLM’s, of Large Language Models.
Voor gevoelige onderwerpen, zoals politiek of man-vrouwverhoudingen, is het bepaald onwenselijk dat we hier anglocentrische AI-modellen gebruiken
Met LLM wordt meestal een specifiek soort computermodel bedoeld dat gebaseerd is op de manier waarop biologische neurale netwerken, zoals die in onze hersenen, zijn gestructureerd en functioneren. Het is een fascinerend – en ingewikkeld – verhaal op zich hoe ze precies werken. Een LLM heeft in ieder geval altijd deze onderdelen: een grote hoeveelheid data, een deel dat die data analyseert, een deel geleerde (taal)regels, en een deel dat output kan genereren. Vervolgens moet zo’n LLM getest, getraind en geëvalueerd worden, moet er een gebruikersinterface voor worden gemaakt, of moet het worden geïntegreerd in bestaande computerprogramma’s. Heb je dat gedaan, dan ben je bij meestal chatbots aangekomen. ChatGPT, Claude, Gemini en Copilot zijn op dit moment de bekendste.
Anglocentrisch
Dat is de theorie. Laten we nu eens kijken naar de praktijk van de bestaande LLM’s en de positie die het Nederlands daarin inneemt. Eerst het goede nieuws. Zoals AI-experts Tanguy Coenen van imec (Vlaanderen) en dr. Saskia Lensink van de Nederlandse Organisatie voor Toegepast-Natuurwetenschappelijk Onderzoek (TNO) in een recente presentatie voor de Taalunie lieten zien, kunnen de meeste LLM’s vrij goed Nederlands begrijpen en produceren. Fijn nieuws op zichzelf, en als je er iets langer over nadenkt heeft het nóg twee belangrijke positieve implicaties. Ten eerste laat dit zien dat de commerciële partijen die deze LLM’s maken genoeg Nederlandstalige data tot hun beschikking hebben om hun chatbots succesvol te laten communiceren. Dat betekent dat de positie van het digitale Nederlands op dit moment goed is. Dat is zeker geen triviaal gegeven, want er zijn genoeg talen waarvoor dit minder vanzelfsprekend is. Ten tweede demonstreert dit op een fundamenteler niveau dat deze partijen het belangrijk genoeg vinden om hun programma’s Nederlands te leren. Met andere woorden: het Nederlands heeft als taal genoeg status om te worden meegenomen in de vaart der online talen.
GPT-NL, het Nederlandse generatieve taalmodel, draait onder meer op servers van SURF, de ICT-coöperatie van Nederlandse onderwijs- en onderzoeksinstellingen© SURF
Er is ook minder goed nieuws. Zo is het alom bekend dat eigenlijk alle commerciële taalmodellen, waaronder ChatGPT, gebaseerd zijn op zeer grootschalige copyrightschendingen. Daar kwamen rechtszaken van, aangespannen door onder andere The New York Times. Maar tot veel oplossingen heeft het nog niet geleid. Dit is een probleem dat voor alle talen geldt. Specifiek voor het Nederlands (eigenlijk voor alle talen die niet Engels zijn) is dat de bestaande LLM’s niet goed kunnen omgaan met de Nederlandse en Vlaamse cultuur. Dat heeft te maken met de data waar de LLM’s op gebaseerd zijn. Hoewel daarvan een deel Nederlandstalig is, is het grootste deel anderstalig, met name Engels. Hoe je hiermee toch min of meer kloppende Nederlandse output kunt maken is óók een verhaal op zich. Belangrijker is dat de herkomst van data altijd bepaalde biases of voorkeuren introduceert. In dit geval neigt die naar een anglocentrisch wereldbeeld, en dat kan op bepaalde punten anders zijn dan het Nederlandse of Vlaamse. Voor gevoelige onderwerpen, zoals politiek of man-vrouwverhoudingen, is dat bepaald onwenselijk.
Mede om de problemen van bias en recht aan te pakken initieerde de Nederlandse overheid in 2023 de bouw van een eigen LLM: GPT-NL. Het doel was een ethisch verantwoord en cultureel verankerd alternatief te bieden voor bestaande taalmodellen, die veelal zijn gemaakt door commerciële, Amerikaanse partijen. GPT-NL wordt ontwikkeld door drie onafhankelijke organisaties: naast TNO ook de ICT-coöperatie van Nederlandse onderwijs- en onderzoeksinstellingen (SURF) en het Nederlands Forensisch Instituut. Zij proberen transparant, juridisch zuiver, energie-efficiënt en met respect voor privacy te opereren. Dat zij daarin goed zijn geslaagd, blijkt uit het feit dat de vakjury van de Nederlandse AI-Award, die het model in maart 2026 bekroonde, precies op deze punten lovend was. Op het moment van schrijven wordt GPT-NL voorzichtig getest met een aantal geselecteerde gebruikers.
AI-fabriek
Tot zover het heden. Wat brengt de toekomst? De aandacht voor AI is onvergelijkbaar groot. Geen sector of hij heeft een AI-plan, geen instelling of ze heeft wel een AI-adviesgroep. Ook de sector zelf lobbyt steeds voor meer geld en aandacht, bijvoorbeeld in november 2025 in het Nationaal AI Deltaplan, dat in Nederland verscheen.
De bestaande AI-modellen kunnen niet goed omgaan met de Nederlandse en Vlaamse cultuur, omdat ze voor een groot deel op Engelstalige data gebaseerd zijn
In de politiek leeft het onderwerp ook, zeker in het kader van digitale autonomie. Er zijn in de politiek veel zorgen over de al te grote afhankelijkheid van met name Amerikaanse leveranciers van digitale diensten, zoals het Nederlands overheidsinlogsysteem DigiD. In Vlaanderen werd begin 2024 daarom al het AI Expertisecentrum in het leven geroepen, als onderdeel van het Agentschap Digitaal Vlaanderen. In maart van dat jaar presenteerde de Vlaamse regering ook het Vlaams Beleidsplan Artificiële Intelligentie 2024-2028. In het kader daarvan stimuleert de overheid onder andere het gebruik van AI door het bedrijfsleven, en investeerde het geld in wat het “top strategisch basisonderzoek” noemt. Ook de Nederlandse overheid presenteerde in januari 2024 een Overheidsbrede visie Generatieve AI. Daarnaast investeerde ze de afgelopen jaren in een aantal grote projecten, zoals een Nederlandse AI-fabriek in Groningen. Ten slotte wordt er ook in Europees verband samengewerkt, wat onder andere het meertalige TildeOpen LLM heeft opgeleverd.
Samenwerking is voor Nederland en Vlaanderen onontbeerlijk. De overheden kunnen namelijk niet op eigen kracht verder. Daarvoor is te veel investering nodig, zowel in menskracht als financieel. Maar op welk niveau werk je samen? Op Europees niveau samen optrekken klinkt logisch. Maar er zijn twijfels of de besluitvorming op dit niveau niet te langzaam gaat om de ontwikkelingen te kunnen bijbenen.
De oude Niemeyer tabaksfabriek in Groningen, waar in de toekomst een digitale hub moet verrijzen© Niemeyer Opent
Een samenwerkingsverband op taalniveau ligt daarom voor de hand. Evenzeer lijkt de rol van de Taalunie hierin vanzelfsprekend. Onder auspiciën van die kennis- en beleidsorganisatie voor de Nederlandse taal is er dan ook in januari 2026 een werkgroep AI voor het Nederlands opgericht, met vertegenwoordigers van verschillende Nederlandse en Vlaamse partijen en universiteiten. De werkgroep presenteerde in mei 2026 de eerste versie van hun actieplan. Hun doel is “een modulaire en federatieve infrastructuur om van losse projecten te evolueren naar een duurzame AI-voorziening voor het Nederlands”. Kort gezegd: losse projecten samenbrengen en op elkaar aan laten sluiten. Nog korter: samenwerken en afstemmen. We moeten investeren in vijf pijlers: data, infrastructuur, AI-ontwikkeling, valorisatie en kennisdeling.
Concreet wil de werkgroep onder andere een kenniscentrum inrichten, data-infrastructuur versterken en grensoverstijgend samenbrengen, en meer werken aan concrete toepassingen voor verschillende sectoren, waaronder de zorg en de publieke sector. Hoe fraai ook, voorlopig blijft het bij een plan. De tijd zal leren of en hoe de overheden ermee aan de slag zullen gaan. Dat er flink veel geld mee gemoeid zal zijn, ligt in de lijn der verwachting.
Kritische houding
Zo worden er dus allerlei plannen gesmeed om met AI om te gaan. Maar voor we kijken waar we precies naartoe willen, moeten we even stilstaan bij de impact van AI-gebruik op het dagelijks leven. Die is aanzienlijk: er zijn grote vraagtekens bij de duurzaamheid van het financiële model dat aan AI ten grondslag ligt, de milieu- en energiekosten van datacentra zijn astronomisch, en de sociale gevolgen zijn nauwelijks te overzien. In het onderwijs leven bijvoorbeeld zorgen over de consequenties die AI heeft op examinering en over de verwerving van schrijf- en onderzoeksvaardigheden van leerlingen. Daarom gaan steeds meer stemmen op om op z’n minst kritisch om te gaan met AI en het gebruik van AI-toepassingen. Deze kritiekpunten laten zien hoe belangrijk het is dat met het gebruik ook vooral de bewustwording over AI blijft toenemen. Ze tonen daarnaast het belang van GPT-NL aan. Het is te hopen dat dit model breder beschikbaar zal komen voor alle taalgebruikers.
AI-toepassingen zouden een zo goed mogelijke afspiegeling moeten zijn van de volledige breedte van de Nederlandse taal én cultuur
Vrij zeker is dat generatieve AI niet meer zal verdwijnen. Hoe zou die er dan idealiter moeten uitzien? Het belangrijkste vanuit taalopzicht is dat AI-toepassingen een zo goed mogelijke afspiegeling zijn van de volledige breedte van de Nederlandse taal en vooral ook cultuur. Dat is van essentieel belang voor het Nederlands, want taalwetenschappers zijn het erover eens dat digitale vertegenwoordiging essentieel is voor het voortbestaan van een taal op lange termijn. Een rapport over het Nederlands in het kader van de European Language Equality-project liet recent zien dat het Nederlands er relatief goed voorstaat, maar dat we niet moeten stilzitten. Daarom zijn de doelen van het actieplan Artificiële intelligentie voor de Nederlandse taal van de Taalunie een goed uitgangspunt. Specifiek op taalgebied is het belangrijk om bronnen te blijven ontsluiten en digitaliseren. Vooral voor delen van de taal die nu ondervertegenwoordigd zijn, zoals het Surinaams-Nederlands en regionale taalvariëteiten als dialecten.
De uiteenlopende technologieën hebben ons, en de Nederlandse taal, heel veel te brengen. Maar we moeten beseffen dat het niet alles goud is wat blinkt. Zoals altijd moeten we ons niet laten meesleuren door de waan van de dag, en blijft het van wezenlijk belang om kritisch maar opbouwend met de materie om te gaan. Zou het niet mooi zijn als we juist die typisch Nederlandse en Vlaamse houding in AI zouden weerspiegeld zien?











Geef een reactie
Je moet ingelogd zijn op om een reactie te plaatsen.