Deel dit artikel

om het oorsprongsgebied van de indo-europese taalfamilie te situeren bundelden linguïsten, biologen en computerwetenschappers hun knowhow. aan de hand van een model om de oorsprong van virusuitbarstingen te bepalen beweren ze nu te kunnen aantonen dat de expansie van onze vooroudertaal zo’n 8 000 tot 9 500 jaar geleden vanuit anatolië is begonnen. die kruisbestuiving tussen biologie en historische taalkunde hoeft niet te verbazen, aangezien de basis van taalkundige en biologische evoluties analoge processen zijn.

Kruisbestuivingen tussen biologie en taalkunde

Koen Bostoen

In een recent artikel in Science gaat een internationale groep van onderzoekers, bestaande uit biologen, computerwetenschappers en linguïsten, op zoek naar het oorsprongsgebied van de Indo-Europese taalfamilie. Hiertoe behoren het Nederlands en het Frans, maar ook het Grieks, het Perzisch, het Armeens en het Sanskriet. Sommigen situeren de wieg van onze oudste vooroudertaal zowat 6 000 jaar geleden in de Pontische steppen ten noorden van de Kaspische Zee. Anderen zijn overtuigd van een vroegere expansie vanuit Anatolië, zo’n 8 000 tot 9 500 jaar geleden, die gelijktijdig gebeurde met de verspreiding van de landbouw. De onderzoekers beweren nu over doorslaggevend bewijs te beschikken voor deze laatste hypothese. Los van de geldigheid van hun stelling is de manier waarop ze die onderbouwen op zijn minst opmerkelijk te noemen. Ze proberen dit decennia oude debat immers te beslechten met een model dat ontwikkeld werd om de oorsprong van virusuitbarstingen te bepalen.

Het toepassen van kwantitatieve methodes uit de evolutionaire biologie op een historisch-taalkundig probleem mag dan op het eerste gezicht verbazen, zo uitzonderlijk is het eigenlijk niet. Dit type onderzoek past in een bredere internationale trend waarbij interdisciplinaire teams zich steeds vaker buigen over vraagstukken van taalevolutie, vaak zelfs zonder de deelname van taalkundigen. Vergelijkbare studies bestaan niet alleen over de verspreiding van de Indo-Europese talen, maar ook voor andere grote taalfamilies, zoals de Bantoetalen in Afrika of de Austronesische talen van Zuid-Oost-Azië en de Stille Oceaan. De interactie tussen taalkunde en biologie is recent ongetwijfeld aan een opmars bezig, maar een nieuw fenomeen is het niet. Deze wederzijdse beïnvloeding is diepgeworteld in onze westerse intellectuele tradities. Dit is eigenlijk niet zo verbazingwekkend, als je aanneemt dat de basis van taalkundige en biologische evoluties analoge processen zijn.

Net zoals DNA-sequenties bestaan uit afzonderlijke erfelijke deeltjes, bevatten ook de grammatica en woordenschat van een taal geërfd materiaal

De gelijkenissen tussen taalkundige en biologische evolutie zijn onmiskenbaar. We gebruiken dan ook vaak dezelfde woordenschat of beeldspraak om te verwijzen naar deze in de grond verschillende fenomenen. Net zoals DNA-sequenties bestaan uit afzonderlijke erfelijke deeltjes, bevatten ook de grammatica en woordenschat van een taal geërfd materiaal. Zowel talen als biologische organismen blijven bestaan dankzij transmissie naar de volgende generatie. Deze overdracht gebeurt echter nooit perfect. In de loop van de tijd ondergaan taalkundige en biologische bouwstenen veranderingen. Daardoor krijgen verwante vormen soms een heel ander uitzicht. Je zou het op het eerste gezicht niet vermoeden, maar de woorden diwómbá in het Nyamwezi, omúmba in het Luyana en letsópa in het Pedi, drie Bantoetalen uit respectievelijk Congo, Zambia, en Zuid-Afrika, zijn verwante termen die verwijzen naar de klei die Afrikaanse pottenbaksters van oudsher gebruiken. De talen in kwestie erfden deze woorden van hun gemeenschappelijke vooroudertaal, maar niet zonder dat ze specifieke veranderingen in klank- en woordstructuur ondergingen. Dergelijke geërfde woorden die een gelijkaardige betekenis hebben en regelmatige klankcorrespondenties vertonen, worden in de historische taalkunde cognaten genoemd. Ze komen voor in alle taalfamilies, dus ook in de Germaanse talen. Denk maar aan de cognaten van ‘boek’ in bijvoorbeeld het West-Fries (boek), Duits (Buch), Engels (book), Zweeds (bok), Deens (bog), IJslands (bók) en Faroees (bók). Taalkundigen verlaten zich op cognaten om verwantschap tussen talen vast te stellen en om hun gemeenschappelijke voorouder te reconstrueren, als die niet – zoals bijvoorbeeld het geval is voor het Latijn, Oudgrieks of Oudegyptisch – in geschreven vorm overgeleverd werd. In vele delen van de wereld zonder lange geschreven traditie vormt de historische taalkunde een cruciale hulpwetenschap om toegang te krijgen tot de vroege geschiedenis. Aldus hebben we dankzij de reconstructie van de woordenschat van de Proto-Bantoe een idee van de levenswijze van Bantoesprekers voor ze zo’n 5 000 jaar geleden hun heimat verlieten in wat vandaag noordwestelijk Kameroen is. Zo aten ze bijvoorbeeld yam en verwerkten die tot brij, maakten ze gebruik van de vruchten van wilde bomen zoals de oliepalm, bakten ze potten, maar verbouwden ze nog geen graangewassen en smeedden ze nog geen ijzer.

Talen evolueren echter niet alleen regelmatig. Net zoals genen kunnen taalonderdelen ook mutaties en willekeurige drift ondergaan. Sommige innovaties zijn een reactie op wat zich in de buitenwereld afspeelt. Het hoeft geen betoog waarom het Swahili woord ndege zijn oorspronkelijke betekenis ‘vogel’ op een bepaald moment uitbreidde naar ‘vliegtuig’. Andere veranderingen gebeuren willekeurig, ook al zijn ze niet volledig onlogisch en komen ze vaker voor in de talen van de wereld. Omkering van klanken of lettergrepen binnen een woord of metathesis is zo’n proces. Een klassiek voorbeeld is het Latijnse formaticum dat fromage werd in het Frans, maar de oorspronkelijke eerste lettergreep behield in het Italiaanse formaggio of het Catalaanse formatge. Evenzo noemen sprekers van het Lundu, een Bantoetaal uit Kameroen, een roeispaan kafi, terwijl de naburige sprekers van het Kundu er faki op nahouden. Swahili zeelui op de Indische Oceaan hebben het ook over kafi, terwijl Kongovissers op de Congostroom spreken van nkáfi. Dit laat ons niet alleen toe te veronderstellen dat het om een heel oud Bantoewoord gaat, maar ook dat het een metathesis onderging in het Kundu.

Horizontale genenoverdracht en hybridisatie in de biologie corresponderen met een waaier aan taalhistorische processen veroorzaakt door taalcontact

Zowel in de biologie als in de historische taalkunde duiden gedeelde mutaties of innovaties doorgaans op een gemeenschappelijke geschiedenis. Ze laten toe om verwante soorten of talen intern te classificeren in nauwer aan elkaar verwante subgroepen, ook wel ‘clades’ genoemd, afkomstig van het Griekse klados (tak). Deze evolutionaire benadering staat dan ook gekend als de cladistiek. In beide disciplines is het uiteengroeien van takken vaak te wijten aan geografische isolatie en/of migratiefenomenen. Daartegenover corresponderen horizontale genenoverdracht en hybridisatie in de biologie met een waaier aan taalhistorische processen veroorzaakt door taalcontact, waarvan de meest banale vorm woordontlening is. Dat het Swahili (ngamia), Frans (chameau) en Nederlands (kameel) een gelijkaardig woord hebben voor het ‘schip der woestijn’ zegt niets over hun onderlinge verwantschap, maar alles over hun respectievelijke contactgeschiedenis. Allen kwamen op één of andere manier in contact met de brontaal van dit woord, namelijk het Arabisch (ǧamal). Voor het Nederlands en het Frans gebeurde dit indirect via het Latijn (camelus) van wie de eerste het ontleende en de tweede het erfde. Ontlening en overerving zijn dus historisch-taalkundige processen die elkaar kunnen voeden. Intensere vormen van taalcontact en meertaligheid kunnen leiden tot ware mengtalen, zoals pidgins en creolen.

Een laatste parallel tussen talen en levende soorten is dat beide kunnen uitsterven. Als het even meezit, laten ze alvorens ze verdwijnen sporen na in de vorm van fossielen. Talen kunnen fossiliseren in de vorm van oude teksten. Denk maar aan het Akkadisch dat dankzij het spijkerschrift vandaag nog gedoceerd en bestudeerd kan worden. Veel uitgestorven talen waren een minder gunstig lot beschoren. Ze hielden op te bestaan zonder het minste spoor achter te laten. Daarom worden vandaag over de hele wereld grote inspanningen gedaan om bedreigde talen van de vergetelheid te redden door hen nog zo goed mogelijk te documenteren voor ze uitsterven. Onder invloed van fenomenen als formeel onderwijs en urbanisatie dunt de sprekersgemeenschap van vele minderheidstalen vandaag zienderogen uit. Nieuwe generaties kinderen leren alleen nog de dominante taal van de streek waar ze opgroeien. In Gent is dit een vorm van standaard Nederlands in plaats van het Gents dialect, in Bulumbu (DRC) is dit het Kongo en het Lingala ten koste van het Nsong.

Als talen en levende soorten zoveel gelijkenissen vertonen, dan is het nogal evident dat taalkundigen en biologen ook met vergelijkbare problemen geconfronteerd worden: wat zijn betrouwbare data? Wat is retentie (i.e. wat behouden wordt) en wat is innovatie? Hoe natuurlijk is een bepaalde verandering? Wat is gedeelde innovatie en wat is parallelle evolutie? Welke stamboom weerspiegelt het best de ontwikkelingsgeschiedenis? Aangezien zowel talen als moleculen archieven zijn van hun eigen evolutie mag het niet verbazen dat biologen en taalkundigen gelijkaardige methodes ontwikkeld hebben om historische conclusies te trekken uit hun uiteenlopende datasets. Wetenschappers van beide disciplines steunen op de principes van de fylogenetica – de classificatie van diverse organismen volgens afstamming – en keken door de eeuwen heen over elkaars muurtje.

Wetenschappers van beide disciplines steunen op de principes van de fylogenetica – de classificatie van diverse organismen volgens afstamming

De Britse jurist Sir William Jones (1746-1794) wordt vaak beschouwd als de grondlegger van de moderne historisch-vergelijkende taalkunde. In 1786 benadrukte hij de historisch betekenisvolle gelijkenissen tussen het Sanskriet, het Grieks, het Latijn, het Gotisch en het Keltisch en versnelde hiermee de erkenning van de Indo-Europese taalfamilie. Hij was zeker niet de eerste die duidde op overeenkomsten tussen het Sanskriet en Europese talen, en ook zijn methodes waren niet bijzonder innovatief. Hij bracht wel een heel vernieuwend inzicht bij dat cruciaal was voor de verdere ontwikkeling van de historisch-vergelijkende taalkunde, namelijk dat de talen in kwestie moesten afstammen van een gemeenschappelijke bron, die misschien niet langer bestaat. Hiermee introduceerde hij impliciet het concept van een prototaal en het stamboommodel dat kort daarna het licht zou zien. Doorheen de vroege christelijke periode en de middeleeuwen heerste de idee dat alle talen afstamden van een bestaande taal. Onder Bijbelse invloed werd het Hebreeuws dikwijls die eer toegedicht, maar niet altijd. Zo beweerde de Nederlandse humanist Johannes Goropius Becanus (1519-1572) in zijn Origines Antwerpianae (1569) dat Antwerpen werd gesticht door afstammelingen van Noah die de oertaal uit het Aards Paradijs spraken en dat het Diets, de toenmalige naam van het Nederlands, de rechtstreekse afstammeling was van die oertaal. Het is pas tijdens de verlichting dat dergelijke Bijbels geïnspireerde ideeën in vraag gesteld werden. De Duitse filosoof Gottfried Wilhelm Leibniz (1646-1716) speelde hierin een belangrijke rol door de nadruk te leggen op processen van graduele en continue verandering in zowel de biologie als de taalkunde. Hij verwierp de idee van een Hebreeuwse oorsprong voor alle talen en probeerde een gemeenschappelijke genealogie te reconstrueren voor talen van Europa, Azië en Egypte. In de biologie kwam hij in conflict met de oude Griekse opvattingen over onveranderlijke archetypen. De evolutionist Jean-Baptist Lamarck (1744-1829) bouwde verder op die ideeën van verandering.

Het was echter Charles Darwin (1809-1882) die de idee van evolutie definitief ingang deed vinden in de biologie. Dankzij zijn principe van natuurlijke selectie slaagde hij erin biologische diversiteit en complexiteit overtuigend te verklaren zonder goddelijke interventie. In zowel On the Origin of Species (1859) als The Descent of Man (1871) sprak hij ook over taalkundige evolutie. De populariteit van zijn evolutietheorie droeg zeker bij tot de proliferatie van stambomen in de taalkunde. Vier jaar na het verschijnen van On the Origin of Species publiceerde de Duitse linguïst August Schleicher (1821-1868) het artikel Die Darwinsche Theorie und die Sprachwissenschaft waarin hij een Indo-Europese stamboom afbeeldde. In hetzelfde artikel betoogde hij echter ook dat stambomen reeds voor Darwin voorkwamen in de historische taalkunde. Hijzelf gebruikte ze in twee publicaties uit 1853, en de Duitse taalkundige Friederich Schlegel (1772-1829), die op zijn beurt beïnvloed was door ontwikkelingen in de biologie en de vergelijkende anatomie, introduceerde ze al in 1808 in een publicatie over comparatieve grammatica. Het mag duidelijk zijn dat vanaf het eind van de achttiende eeuw een interdisciplinaire kruisbestuiving bestond tussen taalkunde en biologie. In de loop van de negentiende eeuw werd die alleen maar sterker. Zo is de idee dat klankverandering bepaald wordt door absoluut regelmatige klankwetten – eind jaren 1800 geïntroduceerd door de zogenoemde Duitse neogrammatici en nog steeds een belangrijk doch niet onbesproken principe in de historische taalkunde – zonder twijfel schatplichtig aan de wetten die in die tijd in de natuurwetenschappen geponeerd werden. Toch waren het zeker niet altijd de taalkundigen die leentjebuur speelden bij de biologen. In 1884 zette de comparatieve methode in de taalkunde een belangrijke stap vooruit door het onderscheid dat de Duitse linguïst Karl Brugmann (1849-1919) maakte tussen gedeelde retenties en gedeelde innovaties, waarbij vooral die laatste cruciaal zijn voor fylogenetische classificatie. Dit onderscheid vond pas in 1950 ingang in de biologie toen Willi Hennig (1913-1976) symplesiomorfie (gedeelde retentie) contrasteerde met synapomorfie (gedeelde innovatie).

Als de evolutionaire biologie en de historische taalkunde zo sterk verweven waren in hun ontwikkeling, hoe verklaren we dan dat statistische en computergestuurde fylogenetische methodes uit de biologie vandaag pas hun opgang maken binnen het domein van de evolutionaire taalkunde? Het antwoord ligt bij algoritmes en computers. Toen Watson en Crick in 1953 de structuur van DNA blootlegden en in de jaren 1960 de eerste eiwitsequenties gepubliceerd werden, werden de massa’s data zo groot dat biologen onderzoek begonnen te doen naar kwantitatieve en algoritmische methodes om aan fylogenetica te doen. Deze computergestuurde modellen zorgden voor een revolutie in de evolutionaire biologie gedurende de voorbije halve eeuw.

In de jaren 1950 deden kwantitatieve benaderingen ook hun intrede in de historische taalkunde, toen Morris Swadesh (1909-1967) lexicostatistiek en glottochronologie ontwikkelde. De eerste methode berekent percentages van gedeelde cognaten tussen verwante talen aan de hand van een lijst van basiswoordenschat voor universele concepten. De afstandsmatrixen voor paren van talen, op basis hiervan ontwikkeld, worden vervolgens gebruikt om talen door middel van algoritmes hiërarchisch te clusteren tot stambomen. Glottochronologie bouwt hierop verder door een constante snelheid van lexicale vernieuwing te veronderstellen, namelijk ongeveer twintig procent per duizend jaar. Dit zou toelaten om de absolute splitsingstijd tussen talen te berekenen. Swadesh rekende dit vernieuwingspercentage uit op basis van een beperkt aantal talen met een lange geschreven traditie. Zijn methodes werden met veel enthousiasme onthaald, maar al heel snel fel bekritiseerd. De kritieken waren van velerlei aard, en ook zo sterk dat zijn methodes bij een meerderheid van taalkundigen tot op vandaag alle krediet verloren. Eén van de meest fundamentele opmerkingen is ongetwijfeld dat talen niet noodzakelijk veranderen aan een constante snelheid, zelfs niet hun basiswoordenschat die verondersteld wordt resistenter te zijn tegen ontlening. Talen zonder geschreven traditie evolueren wellicht ook sneller dan talen die de conservatieve invloed ondergaan van een schrift. Deze terughoudendheid zorgde ervoor dat de computergestuurde evolutionaire taalkunde geen gelijke tred hield met gelijkaardige ontwikkelingen binnen de evolutionaire biologie. De historische taalkunde miste aanvankelijk deze trein en is nu aan een stevige inhaalbeweging bezig. Kwantitatieve benaderingen van historische taalclassificatie zijn de laatste jaren opnieuw sterk in zwang. Omdat de evolutie van computergestuurde methodes in de evolutionaire biologie zo’n vaart liep, gebeurt dit vandaag heel vaak met de inbreng van biologen en computerwetenschappers.

Quentin D. Atkinson & Russell D. Gray, ‘Curious parallels and curious connections – phylogenetic thinking in biology and historical linguistics’, in: Systematic Biology, 2005, 54 (4), 513-526.
Remco Bouckaert et al., ‘Mapping the origins and expansion of the Indo-European language family’, in: Science, 2012, 337 (6097), 957-960.

Koen Bostoen is als taalkundige verbonden aan de Universiteit Gent en de Université Libre de Bruxelles.

Deel dit artikel