Deel dit artikel

in februari 2001 werd met euforische stemming de allereerste sequentie van het menselijke genoom gepubliceerd. twintig jaar later blijkt dat deze iconisch geworden prestatie inderdaad een wetenschappelijke mijlpaal betekende. maar pas vandaag bestaat de technologie en bio-informatica om alle overgebleven hiaten in de ‘menselijke code’ op te vullen. net tijdens dit jubileumjaar kondigde men aan dat voor het eerst het écht volledige (!) menselijke genoom in kaart is gebracht. genetici heffen tijdens het verjaardagsfeest het glas met een nostalgische terugblik, maar vooral met het vizier gericht op de toekomst om de twintig jaar oude doelstellingen en verwachtingen verder waar te maken.

Een gen-iaal jubileumfeest: Eindelijk een complete genoomsequentie van de mens

Maarten Larmuseau

In de geschiedenis van de genetica – of erfelijkheidsleer – spelen de jaartallen 1866, 1953 en 2001 de hoofdrol. In 1866 publiceerde de augustijnermonnik Gregor Mendel enkele fundamentele wetmatigheden in de overerving van eigenschappen die hij had ontdekt door middel van kweekexperimenten met erwten. Ook al had de ‘vader van de genetica’ toen geen flauw idee dat de drager van erfelijke informatie zich situeert in het dna, of voluit desoxyribonucleïnezuur, dat in de vorm van chromosomen aanwezig is in de celkernen. Pas in 1953 ontrafelden James D. Watson en Francis Crick, mede dankzij de röntgendiffractiestudies van Rosalind Franklin, de chemische structuur van de dna-molecule. Deze molecule bestaat uit twee met elkaar vervlochten strengen van dna-bouwstenen of nucleotiden en verkrijgt zo zijn intussen karakteristieke vorm van een dubbele helix of wenteltrap. De bouwstenen komen in vier types voor, die op basis van de aanwezige base met de letters A (adenine), T (thymine), G (guanine) en C (cytosine) worden aangeduid. De erfelijke informatie zit verborgen in de volgorde van die letters in de dna-streng, die een sequentie wordt genoemd. Het was in 2001, het derde iconische jaartal, dat de eerste versie van een volledige sequentie – het genoom – van een menselijk individu voor het eerst gepubliceerd werd. De blauwdruk van onze soort bleek om een tekst van drie miljard letters, uitgedrukt in aantal baseparen, te gaan die honderden boeken beslaat. Het in kaart brengen van de menselijke genoomsequentie werd toen aanzien als het startpunt van de biologische revolutie in de 21ste eeuw. De prestatie werd niet enkel cruciaal geacht voor de biologie, geneeskunde en farmacie, maar ook voor een hele reeks andere disciplines, gaande van psychologie en sociologie tot rechten.

Het in kaart brengen van de menselijke genoomsequentie was het startpunt van de 21ste-eeuwse biologische revolutie

Toen in het midden van de jaren 1980 de eerste ideeën werden gelanceerd om het volledige genoom in kaart te brengen, was nochtans niet iedereen laaiend enthousiast. Niet alleen de technische mogelijkheden om dit huzarenstukje te realiseren werden in vraag gesteld, maar vooral de enorme kostprijs en tijd werden als redenen aangehaald om het niet uit te voeren. Er werd fel bediscussieerd wat voor zin het had om jarenlang een reusachtig aantal gegevens te verzamelen waarvan de eventuele voordelen pas in een verre toekomst zichtbaar zouden worden. De tegenstanders hielden daarom een vurig pleidooi om de financiële middelen en werkkrachten in de plaats rechtstreeks in te zetten voor onder meer de ontwikkeling van nieuwe therapieën en het onderzoek naar aids. Retrospectief lijkt dit felle debat onbegrijpelijk, maar destijds kon men moeilijk inschatten wat de rol was van bijvoorbeeld het dna dat zich tussen de eiwitcoderende genen bevindt en dat tot wel 98,5 % van het genoom uitmaakt. Velen beschouwden dit gedeelte toen nog als junk dna. Had men dan niet gewoon genoeg met een lijst van functionele genen die coderen voor één of meerdere eiwitten? Het werd pas later duidelijk dat dit zogenaamde junk dna cruciaal is voor de werking van de cel en voor het aansturen van de eiwitcoderende genen. Gelukkig wisten de voorstanders het pleit in hun voordeel te beslechten en keurde de Amerikaanse regering het initiatief goed om de volledige erfelijke code van de mens in kaart te brengen.

In 1990 werd het door de Amerikaanse overheid gefinancierde Human Genome Project (HGP) officieel boven de doopvont gehouden. De volledige duur van het bigscienceproject werd ingeschat op maar liefst 15 jaar en de kostprijs zou 3 miljard dollar bedragen (wat omgerekend naar de huidige waarde van de dollar net niet het dubbele bedraagt). Het HGP had bovendien niet enkel als doel om de volledige sequentie van de mens uit te lezen, maar ook die van vijf modelorganismen, waaronder de muis en de fruitvlieg. Finaal werd tevens voldoende ruimte voorzien om de juridische, ethische en sociale implicaties van doorgedreven dna-onderzoek uit te klaren. Zo vreesde men dat er vormen van genetische discriminatie zouden ontstaan zodra de technologie alomtegenwoordig zou zijn. Om alle torenhoge ambities van het HGP te realiseren werd gaandeweg het International Human Genome Sequencing Consortium (IHGSC) opgericht. Op een haast industriële schaal werden data gegenereerd vanuit 20 grote sequentiecentra in de Verenigde Staten, het Verenigd Koninkrijk, Frankrijk, Duitsland, Japan en China. Deze data werden vervolgens geïnterpreteerd door het inschakelen van honderden kleinere laboratoria en instituten wereldwijd die elk binnen een specifieke subchromosomale regio de verkregen sequenties in detail ordenden en genen gelinkt aan ziekten identificeerden. Ook onderzoekers van het departement Menselijke Erfelijkheid aan de KU Leuven werden ingeschakeld. Het IHGSC is daarom tot op vandaag de grootste samenwerking die ooit in de life sciences is aangegaan. Het wordt vaak beschouwd als het biologische equivalent van het Apolloproject dat mensen naar de maan heeft gebracht.

Het IHGSC, de grootste samenwerking in de life sciences ooit, is het biologische equivalent van het Apolloproject

In vergelijking met de huidige technologische middelen oogt de werkmethode van destijds bijzonder ambachtelijk: binnen het HGP werden de 23 chromosomen onderverdeeld in fragmenten van maximum 15 000 baseparen. Elk fragment werd vervolgens aan een zogenaamde shotgunaanpak onderworpen, wat sequenties van slechts enkele tientallen baseparen opleverde. Net zoals een gigantische legpuzzel werden vervolgens overlappende stukjes uitgezocht om steeds langere sequenties te reconstrueren totdat het hele fragment was uitgelezen. Finaal zouden dan alle fragmenten aan elkaar geplakt worden, met een volledig genoom als resultaat. Deze hiërarchische shotgunaanpak maakte initieel traag vooruitgang.

Om niet helemaal te hoeven wachten op het eindresultaat stelde het consortium de ‘Bermudaprincipes’ op. Het IHGSC sprak af om al onmiddellijk na realisatie de verkregen sequenties voor iedere geïnteresseerde partij vrij beschikbaar te maken. Deze openaccesshouding deed het biowetenschappelijke onderzoek opbloeien. Maar dit leidde ook tot een stevig conflict tussen de publieke en private sector. In 1998 kondigde het private bedrijf Celera Genomics bij monde van stichter Craig Venter aan sneller dan het IHGSC klaar te zullen zijn met de allereerste menselijke genoomsequentie. Met als motto ‘Speed Matters’ rekende Venter hiervoor op de reeds vrij beschikbare HGP-resultaten, maar ook op een experimentele aanpak om onmiddellijk het ganse genoom aan een globale shotgunmethode te onderwerpen, in plaats van het eerst hiërarchisch op te delen in aparte fragmenten, zoals het IHGSC te werk ging. Het werd een verbeten race tegen de klok. Celera Genomics had immers als doel om zijn resultaten enkel aan betalende partners aan te bieden, alsook om ontdekte genen en afgeleide therapieën te patenteren. Deze aanpak werd door het IHGSC als bijzonder agressief aanschouwd en zou volgens hen de wetenschappelijke vooruitgang vertragen.

In het jaar 2000 was de klus eigenlijk nog niet geklaard

De gemoederen bedaarden pas toen, op 26 juni 2000, de toenmalige Amerikaanse president Bill Clinton en de Britse premier Tony Blair de wereld toespraken. Ze verklaarden triomfantelijk dat wetenschappers erin geslaagd waren om het humane genoom in kaart te brengen, hoewel de klus feitelijk nog niet geklaard was. Bovendien bevestigden ze dat de volledige code zo spoedig mogelijk volledig vrij beschikbaar zou worden voor elke geïnteresseerde partij, wat een lelijke streep door de rekening van Celera Genomics betekende. Maar ook het publieke IHGSC moest door de politieke demarche zijn strategie veranderen. Zes maanden later, op 15 februari 2001, verscheen reeds zijn voorlopige versie van het menselijke genoom in Nature. Daags nadien rapporteerde Craig Venter zijn resultaten in Science. Het bleek nog om kladversies te gaan waarbij vele regio’s ontbraken of nog niet voldoende op fouten waren gecontroleerd.

Het internationale consortium werkte noest voort, totdat het werk twee jaar later als klaar werd beschouwd. Deze sterk verbeterde versie van de genoomsequentie werd gepubliceerd in 2004 en fungeert sindsdien als het consensusreferentiegenoom waartegen nieuwe genomen worden geassembleerd en vergeleken. Toch was ook dit referentiegenoom nog verre van volledig. Het genoom bevat immers veel fragmenten die bestaan uit ellenlange herhalingen en het was toen onbegonnen werk om met de korte dna-sequenties deze fragmenten te overbruggen. Zo’n 150 000 hiaten werden in de eerste referentie genoteerd. Naarmate de technologie en computeralgoritmes het toelieten om sneller en accurater langere sequenties aan te leveren en efficiënter in elkaar te puzzelen, raakten deze hiaten steeds meer opgevuld. De laatste grondige update van het referentiegenoom vond plaats in 2013 met de zogenaamde hg38-versie.

Tot op vandaag is er nog geen enkel chromosoom volledig uitgelezen

Tot op vandaag ontbreekt nog steeds zo’n 8 % van het volledige genoom in de hg38-versie en is er nog geen enkel chromosoom volledig uitgelezen. Het gaat hier vooral over specifieke sequenties waarvan er vele bijna-identieke kopieën bestaan die verspreid liggen over het genoom, alsook over het zogenaamde ‘heterochromatine’. Dit compact verpakte dna bestaat uit extreem hoge repetitieve sequenties en komt vooral voor aan de uiteinden  (de telomeren) en de middelpunten (de centromeren) van de chromosomen. Hoewel het gaat om lange gen-arme regio’s zijn ze toch zeker niet onbelangrijk: tijdens celdelingen beschermen de telomeren de chromosomen aan de uiteinden en zorgen de centromeren voor een correcte beweging van de chromosomen. Bovendien zijn ook nog de kortere armen van enkele chromosomen, zoals dat van chromosoom 21, onbekend gebied gebleven. Maar net tijdens dit jubileumjaar kondigde het T2T-collectief van Amerikaanse wetenschappers aan dat ook deze regio’s eindelijk voor het eerst zijn uitgelezen en dat deze genoomsequentie in preprint te bekijken is terwijl het momenteel aan een peerreview voor definitieve publicatie wordt onderworpen.

Met de recente intrede van nanopore sequencing is het mogelijk geworden om sequenties van meer dan 10 000 baseparen in één keer en met hoge nauwkeurigheid uit te lezen en te interpreteren. Dit betekent dat de computeralgoritmes nu veel grotere sequenties dan voorheen ter beschikking hebben om een genoom in elkaar te laten passen. Om de ontbrekende regio’s in het hg38-referentiegenoom via nanopore sequencing aan te pakken startte in 2019 het Telomere-to-Telomere-initiatief (T2T), waarvan de naam verwijst naar het sequencen van het ene naar het andere uiteinde van een chromosoom. Het initiatief wordt geleid door bio-informaticus Adam Phillippy van het National Human Genome Research Institute in Maryland (VS) en moleculair biologe Karen Miga van de University of California in Santa Cruz (VS). Hun eerste wapenfeit was de publicatie van de volledige sequentie van het X-chromosoom in 2020. In mei 2021 meldde het team dat ze het volledige genoom hadden kunnen sequencen en alle enigmatische regio’s hadden ingevuld (weliswaar met uitzondering van het mannelijke Y-chromosoom). Zo slaagden ze erin om 200 miljoen letters aan het referentiegenoom toe te voegen, waaronder zich maar liefst 115 – voordien onbekende – functionele genen zouden bevinden.

Computeralgoritmes hebben nu veel grotere sequenties ter beschikking om een genoom in elkaar te laten passen

Het gloednieuwe T2T-genoom betekent meer dan enkel het afronden van enkele details om tot een completere versie te komen. In de toegevoegde regio’s werden er door het T2T-consortium reeds twee miljoen nieuwe genetische varianten vastgesteld waarvan verwacht wordt dat ze van intrinsiek belang zullen zijn voor klinische studies en voor fundamenteel onderzoek rond cellulaire processen. Er zijn daarom voldoende redenen om het T2T-genoom na officiële publicatie de rol van hg38 als huidig referentiegenoom te laten overnemen. Er wordt echter verwacht dat het toch niet bij deze ene keer zal blijven dat het referentiegenoom in de komende jaren kan wijzigen.

Het genereren van een compleet genoom is immers slechts een deel van de uitdaging. Elke versie van het referentiegenoom is tot nog toe gebaseerd geweest op het erfelijke materiaal van een handvol personen met voornamelijk een West-Europese afkomst. Zo werd het eerste gepubliceerde referentiegenoom van het IHGSC hoofdzakelijk samengesteld uit enkele anonieme donors die hadden gereageerd op een krantenadvertentie, waarbij zo’n 70 % van dat genoom afkomstig was van slechts één individu. Nochtans bestaat er heel wat genomische variatie die specifiek is voor bepaalde populaties. Vooral op het Afrikaanse continent, alwaar de wieg van onze soort ligt, wordt de grootste diversiteit waargenomen. Meermaals werd voornamelijk op basis van Afrikaanse populaties vastgesteld dat één referentiesequentie, gebaseerd op een handvol individuen, te beperkt is om alle aanwezige genomische variatie bij de mens te kaderen. Er bestaat geen ‘gemiddeld’ genoom voor de mens en er is nood aan een referentiesequentie die opgebouwd is uit vele sterk verschillende genomen. Diverse huidige initiatieven trachten nu dit euvel op te lossen door tot zo’n meer algemeen referentiegenoom te komen, een zogenaamd ‘pangenoom’ gebaseerd op veel meer individuen van diverse etnische afkomst. Langzaam maar zeker komen we daardoor steeds dichter bij één van de fundamentele doelstellingen van het Human Genome Project: een complete en accurate vertegenwoordiging van de genomische blauwdruk van de menselijke soort.

Het genoom en de interactie met de omgeving blijken veel complexer dan we ons 20 jaar geleden hadden kunnen inbeelden

Het jubileumjaar 2021 is hét moment om te reflecteren over de perspectieven die destijds werden geformuleerd en over waar de genetica nu, 20 jaar later, staat. Zijn we erin geslaagd om de verwachte doorbraken te realiseren binnen de biologie, de geneeskunde en de maatschappij? Het antwoord op deze vraag zal unaniem positief zijn, met verwijzingen naar onder meer de nieuwe baanbrekende inzichten in de evolutie en geschiedenis van onze soort dankzij analyse van oeroude skeletten, de medische revoluties in de behandeling van kanker en erfelijke aandoeningen, en de aanzienlijke aanwezigheid van dna in forensische toepassingen. Het genoom en de interactie met de omgeving blijken echter wel nog veel complexer te zijn dan we ons 20 jaar geleden hadden kunnen inbeelden. Als het uitlezen van één volledig referentiegenoom al een dermate complexe zaak blijkt te zijn, wat moet dan gezegd worden over het in kaart brengen en interpreteren van de aanwezige variatie en verspreiding ervan in de menselijke populaties? Het onderzoek naar die genetische variatie in ruimte en tijd, en in gezondheid en ziekte, is nog in volle gang, al doen de talloze commerciële advertenties voor direct-to-consumer (dtc) dna-testen ons graag het tegendeel geloven. Alsof een eenvoudig speekselstaal glashelder iemands kans op erfelijke kenmerken en aandoeningen, dieet- en lifestylevoorkeuren of afkomst in detail kenbaar kan maken.

Het is nu aan de huidige en volgende generatie genetici om het nalatenschap van het HGP verder vorm te geven. De komende jaren mogen we wereldwijd en ook vanuit de onderzoeksactiviteiten binnen het departement van Menselijke Erfelijkheid aan de KU Leuven doorbraken verwachten in de kwalitatieve screening en inschatting van individuele risico’s op erfelijke kenmerken en ziekten, alsook in de verdere ontwikkeling van gepersonaliseerde gentherapieën en van genome editing waarbij het dna-bouwplan gericht wordt aangepast. Met al deze toepassingen in het vooruitzicht moet, net zoals bij de start van het HGP in 1990, verder ingezet worden op de ethische, juridische en sociale aspecten, om ons als samenleving te blijven wapenen tegen alle vormen van genetische discriminatie en het oneigenlijke gebruik van genetische gegevens. Er staan ons vele uitdagingen te wachten, maar vooreerst heffen genetici en biologen gezamenlijk het glas tijdens dit jubileumjaar. Lang leve de menselijke genoomsequentie!

International Human Genome Sequencing Consortium, ‘Initial sequencing and analysis of the human genome’, Nature, 2001, 409, 860-921.

John Craig Venter et al., ‘The sequence of the human genome’, Science, 2001, 291: 1304-1351.

Maarten Larmuseau is genetisch genealoog en als docent verbonden aan het departement Menselijke Erfelijkheid van de KU Leuven.

Deel dit artikel
Gerelateerde artikelen