fouten in ons genetisch materiaal kunnen problemen veroorzaken. soms zijn die problemen zo belangrijk dat we er ziek door worden. door recente spectaculaire ontwikkelingen op technologisch gebied is het veel eenvoudiger geworden om genetische fouten op te sporen. daarmee heeft genetisch onderzoek een belangrijkere plaats veroverd in de moderne geneeskunde. de technologie waarmee we ons genetisch materiaal kunnen lezen of ‘sequeneren’ wordt namelijk steeds sneller, efficiënter en goedkoper.
Gidsen voor genoomdiagnostiek
Ons genetisch materiaal bestaat integraal uit een opeenvolging van 4 DNA-bouwstenen of letters, namelijk A, C, G en T. De stukjes van ons genetisch materiaal die gebruikt worden als recept voor de aanmaak van een eiwit noemen we genen. Door het lezen van de volgorde van de DNA-bouwstenen van een gen kun je nagaan of deze volgens de norm is. Wanneer dat niet het geval is, spreken we van een ‘variant’. Zo kan er ergens een verrassende of zelfs foute bouwsteen zitten, er kunnen één of meer bouwstenen weggevallen zijn, of bouwstenen kunnen in een verkeerde volgorde zitten. Er is tussen individuen, tussen verschillende families en tussen niet-verwante bevolkingsgroepen heel wat variatie in DNA. Hoeveel precies zijn we nu stilaan aan het leren. De ‘norm’ waarmee het DNA van een individu vergeleken wordt is dus noodgedwongen een vluchtig en evolutief element, opgebouwd uit de beschikbare gegevens van sequenering van een zo groot mogelijke populatie ‘gezonde’ personen. DNA-varianten kunnen onschuldig zijn, wanneer ze bijvoorbeeld random verschillen van de ene bevolkingsgroep of familie tot de andere, maar kunnen ook aanleiding geven tot een genetische aandoening. In het laatste geval spreken we van ziekteveroorzakende of pathogene varianten.
De eerste sequeneringstechnologie, Sangersequenering genaamd, dateert van de jaren 80 en kan maximum één gen per keer sequeneren. De technologie van de tweede generatie (Next Generation Sequenering of NGS) knipt eigenlijk grote hoeveelheden DNA in stukjes en sequeneert die allemaal tegelijk, waardoor het hele proces sneller en goedkoper wordt. Met NGS kan je dus verschillende genen tegelijk of zelfs een volledig genoom analyseren. Om deze technologieën even te vergelijken: na de start in 1990 deed het Human Genome Project er bijna 15 jaar over om het volledige (referentie)genoom van één mens, bestaande uit 3 miljard bouwstenen, te sequeneren volgens de Sangermethode; dat kostte bijna 2,7 miljard dollar. Vandaag kan NGS-technologie in een week tijd een genoom afleveren tegen ongeveer 1 000 dollar. Dat is dus duizendmaal sneller en 2,7 miljoen keer goedkoper.
Een gevolg hiervan is dat de sequenering van een genoom binnen het bereik is gekomen van de genetische diagnostiek of genoomdiagnostiek. Genetica kreeg hierdoor een grotere rol in de geneeskunde. Verschillende medische specialisten vragen in toenemende mate genoomdiagnostiek aan voor hun patiënten en zetten soms zelfs genoomdiagnostiek in vooraleer ze ander diagnostisch onderzoek starten. Vooral gerichte genoomdiagnostiek, waarbij een beperkt aantal aandoeningsspecifieke genen wordt onderzocht, wordt op dit moment al ingezet als een belangrijk onderdeel van patiëntenzorg. Op basis van deze gerichte ‘genpanels’ kunnen tientallen, soms honderden genen tegelijkertijd getest worden. Deze methode is niet bijzonder nuttig voor zuivere monogenetische aandoeningen zoals mucoviscidose, waarbij maar één gen geanalyseerd moet worden. Voor meer heterogene aandoeningen daarentegen, waarbij verschillende genen aanleiding kunnen geven tot een analoog ziektebeeld, is ze wel bijzonder waardevol. Het panel voor beenmergfalen telt bijvoorbeeld ongeveer zestig genen, het panel voor primaire immuundeficiëntie ruim tweehonderdvijftig. Voor minder specifieke, meer variabele ziektebeelden, of wanneer de genpaneltest geen resultaat geeft, kan het gehele coderende gedeelte van het DNA afgelezen worden. Het coderende deel van ons DNA bestaat uit alle stukjes DNA die gebruikt worden als recept voor de aanmaak van eiwitten – alle genen dus – en wordt ook het exoom genoemd. Het exoom is slechts ongeveer 1 procent van ons totale genoom, al het DNA dat we in al onze cellen meedragen, en de analyse ervan wordt Whole Exome Sequenering (WES) genoemd. WES analyseert 25.000 genen tegelijkertijd.
Verschillende artsen zetten nu al gerichte genoomdiagnostiek in vooraleer ze ander diagnostisch onderzoek starten
Nog maar heel recent werd de overstap gezet naar het aflezen van het gehele genoom (Whole Genome Sequenering, WGS), waarbij dus ook die andere 99% gesequeneerd wordt. In 2013 werd in het Verenigd Koninkrijk het grootschalige project 100K Genomics England gestart, waarbinnen 100.000 volledige genomen van patiënten met kanker en zeldzame aandoeningen onderzocht worden. Technisch en financieel is het perfect mogelijk om WGS uit te voeren, maar de moeilijkheid ligt in de complexe data-analyse en de interpretatie van de vele gevonden DNA-varianten, die meestal goedaardig zijn. Genomics England richt zich dan ook in de eerste fase enkel op de analyse van de coderende DNA-sequenties (het exoom binnen het genoom) en dit enkel voor de gekende, ziekteveroorzakende genen waarvan de associatie met een gekende aandoening duidelijk bewezen is. Het ontdekken van nieuwe genen en de analyse van de niet-coderende sequentie (vaak ‘junk’-DNA genoemd) in WGS-data maakt deel uit van genoomonderzoek dat naast de diagnostiek loopt. De klinische relevantie van varianten in nieuwe genen of niet-coderende DNA-regio’s is meestal onduidelijk; extra onderzoek is dan nodig voor zulke genetische varianten gebruikt kunnen worden voor diagnostiek. Zelfs vandaag is de rol van junk-DNA in humane aandoeningen vrijwel volledig onbekend en bijgevolg ook amper bestudeerd. De verwachting is wel dat WGS de plaats van WES zal gaan innemen omwille van de dalende kostprijs en de veel betere kwaliteit van de sequentieresultaten voor de coderende DNA-regio’s.
Genetische centra en bedrijven bieden op dit moment genpanels of WES aan voor verscheidene aandoeningen. Enkel ziektegenen waarvan de associatie met een aandoening duidelijk bewezen is, worden hierbij nagekeken. Dat lijkt eenvoudig, maar vaak verschilt de lijst van zulke ziektegenen voor dezelfde aandoeningen sterk omdat er geen internationale consensus is over welke genen precies op die lijst horen te staan. Bovendien verandert de lijst voortdurend omdat er steeds nieuwe genen worden ontdekt en er vaak geen duidelijke centrale informatiebron bestaat. Deze tekortkoming is precies één van de verantwoordelijkheden die ClinGen (Clinical Genome Resource) recent op zich heeft genomen. ClinGen is een organisatie die gefinancierd wordt door de Amerikaanse National Institutes of Health (NIH), met als doel de uitbouw van een universele databank van klinisch-relevante genen en DNA-varianten die cruciaal zijn voor genoomdiagnostiek. Dat zal gebeuren voor alle ‘uitgeklaarde’ humane aandoeningen. Het werk werd verdeeld in werkgroepen: er is er een voor metabole ziekten, voor neurologische ontwikkelingsstoornissen, voor erfelijke kankers enzovoort.
Voor elke werkgroep wordt een multidisciplinair team van laboratoriumspecialisten, bio-informatici, genetici en medische specialisten samengesteld om ziektegenen te cureren. Met cureren wordt bedoeld dat de beschikbare informatie over het gen en haar varianten opgeschoond wordt op een gestandaardiseerde manier. De teams moeten beschrijven welke varianten in welke genen welke ziekte kunnen veroorzaken en hoe die ziekte overgeërfd kan worden. Dit ziektegen-curatieproces startte in 2015. Binnen de acht werkgroepen die momenteel actief zijn, worden nog eens multidisciplinaire teams aangesteld die de DNA-varianten in groepen van ziektegenen zullen cureren. Opnieuw zal dit op een gestandaardiseerde manier gebeuren, op basis van de richtlijnen die opgesteld werden door het American College of Medical Genetics and Genomics (ACMG) in 2017. Zo kan bepaald worden of een variant goedaardig is, ziekteveroorzakend, of een ‘variant van onduidelijk belang’ (‘variant of unknown significance’ of VUS).
Op dit moment bevatten databanken nog varianten die jaren geleden beschreven werden als pathogeen, maar waarvan inmiddels is gebleken dat ze dat toch niet zijn
De varianten en hun interpretatie komen terecht in de ClinVar-databank, een publiek toegankelijke opslagbank van varianten die ofwel werden verzameld en ingevoerd door genetische centra, onderzoekers, commerciële labo’s en professionele organisaties, ofwel afkomstig zijn uit genspecifieke databanken. ClinVar voegt een gestandaardiseerde beschrijving van de variant toe en een vermelding van de klinische relevantie (ziekteveroorzakend, VUS, goedaardig of ‘conflicterende data beschikbaar’ op basis van publicaties of andere ingediende gegevens). Niet zomaar iedereen zal gevalideerde varianten kunnen invoeren – enkel ClinGen-werkgroepen hebben die toestemming – en enkel de gevalideerde varianten krijgen een hoger kwaliteitslabel in ClinVar mee. Dat is van belang voor de toekomst, want ClinVar bevat op dit moment nog varianten die jaren geleden beschreven werden als pathogeen, maar waarvan inmiddels is gebleken dat ze dat toch niet zijn. Hetzelfde geldt eigenlijk voor de professionele HGMD (Human Gene Mutation Database). Deze databank is een commerciële versie van ClinVar waarin enkel varianten werden ingevoerd op basis van publicaties. Helaas blijken ook gepubliceerde varianten soms fout geïnterpreteerd. Bovendien komen uiteraard niet alle pathogene varianten in publicaties terecht.
Waarom is de interpretatie van varianten zo’n grote uitdaging binnen de genoomdiagnostiek? De genoomvariatie tussen individuen is bijzonder groot. Een exoom bevat gemiddeld zo’n 30 000 varianten; in een genoom worden meer dan 3 miljoen varianten gevonden in vergelijking met het referentiegenoom. Populatiestudies die 126 000 exomen en 16 000 genomen analyseerden van zowel gezonde als zieke personen tonen vergelijkbare genoomvarianties aan bij ieder individu. Die variantie wordt bewaard in de databank gnomAD (Genome Aggregation Database), die gebruikt wordt in de genoomdiagnostiek omdat ze een goed idee geeft van de frequentie waarmee bepaalde varianten in de bevolking voorkomen. Als een variant vaak voorkomt, is de kans klein dat die ziekte-veroorzakend is. Als het ziektebeeld dat de patiënt vertoont dan ook nog eens zeldzaam is, is de kans des te kleiner dat zo’n ziektebeeld veroorzaakt zou zijn door een variant die vaak voorkomt in de bevolking.
Om te bewijzen dat één variant die ene ziekteveroorzakende mutatie is, is er in veel gevallen onderzoek nodig op proefdieren of gekweekte cellen of moet de patiënt teruggeroepen worden voor verdere studies
Als we de totale lijst van varianten bij iedere patiënt willen verkleinen tot een hanteerbare shortlist van mogelijke ziekteveroorzakende varianten, is software essentieel. Die shortlist kan vervolgens verder uitgefilterd worden door een multidisciplinair team. De gebruikte software filtert de initiële lijst en verwijdert stille varianten (die geen effect hebben op de eiwitfunctie) en frequente varianten (die bijvoorbeeld gedragen worden door meer dan 0,1% van de bevolking). Daarnaast wordt ook vaak gebruikgemaakt van computerprogramma’s die aangeven hoe sterk een bepaalde variant de functie van het eiwit zou kunnen verstoren, zoals CADD, SIFT, Mutation Taster of PolyPhen. Helaas zijn deze methodes niet altijd even betrouwbaar: zelfs na deze filterstappen blijven er gemiddeld zo’n 100 à 200 varianten over, waarvan niet met zekerheid gezegd kan worden of ze het ziektebeeld van de patiënt al dan niet veroorzaakt kunnen hebben. Om te bewijzen dat één variant die ene ziekteveroorzakende mutatie is, is er in veel gevallen functioneel onderzoek nodig (op proefdieren of op gekweekte cellen) of moeten de patiënt en haar/zijn familie teruggeroepen worden voor verdere studies. Hierbij wordt de genoomdiagnostiek eigenlijk opnieuw basaal onderzoek en dus onmogelijk op grote schaal uit te voeren. Men verwacht dat grootschalige genoomanalysestudies in de toekomst een nog beter idee zullen geven van de frequentie van varianten, zodat de variantfiltering verder verbeterd kan worden.
Naast de nood aan allerhande software om de resultaten van massale sequenering hanteerbaar en begrijpelijk te maken voor een mens, is de hoeveelheid informatie die ontstaat door de sequenering van genomen zo groot dat het onmogelijk wordt om al die data te bewaren. De technologische ontwikkeling van sequentie-analysemethoden is met rasse schreden vooruitgegaan, maar creëert nu ook een nood aan efficiëntere dataopslag, op een veilige en financieel verantwoorde wijze.
Resultaten van genetische testen worden altijd bekeken in relatie tot lichamelijke kenmerken, laboratoriumtesten en de medische voorgeschiedenis van de patiënt en haar/zijn familie. In tegenstelling tot genoomvariantie zijn dit soort gegevens minder bruikbaar of hanteerbaar voor een computer. Nochtans is een elektronisch patiëntendossier vaak voorhanden en zou dit een bron kunnen zijn om deze gegevens aan te leveren, ware het niet dat dossierelementen vaak beschrijvend en talig zijn. In de genetica wordt internationaal gewerkt met dezelfde taal, terwijl patiëntengegevens doorgaans heel variabel zijn en niet begrepen zullen worden door de computer. Die zal een patiënt met een gedragsstoornis en bloedarmoede bijvoorbeeld niet herkennen als een patiënt met autisme en anemie. Om internationaal klinische en laboratoriumkenmerken (fenotypes) op een analoge, uniforme manier te kunnen beschrijven werd een nieuwe taal ontwikkeld die de Human Phenotype Ontology-terminologie (HPO) genoemd wordt. Op dit ogenblik bestaat die ‘standaardtaal’ om ziektebeelden te beschrijven uit meer dan 13 500 termen. Ze kan gebruikt worden door computerprogramma’s zodat het mogelijk is om over te gaan naar een fenotype-gedreven diagnose (Phenomizer) en genoomdiagnostiek (Exomizer, BeviMed). Nu kunnen computers dus op zoek gaan naar systematische associaties tussen genetische varianten en fenotypetermen of kenmerken van patiënten. In dat opzicht is het heel belangrijk dat klinisch-genetische laboratoria hun data delen in internationale databanken. Door het archiveren van laboratoriumresultaten, klinische gegevens, stambomen en DNA-varianten zal genoomdiagnostiek verbeteren. Een zeldzame variant kan bijvoorbeeld een ziekte blijken te veroorzaken als dezelfde variant bij meer mensen met dezelfde aandoening wordt aangetoond. Een publiek toegankelijke databank die hierin gespecialiseerd is, is Matchmaker Exchange.
Door recente technologische ontwikkelingen is het mogelijk geworden om op een snelle manier en tegen een redelijke kost het volledige genoom van één individu na te lezen. Dat heeft een grote versnelling veroorzaakt in de genoomdiagnostiek en het daaraan gekoppelde wetenschappelijk onderzoek, maar stelt de maatschappij ook voor heel grote uitdagingen. Hoewel er begeleidende richtlijnen zijn ontwikkeld voor de zoektocht naar de klinisch relevante genoomvariatie in de duizenden varianten die iedere mens draagt, is dit proces bijzonder moeilijk en dient het te gebeuren met de nodige omzichtigheid. Vandaag balanceert genoomanalyse op de grens tussen onderzoek en diagnostiek, maar er wordt verwacht dat de genoomdiagnostiek en de bio-informatica op termijn een hoofdrol gaan spelen in de geneeskunde. Medische experten zullen getraind moeten worden in deze nieuwe disciplines. De dokters van de toekomst zullen hun plaats naast de machines moeten verdienen of minstens moeten herdefiniëren.
L.V. Milko, B.H. Funke, R.E. Hershberger, D.R. Azzariti, K. Lee, E.R. Riggs, E.A. Rivera-Munoz, M.A. Weaver, A. Niehaus, E.L. Currey, W.J. Craigen, R. Mao, K. Offit, R.D. Steiner, C.L. Martin, H.L. Rehm, M.S. Watson, E.M. Ramos, S.E. Plon & J.S. Berg, ‘Development of Clinical Domain Working Groups for the Clinical Genome Resource (ClinGen): Lessons Learned and Plans for the Future’ In: Genet Med., 2018. doi:10.1038/s41436-018-0267-2.
M.A. Haendel, C.G. Chute & P.N. Robinson, ‘Classification, Ontology, and Precision Medicine’ In: N Engl J Med., 2018, 379, 1452-1462. doi: 10.1056/NEJMra1615014
Kathleen Freson is hoogleraar aan de faculteit Geneeskunde van de KU Leuven en hoofd van het Centrum voor Moleculaire en Vasculaire Biologie (departement Cardiovasculaire Wetenschappen).
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License