Deel dit artikel

de Genome Wide Association Studies willen genetische factoren identificeren die een rol spelen bij ziekte of gezondheid. op die manier hopen ze nieuwe inzichten te verwerven in sommige ziektemechanismen die op basis van de huidige wetenschap nog onvoldoende gekend zijn. die moeten dan de mogelijkheid bieden om nieuwe gerichte behandelingsstrategieën te ontwikkelen. het ontrafelen van die werkingsmechanismen vergt echter nog veel bijkomend functioneel onderzoek.

Cartografie van de erfelijke variatie

An Goris

De experimenten van de augustijnermonnik Gregor Mendel over de overerving van eigenschappen in erwten spreken na honderdvijftig jaar nog steeds tot de verbeelding. Mendel bestudeerde 34 kenmerken, op één na allemaal discrete eigenschappen (zoals het hebben van gele of groene peulen), die onveranderd recessief of dominant doorgegeven worden aan de volgende generatie. Eén kenmerk vormt hierop een uitzondering: bij een kruising van planten met rode en witte bloemen zijn de meeste afstammelingen niet wit of rood, maar worden kleurvariaties van donkerrood tot violet vastgesteld. Mendel suggereerde dat de kleur van die bloemen de combinatie is van twee of meer onafhankelijke kleuren, die elk afzonderlijk dezelfde wetten van overerving volgen als de discrete eigenschappen. Ook bij de mens vinden we ‘mendeliaanse’ eigenschappen en aandoeningen, waarbij de overerving van een bepaalde eigenschap te wijten is aan één wijziging in één gen. Daarnaast zijn er ook ‘complexe’ of ‘multifactoriële’ kenmerken, die het resultaat zijn van een samenspel van variaties in enkele tot mogelijk honderd genen en omgevingsfactoren. De medische wetenschap is intussen erg bedreven in het vinden van de genen voor mendeliaanse aandoeningen, zoals mucoviscidose en de ziekte van Huntington. Multifactoriële eigenschappen, zoals de mate van vatbaarheid voor relatief veel voorkomende aandoeningen zoals diabetes, multiple sclerose en reumatoïde artritis, blijven echter een hardere noot om te kraken. Niettegenstaande enkele vroege successen in de jaren zeventig van de vorige eeuw en grote inspanningen sindsdien, waren de resultaten tot voor kort op één hand te tellen.

Drie ontwikkelingen hebben hierin verandering gebracht. In april 2003 werd de voltooiing van het Human Genome Project aangekondigd, dat de sequentie (de opeenvolging van drie miljard baseparen of nucleotiden) van het menselijke erfelijke materiaal blootlegde. Voor een fractie van die sequentie, de naar schatting tien miljoen single nucleotide polymorphisms of SNP’s, wordt in de bevolking relatief vaak (bij meer dan vijf procent) een alternatief nucleotide waargenomen. Van die varianten werden er intussen zowat drie miljoen in kaart gebracht door het International Haplotype Mapping Project of kortweg HapMap. Tegelijk met die vergaarde kennis werden technologieën ontwikkeld om nauwkeurig en efficiënt grote aantallen SNP’s te testen. Ten slotte hebben onderzoeksgroepen de voorbije jaren geïnvesteerd in het verzamelen van grotere studiepopulaties en het vormen van samenwerkingsverbanden.

De meeste studies zijn gebaseerd op het volgende principe: ze zoeken naar een verband of een verschil in de frequentie van een variant tussen een grote groep patiënten met een bepaalde aandoening en een grote groep gezonde controlepersonen. Een verband tussen een bepaalde variant en een bepaalde ziekte kan erop wijzen dat de regio van het genoom waarin die variant ligt een rol speelt in de ontwikkeling van de aandoening. Waar het voordien nodig was om op basis van de al gekende aspecten van de ziekte een prioriteitslijst van de varianten voor studie op te stellen (kandidaat-genstrategie), is het nu ook mogelijk om een groot deel van het genoom tegelijk te testen (genome-wide association screening of de GWAS-strategie). De structuur van het genoom helpt het onderzoek hierbij een handje: de tien miljoen SNP’s zijn niet onafhankelijk van elkaar, maar vormen in feite een mozaïek van regio’s van telkens enkele tot enkele tientallen SNP’s die samen een patroon vormen. De vorm van één SNP kan dan die van sommige nabijgelegen SNP’s of proxies voorspellen. Op die manier kan met 500 000 tot een miljoen goedgekozen SNP’s het grootste deel van de frequente variatie in het genoom in kaart worden gebracht.

De tot nu toe gerapporteerde GWAS gebruikten microarrays (dit zijn kleine DNA-profielen op een laboratoriumglaasje) met 300 000 tot 500 000 SNP’s die, omdat ze niet volledig rationeel maar voor een groot deel op basis van praktische aspecten gekozen zijn, in theorie ongeveer zeventig procent van het genoom effectief zouden testen. De uitdaging bestaat erin om binnen die hoeveelheid van gegevens te evalueren of een waargenomen verschil tussen patiënten en controlepersonen effectief een risicofactor dan wel een foutief resultaat van een test of een statistische toevalligheid weerspiegelt. De kans dat een waargenomen resultaat in een studie werkelijk een risicofactor weerspiegelt, stijgt naarmate de grootte van de studiepopulatie toeneemt, de p-waarde (de kans om een bepaald verschil alleen op basis van toeval waar te nemen) kleiner is, en het aantal bestaande risicofactoren onder de geteste varianten groter is. P-waarden van 10^-6 tot 10^-7 worden vaak gehanteerd als significant na correctie voor het aantal uitgevoerde testen (genome-wide significant).

Eén persoon op zes draagt twee kopieën van een risicovariant voor obesitas

Na publicatie van de eerste Genome Wide Association Studies in 2005 en 2006 volgen de resultaten elkaar sinds het voorjaar van 2007 zeer snel op: er verschenen studies over prostaatkanker, diabetes, manische depressie, hartinfarct, de ziekte van Crohn, reumatoïde artritis, multiple sclerose en vele andere aandoeningen. Ook een groot aantal andere, normale menselijke eigenschappen ontsnappen niet aan een GWAS-studie. Daaruit blijkt bijvoorbeeld dat elke kopie van de C-variant van een SNP in het HMGA2– oncogen de gemiddelde hoogte van een persoon met 0,4 cm doet toenemen. Eén persoon op zes draagt twee kopieën van een risicovariant voor obesitas in het FTO-gen en weegt gemiddeld drie kilo meer dan iemand die deze variant niet draagt. De combinatie van zes regio’s van het genoom verklaart een groot deel van de verschillen binnen de Europese bevolking in kleur van ogen en haar, het al dan niet hebben van sproetjes of zongevoeligheid.

De drijfveer achter de Genome Wide Association Studies is de hoop dat ze nieuwe inzichten genereren in de ziektemechanismen die op basis van de huidige kennis niet voorhanden zijn. De eerste generatie GWAS is door beperkingen in de grootte van de studiepopulatie en de beschikbare fondsen vaak nog een evenwicht tussen de ‘hypothesevrije’ genome-wide en de kandidaat-genstrategie, waarin uit de lijst van best gerangschikte SNP’s in de screeningsfase de meest waarschijnlijke kandidaten worden gekozen voor opvolging. In een GWAS voor multiple sclerose bereikte een SNP in het gen voor interleukine-2 alpha (IL2RA) slechts de 792e plaats in de ranking onder 335 000 SNP’s. Op basis van de functie van dit gen in het immuunsysteem werd het echter toch opgevolgd en de rol van dit gen in multiple sclerose werd intussen bevestigd. Een minder te voorspellen resultaat is een risicofactor voor de ziekte van Crohn in een uitgestrekte gene desert-regio van 1,25 miljoen baseparen waarvan de rol nog niet helemaal duidelijk is.

Opvallend is dat vatbaarheidsfactoren voor verschillende aandoeningen niet willekeurig verspreid over het genoom lijken, maar vaak in clusters liggen. Het is wel nog niet duidelijk of dat ook betekent dat het dan om eenzelfde gen en mechanisme in die verschillende aandoeningen gaat. De bovenvermelde IL2RA blijkt niet alleen geassocieerd met multiple sclerose maar ook met enkele andere immuun gerelateerde aandoeningen zoals type 1-diabetes (suikerziekte op jonge leeftijd) en de ziekte van Graves (een schildklierafwijking). Een regio op de korte arm van chromosoom 9 bevat een vatbaarheidsgen voor het krijgen van een hartinfarct en één voor ouderdomsdiabetes. Een variant in het TCF2-gen beschermt tegen ouderdomsdiabetes, maar verhoogt tegelijkertijd het risico op prostaatkanker. De studies leveren heel wat puzzelstukjes op voor een beter inzicht in de gezamenlijke en specifieke mechanismen van verschillende aandoeningen. Het ontrafelen van die werkingsmechanismen vraagt echter nog veel bijkomend functioneel onderzoek. In sommige gevallen is een wijziging van een aminozuur in het eiwit een logisch mechanisme, maar vaak lijkt het eiwit zelf onveranderd en is een effect op de hoeveelheid eiwit of de verhouding van twee of meer vormen van eenzelfde eiwit meer waarschijnlijk.

Een regio op de korte arm van chromosoom 9 bevat een vatbaarheidsgen voor een hartinfarct en één voor ouderdomsdiabetes

Enkele genen oefenen een relatief groot effect uit op de vatbaarheid voor bepaalde aandoeningen. Zo verhoogt het dragen van twee kopieën van een variant in het gen voor complement factor H het risico op maculaire degeneratie (een vorm van blindheid op oudere leeftijd) met een factor (odds ratio) van 6. Die hoge ratio liet toe dat de eerste gepubliceerde GWAS-studie dit effect kon detecteren door het vergelijken van slechts 96 patiënten en 58 controles. Dergelijke effecten blijken echter erg zeldzaam en een typische grootteorde in complexe aandoeningen lijkt eerder een stijging van het risico met twintig tot vijftig procent (odds ratio van 1.2 tot 1.5) te zijn. Daarbij komt nog het typische fenomeen van de ‘vloek van de winnaar’: de eerste gerapporteerde effectgrootte voor een nieuwe factor is vaak een overschatting omdat die studie door statistische fluctuatie wat begunstigd was om het effect te kunnen detecteren. Een meer correcte schatting van de effectgrootte wordt maar benaderd na bijkomende studies of, voor de meer frequente aandoeningen, in prospectieve studies waar de ontwikkeling van ziektes wordt gevolgd in grote bevolkingsgroepen. Een opvallende vaststelling is dat vele van de risicovarianten frequent voorkomen. Bepaalde zeldzame mutaties in IL2RA veroorzaken ernstige ‘mendeliaanse’ afwijkingen van het afweersysteem op jonge leeftijd maar tegelijk draagt meer dan de helft van ons de variant die op latere leeftijd het risico op multiple sclerose verhoogt met twintig procent. Ongeveer één persoon op vier draagt twee kopieën van een variant in TCF7L2 die verband houdt met een lagere insulineproductie en een vijftig tot honderd procent hoger risico op ouderdomsdiabetes.

Toepassing van die informatie onder de vorm van testen beschikbaar voor patiënten en artsen laat niet op zich wachten. Firma’s zoals het IJslandse deCODE Genetics bieden al een test aan voor erfelijke risicofactoren voor hartritmestoornissen, hartinfarct en ouderdomsdiabetes. De klinische bruikbaarheid voor een individu van een variant die relatief frequent is maar een matig tot beperkt effect uitoefent, is echter nog niet duidelijk, tenminste niet in ongeselecteerde populaties. Het identificeren van bijkomende risicofactoren en het in kaart brengen van de onderlinge interacties en verbanden met omgevingsfactoren en klinische variabelen lijken hiervoor noodzakelijk. Het indelen van patiënten op genetische basis in groepen met een verschillend onderliggend ziektemechanisme, ziekteverloop of respons op behandeling zou toelaten de diagnose, prognose en preventie of behandeling aan te passen. De eerste doelstelling blijft vooralsnog om ziektemechanismen bloot te leggen, wat nieuwe onderzoekslijnen opent en toelaat om gericht nieuwe behandelingsstrategieën te ontwikkelen.

De vatbaarheidsgenen waarover de voorbije maanden in de wetenschappelijke pers werden gerapporteerd, zijn slechts het topje van de ijsberg en het is uitkijken naar nieuwe resultaten. Zelfs in aandoeningen zoals de ziekte van Crohn en diabetes, waar het onderzoek tot nu toe het meest succesvol was, wordt slechts een gedeelte van de interindividuele verschillen in vatbaarheid verklaard door de al gerapporteerde risicofactoren. Men verwacht dat een groot aantal werkelijke vatbaarheidsfactoren niet tot de top tien of twintig SNP’s van een studie raken maar begraven liggen in bijvoorbeeld de top tien procent van de honderdduizenden geteste SNP’s. Grotere studiepopulaties zijn nodig om die risicofactoren boven het achtergrondsignaal te laten uitstijgen. Daartoe worden samenwerkingsverbanden gevormd en wordt het publiek maken van ruwe gegevens van al uitgevoerde studies gestimuleerd. Ook wordt waar mogelijk een kostenefficiënt gebruik van de verkregen gegevens van controlepopulaties voorgesteld. GWAS-data laten toe om na te gaan of eventuele verschillen in herkomst, rekrutering of verwerking tussen verschillende controlegroepen zich weerspiegelen in verschillen in erfelijke achtergrond. Het Wellcome Trust Case Control Consortium, een samenwerkingsverband van 53 onderzoeksgroepen uit het Verenigd Koninkrijk, valideerde en gebruikte zo een gezamenlijke groep van drieduizend controlepersonen uit het hele land voor de studie van elf veel voorkomende aandoeningen en stelt de data publiek beschikbaar voor toekomstige studies.

Verschillende populaties zijn mogelijk meer of minder geschikt om bepaalde risicofactoren te identificeren. In de Europese bevolking dragen zes op tien mensen een risicofactor in het tau-gen voor de ziekte van Parkinson. Omdat in niet-Europese bevolkingsgroepen iedereen, zowel patiënten als controlepersonen, die factor draagt, zijn die populaties ongeschikt om het effect van die variant te detecteren. In Europa zien we een gradiënt in de gelijkaardigheid van erfelijke achtergrond van het noordwesten naar het zuidoosten, met onder de sterkst afwijkende populaties de inwoners van Sardinië en Finland. Die worden soms voorgesteld als alternatieven voor de identificatie van risicofactoren die in andere Europese bevolkingsgroepen misschien zouden worden gemist.

De ultieme coverage is de sequentiebepaling van het volledige genoom van elk individu

Een vaststaande risicofactor (APOE4) voor de ziekte van Alzheimer wordt momenteel met GWAS gemist omdat de gebruikte microarrays noch de verantwoordelijke SNP’s zelf noch proxies ervoor bevatten. Een grotere coverage wordt beoogd door de verkregen informatie te gebruiken om niet-getypeerde varianten te voorspellen en door meer SNP’s in te sluiten in de nieuwe generatie microarrays. Het bereik van GWAS-studies blijft echter beperkt tot relatief frequente varianten. Zeldzame varianten worden niet efficiënt getest door de GWAS-panels en de gemiddelde huidige studiepopulaties zijn niet voldoende groot om kleine verschillen in aantallen tussen patiënten en controlepersonen te kunnen vaststellen. De ultieme coverage is de sequentiebepaling van het volledige genoom van elk individu (whole-genome sequencing). De bekende genetici James Watson en Craig Venter waren het voorbije jaar de eersten om daarin voor te gaan, weliswaar mits een kost en inspanning die nog niet haalbaar zijn voor algemene toepassing.

Recent groeit ook de aandacht voor andere en nog minder bestudeerde vormen van erfelijke variatie dan SNP’s. Zo overstijgt structurele variatie, bestaande uit kleine of grote fragmenten die niet (deletie), twee- of meermaals (multiplicatie) of in de omgekeerde richting (inversie) voorkomen, het aandeel van de SNP’s in de normale interindividuele variatie in de bevolking. Daarnaast zijn er verschillen in de ‘verpakking’ van het erfelijke materiaal (epigenetische verschillen). Ook wordt begonnen met het systematisch in kaart brengen van de correlatie tussen erfelijke factoren en hun effect op de expressie van RNA en/of eiwit in verschillende weefsels. Al die gegevens op het niveau van DNA, RNA en eiwitten zijn complementair en geven meer inzicht in hoe we op unieke wijze van elkaar verschillen en hoe dat het geheel van onze eigenschappen en onze gevoeligheid voor ziektes beïnvloedt.

J. Couzin en J. Kaiser, ‘Closing the net on common disease genes’, in: Science 2007, 316, 820-822.

The Wellcome Trust Case Control Consortium, ‘Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls’, in: Nature 2007, 447, 661-678.

The International MS Genetics Consortium, ‘Risk alleles for multiple sclerosis identified by a whole-genome association study’, in: New England Journal of Medicine 2007, 357, 851-862.

An Goris is als onderzoeker in de neuroimmunologie verbonden aan de KU Leuven.

Deel dit artikel
Gerelateerde artikelen