Deel dit artikel

systeembiologie neemt afstand van de moleculaire details van een biologisch proces om de structuur te observeren die het algemene gedrag van dit proces bepaalt op systeemniveau. dit nieuwe onderzoeksperspectief veroorzaakt een paradigmaverschuiving waarin de hele moleculaire biologie wordt verzwolgen. wat is systeembiologie eigenlijk? wat is haar invloed op het biologische onderzoek? en welke valkuilen zijn er?

Biologie in vogelperspectief

Yves Moreau

De voorbije vijf jaar is systeembiologie het modewoord geworden in de wereld van de biologie, gaande van nieuwe congressen en tijdschriften (zoals Molecular Systems Biology) over redactionele positiebepalingen en themanummers in vooraanstaande tijdschriften (een van dé doorbraken van 2005 in Science) tot de toplijst van de subsidiërende instanties. Dit succes wordt verklaard door een eenvoudig maar ambitieus verkoopargument. Om ooit echt te begrijpen hoe cellen en organismen werken, moeten we ophouden met de afzonderlijke studie van genen of proteïnen en onze aandacht vestigen op de complexe netwerken van interacties die hun dynamische gedrag bepalen. Door een vergrootglas zien we alleen gekleurde stippen en missen we de eigenlijke werking van een pointillistisch schilderij.

Voorstanders van de systeembiologie noemen hun klassiekere tegenhangers plagend ‘reductionisten’. Biologen zijn er zich echter al lang van bewust dat moleculaire processen een complex tussenspel van vele factoren veronderstellen. De Krebs-cyclus, een centraal dynamisch proces in de productie van energie door de cel, werd bijvoorbeeld al beschreven in 1937. De moeilijkheden die gepaard gaan met experimenten op biologische systemen hebben de moleculaire biologen in een cartesiaans keurslijf gedwongen: de grootste aandacht gaat uit naar de nauwgezette ontleding van moleculaire processen door middel van experimenten op het laagste niveau. De resultaten van zo’n onderzoek raken slechts langzaam geïntegreerd in een algemene kijk op biologische processen. Die ‘lokale kijk’ op de biologie verhinderde sommige biologen om biologische processen in hun juiste context waar te nemen en leidde soms tot de misleidende zoektocht naar simplistische antwoorden op complexe problemen (zoals de zoektocht naar hét gen voor intelligentie, een lange levensduur of alcoholisme).

De technologie heeft nu echter de verhouding tussen het uitvoeren van experimenten en de analyse van experimentele resultaten verschoven. Biologische systemen blijven weliswaar bijzonder moeilijk te manipuleren, maar hogedoorvoertechnologieën (zoals genoomsequencering en microroosters) produceren wel stromen data. Terwijl moleculaire biologie voorheen ‘gegevensarm’ was, zodat een kwalitatieve beschrijving een zinvolle manier was om informatie over een biologisch systeem over te brengen, is zij nu extreem ‘gegevensrijk’ geworden. Een kwalitatieve beschrijving van het proces kan de informatie uit die gegevens niet behoorlijk vastleggen, zodat computationele en mathematische modellen onmisbaar worden. Dergelijke kwantitatieve modellen zijn bovendien wenselijk omdat zij potentieel een grotere voorspellende en verklarende waarde hebben, in het bijzonder voor het dynamische gedrag van het systeem.

Terwijl moleculaire biologie voorheen ‘gegevensarm’ was, is zij nu extreem ‘gegevensrijk’ geworden

Mathematische modellen zijn niet nieuw in de moleculaire biologie. De theoretische biologie buigt zich al decennia lang over mathematische modellen voor biologische systemen. Het Journal of Theoretical Biology werd al in 1961 opgericht. De titels van sommige papers toen klinken merkwaardig modern: ‘Mathematical analysis of metabolism using an analogue computer’ of ‘Functional analysis of chemical systems in vivo using a logical circuit equivalent’. Tot voor kort werd de theoretische biologie beschouwd als een excentriek domein voor de wiskundige knobbels, waaruit weinig echt biologisch inzicht was voortgekomen. Nu echter beschikken we over massa’s voorheen onbeschikbare gegevens en over supersnelle computers. Realistischere modellen behoren tot de mogelijkheden. De beschikbaarheid van gegevens maakt het ook mogelijk om modellen te falsifiëren (in de popperiaanse betekenis), zodat we inaccurate modellen kunnen verwerpen en verfijnen (bij gebrek aan voldoende gegevens verliest modellering snel de biologische werkelijkheid uit het oog).

Systeembiologie doet echter meer dan alleen kwantitatieve modellen voor biologische processen ontwerpen. Zij beschouwt de cellen van een organisme in hun geheel, als een systeem. Een systeem is een samenstelling van onderling verbonden elementen die een verenigd geheel vormen. Die definitie suggereert meteen het hiërarchische perspectief dat een centraal kenmerk vormt van de systeembiologie. Een organisme kan worden gezien als een systeem van organen; een orgaan als een systeem van weefsels; een weefsel als een systeem van cellen; een cel als een systeem van organellen; een organel als een systeem van proteïnen, nucleotides en metabolieten. Ook aan het andere uiteinde van de schaal kunnen we een populatie zien als een systeem van individuele organismen en een ecosysteem als een systeem van populaties. In de thermodynamica wordt een systeem gedefinieerd als alle fysische entiteiten die binnen een arbitraire fysische of imaginaire grens vallen (voor de mens kunnen we bijvoorbeeld de huid en het slijmvlies als grens kiezen). Vertrekkend vanuit die definitie richt de analyse zich op de stromen van materie en energie die deze grens in beide richtingen kruisen (zoals voedsel, licht, straling en excreties) en tracht de complexiteit van het systeem te reduceren tot een eenvoudiger (dynamisch) model van de stromen (door het calorische evenwicht van een individu te bekijken). Als een dergelijke reductie mogelijk is, kunnen we spreken van een circuit dat een specifieke functie uitvoert. In ons geval bestaat zo’n reductie uit het ontwerpen van een kwantitatief model van specifieke biologische processen of moleculaire cascades waarin we ons organisme dan zien als een hiërarchie van circuits (die zelf ook weer samengesteld zijn uit subcircuits) die biologische functies uitoefenen op verschillende niveaus. Het hart is dan een circuit dat bloedstromen verwerkt; de bètacel een circuit dat glucose- en insulinestromen verwerkt. Zo’n hiërarchisch perspectief benadrukt het algemene dynamische gedrag van het systeem en ook dat dit gedrag emergent kan zijn. Het gedrag of de disfunctie van het systeem kan dus niet worden gereduceerd tot de toestand van een enkele component (zoals één gen of één proteïne). Multischalige regelmechanismen (zoals de hormonale regeling van het glucoseniveau) zijn goede voorbeelden van die emergentie. Andere voorbeelden zijn complexe storingen, zoals diverse kankers of degeneratieve ziektes.

Wat betekent het om een fenoneem op het systeemniveau te begrijpen? We kunnen de huidige taak van biologen vergelijken met hoe het voor Archimedes of Leonardo da Vinci zou zijn om de basisprincipes van een Airbus A380 te begrijpen vanuit een lijst met onderdelen (of erger nog vanuit een vliegtuigwrak). Begrijpen op systeemniveau impliceert ontdekken hoe het vliegtuig vliegt (draagkracht, zwaartekracht, voortdrijvende kracht, weerstand), hoe het wordt bestuurd (stampen, rollen, gieren), hoe de jetmotor werkt (compressie, verbranding, uitzetting, drijfkracht) of hoe de radar en radio werken. Ze zouden in eerste instantie de details moeten abstraheren uit de motorkleppen of de frequentieregelaar van de radio.

Meer verfijnde kwantitatieve modellen van biologische processen zou de ontwikkeling van biomedische toepassingen aanzienlijk versnellen

Systeembiologie houdt heel wat beloften in. Ten eerste zou de vergelijking van de genomen en van de interactienetwerken (proteïne-proteïne-interactie of transcriptionele regeling) in honderden organismen tot de ontdekking kunnen leiden van een belangrijke regelmatigheid die door de meeste organismen wordt gedeeld en de basis vormt van hun structuur op het systeemniveau. Al is nog niet duidelijk of zo’n nog niet-ontdekte wet van de biologie bestaat en wat die zou inhouden, toch vermoeden we dat die ons zou leren hoe genennetwerken evolueren tussen verwante organismen. Ten tweede zouden meer verfijnde kwantitatieve modellen van biologische processen de ontwikkeling van biomedische toepassingen aanzienlijk versnellen. Een voorbeeld hiervan is rationele medicijndoelwitselectie. Voor besmettingsziekten kan een beter begrip van het pathogeen als systeem leiden tot een betere selectie van doelwitten voor de therapie. Pathogenen (van hiv tot malaria) ontwikkelen snel weerstand tegen medicijnen. Een nieuw medicijn moet worden ontwikkeld telkens als het pathogeen resistent wordt tegen de bestaande farmaceutica. Een algemener begrip van het pathogeen kan helpen bij de selectie van een combinatie van doelwitten waarrond dynamische medicinale strategieën kunnen worden opgebouwd om het pathogeen permanent onder controle te houden. Dergelijke strategieën ontstaan ook empirisch in de behandeling van hiv. Voor degeneratieve ziekten kan een beter begrip van de menselijke fysiologie en pathologie leiden tot de selectie van medicijndoelwitten waarvan de behandeling optimaal bijdraagt tot het welzijn van de patiënt en tegelijkertijd slechts minimale ongewenste effecten produceert. Daarnaast wordt het ook gemakkelijker om bekende medicijnen doelgericht te hergebruiken voor andere indicaties of om medicijnencocktails in te zetten die tegelijk meerdere doelwitten viseren. Nog een voorbeeld is de verbetering in het optimaliseringsproces van drugskandidaten. Vele drugskandidaten falen in een laat (en duur) stadium van de klinische tests ten gevolge van toxische neveneffecten of onvoldoende effectiviteit. Mathematische modellen van hoe patiënten medicijnen opnemen, distribueren, metaboliseren en uitscheiden en hoe toxiciteit in patiënten precies optreedt, gecombineerd met modellen van de variabiliteit in medicijnrespons in patiëntenpopulaties, zullen de duurtijd en de kostprijs van medicinale ontwikkelingen aanzienlijk verminderen. Ten derde zal de biotechnologie voordeel halen uit algemene modellen van organismen die inzicht verschaffen over hoe die organismen kunnen worden behandeld om de gewenste industriële resultaten te bekomen (gaande van verbeterde opbrengst tot groene brandstoffen), en op die manier grotendeels komaf maken met de nog steeds dominante trial-and-errormethodes. Ten vierde is er de synthetische biologie, een spin-off van de systeembiologie, gericht op het bouwen van biologische circuits (of zelfs hele organismen) vanaf punt nul. Ze wil zowel bijdragen tot ons begrip van de biologie als biotechnologische toepassingen ontwikkelen.

Omdat de systeembiologie heel wat opwindende perspectieven biedt, zijn er diverse ambitieuze ondernemingen uit voortgekomen, zoals de talrijke globale celsimulatieprojecten (E-Cell en BioSPICE), het Physiome Project (met als ‘belangrijkste langetermijndoelstelling de kwantitatieve beschrijving van het menselijke organisme om tot een begrip te komen van fysiologie en pathofysiologie, en dit begrip te gebruiken om de menselijke gezondheid te bevorderen’), en allerlei tools die hele moleculaire cascades (of zelfs patiënten) simuleren voor farmaceutische doeleinden in een aantal beginnende bedrijven. Precies ook omwille van die hooggespannen verwachtingen moet men rekening houden met mogelijke valkuilen en realistische korte- en middellangetermijndoelstellingen formuleren die de onvermijdelijke terugslag wat temperen. De eerste waarschuwing is dat complexe systemen inherent moeilijk te begrijpen zijn. Over meer gegevens beschikken betekent dat vragen kunnen worden opgelost die vroeger onbeantwoord bleven, maar dit maakt het systeem niet plotsklaps transparant. De dynamiek van dergelijke systemen kan niet rechtstreeks worden voorspeld uit de dynamiek van hun componenten: het systeem is meer dan de som van zijn onderdelen. Enkele bekende voorbeelden van complexe systemen zijn de evolutie van roofdierprooipopulaties, turbulentiepatronen in een vloeistof of weermodellen. Die vertonen opmerkelijke gedragingen, gaande van oscilleringen tot chaos en patroonvorming. Mathematische modellen ontwerpen voor het dynamische gedrag van complexe systemen fascineert de beste wiskundigen en natuurkundigen al lang. Poincaré, Kolmogorov, Turing, Prigogine en vele anderen hebben belangwekkende bijdragen geleverd tot het begrijpen van complexe fenomenen in de twintigste eeuw. Dergelijke systemen ontleden blijft echter moeilijk tot op vandaag, ook al kan het systeem exact worden beschreven door middel van een handvol formules.

De simulatie van de neurofysiologie van C. elegans zou begrip opleveren van hoe eenvoudige dierenhersenen functioneren

De simulatie van de neurofysiologie van de microscopisch kleine worm C. elegans illustreert hoe moeilijk het is om complexe systemen te modelleren, zelfs als ze experimenteel al goed beschreven zijn. Die worm is een van de centrale modelsystemen in de moleculaire biologie omdat hij een piepklein transparant dier is (0,5 mm) dat makkelijk te manipuleren is in het labo en waarvan de studie belangrijke inzichten oplevert in de wijze waarop organismen zich ontwikkelen. Zijn lichaam bevat systematisch 959 somatische cellen, waarvan de ontwikkeling volledig beschreven is. Zijn hersenen bevatten precies 302 neuronen en een 7 000 synapsen. Ze zijn volledig in kaart gebracht en de neuronen zijn in 118 klassen geclassificeerd. De algemene fysiologie van de neuronen is vrij goed gekend, er zijn talrijke mathematische modellen voor beschikbaar en er is een gemotiveerde gemeenschap computationele neurowetenschappers ijverig in de weer met neuronale circuitmodellen. De volledige kaart van de C. eleganshersenen is al sinds 1986 beschikbaar. De simulatie van de neurofysiologie van C. elegans zou een diepgaand begrip opleveren van hoe eenvoudige dierenhersenen functioneren en het organisme besturen. Als we ooit de doelstellingen van een Human Physiome Project willen bereiken, zou de oplossing van dit probleem een erg belangrijke mijlpaal zijn. Toch hebben we nog steeds geen ‘virtuele C. elegans’ (of enig ander neuronaal model van die complexiteit). Ondanks de obstakels wordt toch vooruitgang geboekt in het modelleren van complexe biologische systemen. Zo is er nu bijvoorbeeld een elegant model beschikbaar van de celdeling bij (bananenbier)gist (S. Pombe) dat de dynamiek van dit fundamentele proces op een bevredigende en diepe manier verklaart – maar dit model brengt nog maar vijfentwintig proteïnen in kaart.

Een andere belangrijke reserve is dat het simuleren van een systeem niet voldoende is om het ook volledig te begrijpen. Zelfs als we beschikken over het volledige bekabelingsdiagram van onze airbus zouden we nog niet begrijpen hoe die werkt. Een systeem begrijpen betekent dat de essentiële principes die zijn gedrag bepalen, kunnen worden geformuleerd (het veronderstelt dus de mogelijkheid om een kwalitatieve beschrijving af te leiden uit de kwantitatieve beschrijving), en dan bij voorkeur op zo’n manier dat het gedrag van het systeem voorspelbaar kan worden gemanipuleerd of zelfs hertekend. Het model van celdeling in (bananenbier)gist is een goed voorbeeld van een dergelijk begrip omdat het het gedrag van het systeem verklaart en niet-triviale voorspellingen toelaat. Simulatie is ook op zich van groot belang omdat zij, zelfs als het systeem niet volledig begrepen is, toch het gedrag ervan kan voorspellen. Dit is onmisbaar voor alle toepassingen die bijsturingen van het systeem vereisen. Als een model echter slechts een ruwe benadering is van de biologische realiteit, kan de simulatie niet detecteren waar de leemten tussen het model en de gegevens precies liggen en kan zij geen betrouwbare richting aangeven voor verdere experimenten en verfijningen van het model.

Een cruciale vraag voor de systeembiologie is hoe men de kloof kan overbruggen tussen de gegevens van hogedoorvoergenomica en gedetailleerde mathematische modelleringen. Moleculaire biologen die haastig mathematische modellen bouwden, gaven zich er al gauw rekenschap van dat veel van de snelverwerkte gegevens te veel ruis bevatten en onvoldoende betrouwbaar waren om in laagniveaumodellen te gebruiken. Die gegevens kunnen wel dienen om te bepalen welke delen van het model deficiënt zijn en welke nieuwe variabelen moeten worden ingevoerd ter verbetering van het model. Meer specifieke gegevens kunnen dan dienen bij de eigenlijke inschatting van het model. De huidige modelleringstechnieken kunnen echter niet bevredigend met die problemen omgaan. Dit onderzoeksveld is nog grotendeels onontgonnen en vooruitgang is waarschijnlijk. Een vergelijkbaar probleem betreft de vaststelling dat meer complexe biologische systemen niet zomaar kunnen worden gemanipuleerd, hetzij om redenen van tijd en geld (in diermodellen) of om fundamentele ethische redenen (experimenten op de mens), zodat exhaustieve modellering (alle genen, alle interacties) onrealistisch is. In dit geval zijn verwante methodes vereist om de sleutelfactoren op de diverse hiërarchische niveaus (genotype, gen en proteïne, cel, orgaan) te ontdekken en te selecteren en vervolgens te integreren in bruikbare modellen. Een ander gebied voor opwindende methodologische ontwikkelingen is de mathematica van grootschalige biologische netwerken. Hoe vergelijken we netwerken? Hoe ontwaren we er patronen in? Hoe voorspellen we hun ontwikkeling?

Wat zal de nalatenschap van de systeembiologie zijn? Zij zal ertoe bijdragen om de snelheid aan te houden en op te voeren waarmee de biologie de voorbije vijftig jaar ontdekkingen heeft gedaan die geleid hebben tot grensverleggende toepassingen in de biotechnologie en de gezondheidszorg. Systeembiologie is echter niet zozeer een discipline (zij heeft geen specifiek onderzoeksobject) maar eerder een paradigma voor de moleculaire biologie. Zij zal dan ook spoedig worden opgenomen in het bredere bereik van de biologie. Haar impact op de manier waarop biologie wordt bedreven zal cataclysmisch zijn. De biologie heeft lang geleden onder een gespleten persoonlijkheid, met enerzijds genetici, phylogenetici, ecologen en theoretische biologen die intensief gebruik maken van mathematische modellering, en anderzijds moleculaire biologen die weinig neiging tot wiskunde vertonen. Omdat er nu zoveel gegevens zijn in de moleculaire biologie en omdat computationele en mathematische modellen een zo centrale rol spelen in het omgaan met die gegevens, kunnen we verwachten dat over tien tot twintig jaar een groot aantal moleculaire biologen meer tijd achter de computer zullen doorbrengen dan aan hun laboratoriumwerktafel.

Molecular Systems Biology: http://www.nature.com/msb/

‘Breakthroughs of the Year 2005’, in: Science, 2005, 23 december.

Yves Moreau is als ingenieur verbonden aan de KU Leuven.

Deel dit artikel
Gerelateerde artikelen