Deel dit artikel

het huidige beoordelingsmodel voor wetenschappelijk onderzoek laat zich – zeker in de menswetenschappen – te vaak sturen door bibliometrische overwegingen. hoewel traditionele publicaties vaak slecht een fractie vormen van een meer omvattende informatie-infrastructuur, blijft de bijdrage van een onderzoeker aan die infrastructuur door het ontwikkelen van tools en dataverzamelingen, of het bieden van technische dienstverlening, veelal ondergewaardeerd. een beleid waarin deze inspanningen ook effectief worden gevaloriseerd is dringend nodig.

De vrije hand.
De valorisatie van digitaal onderzoek in de menswetenschappen

Tom Willaert, Demmy Verbeke, Fred Truyen

Het groeiende belang van ‘digital humanities’ – met die term worden de vele diverse vormen van onderzoek en onderwijs benoemd die zich situeren op het kruisvlak tussen mens- en computerwetenschappen – brengt onder de aandacht dat het ontwikkelen van tools en datasets nauwelijks wordt gevat in het huidige model om wetenschappelijk onderzoek te beoordelen. Zeker in de menswetenschappen, waar dergelijk onderzoek in een papieren context heel hoog aangeschreven stond, lijkt eenzelfde appreciatie in een digitale context compleet zoek. De reden is het huidige beoordelingsmodel dat gefundeerd is op publicatie, waarbij het toekennen van financiering of academische promotie gestuurd wordt door bibliometrische overwegingen (zoals het aantal publicaties of tijdschriftrankings). Zelfs als deze bibliometrische overwegingen minder bepalend zijn in de conclusies van beoordelingscommissies dan onderzoekers zelf veronderstellen, sturen ze wel het publicatiegedrag en de wijze waarop aan onderzoek wordt gedaan (of althans welk deel van dat onderzoek als belangrijk wordt beschouwd). Traditionele verklaringen hiervoor zijn het prestige dat wordt toegeschreven aan gevestigde uitgevers of tijdschriften, en de meetbaarheid en (veronderstelde) objectiveerbaarheid van publicatiegedrag. Die suprematie van de publicatie weegt zwaar door in de menswetenschappen, hoewel dat onderzoek veel meer omvat dan alleen het produceren van boeken en artikels.

Aan de basis van succesvolle onderzoeksprojecten liggen vaak het aanleggen van grote tekstcorpora of bronverzamelingen en het ontwikkelen van digitale publicatie- en analysetools

Aan de basis van succesvolle onderzoeksprojecten liggen immers vaak het aanleggen van grote tekstcorpora of bronverzamelingen en het ontwikkelen van diverse digitale publicatie- en analysetools (zoals bijvoorbeeld Trismegistos voor papyrologisch en epigrafisch onderzoek en Cornelia voor kunsthistorisch onderzoek – zie http://www.trismegistos.org en http://maptap.be). Dergelijke instrumenten en de technische dienstverlening die ermee gepaard gaat, kunnen een grote impact hebben die een specifiek onderzoeksthema overstijgt en werkzaam is binnen of zelfs buiten de discipline. Bovendien vervaagt bij de creatie van deze instrumenten het onderscheid tussen ‘data’ en ‘output’, aangezien data zo gepresenteerd worden dat men ze kan beschouwen als een waardevol product van onderzoek (en deze data dus niet alleen aan het begin, maar ook aan het einde van de onderzoekscyclus geplaatst kunnen worden). Denk hierbij bijvoorbeeld aan het ontsluiten van allerlei tekstueel en visueel materiaal in databanken (wat steeds gepaard gaat met selectie en interpretatie) of de verrijking van bibliothecair erfgoedmateriaal door het opstellen van elektronische edities. Traditionele publicaties vormen met andere woorden hoogstens een fractie van een meer omvattende informatie-infrastructuur, maar de bijdrage van een onderzoeker aan deze infrastructuur door het ontwikkelen van tools en dataverzamelingen of het bieden van technische dienstverlening blijft veelal ondergewaardeerd, zeker in de menswetenschappen.

Een eenvoudig voorbeeld van dit gebrek aan erkenning is terug te vinden in de beoordeling van doctoraal onderzoek. Vele doctorandi besteden een significant deel van hun tijd aan het verzamelen van nieuwe data of het gieten van oudere data in een nieuwe, digitale vorm. Toch blijft het zwaartepunt van de beoordeling van hun onderzoek liggen bij het zogenaamde ‘eindproduct’ van deze activiteit: een dissertatie die later moet worden omgewerkt tot een boekpublicatie bij een wetenschappelijke uitgever. Zowel bij doctoraal onderzoek als later in een academische carrière is het bovendien vaak zo dat de data of tools die centraal staan in het onderzoek alleen op de computer van de onderzoeker zelf bewaard worden, met het risico dat ze bij afronding van een project verloren gaan. Het besef van dit probleem is intussen voldoende toegenomen en heeft ertoe geleid dat nogal wat universiteiten bij nieuwe projecten een ‘research data management plan’ eisen. Onderzoekers worden van bij het begin van het traject verplicht om de duurzaamheid van de te verzamelen data in overweging te nemen, zodat die ook bij afronding van het project beschikbaar en toegankelijk blijven voor verder onderzoek (al blijven de eventueel ontwikkelde tools zoals de zoekinterface van een databank wat in de kou staan). Het invoeren van dergelijk ‘research data management’ zorgt er eveneens voor dat meer en meer academische bibliotheken aangezocht worden als partners in duurzame digitale bewaring. Research data management is er echter in de eerste plaats op gericht om het werk van onderzoekers te stroomlijnen, samenwerkingsverbanden aan te moedigen en vervolgonderzoek mogelijk te maken. Wat nog ontbreekt, is een beleid waarin deze inspanningen ook effectief worden gevaloriseerd. Het data management plan op zich brengt namelijk geen erkenning voor de onderzoeker met zich mee. Het zorgt er wel voor dat de data toegankelijk blijven, maar zegt niet noodzakelijk iets over de voorwaarden van hergebruik, laat staan over de persoonlijke valorisatie voor de onderzoeker.

Research data management is erop gericht om het werk van onderzoekers te stroomlijnen, samenwerkingsverbanden aan te moedigen en vervolgonderzoek mogelijk te maken

Dat laatste is eigenlijk een verrassende vaststelling, gezien de lange onderzoekstraditie binnen de menswetenschappen met betrekking tot het ontwikkelen van tools en datasets. De oorzaak schuilt in de digitale omslag. Vanuit historisch oogpunt is het onderscheid tussen data (i.e. de gegevens die men verzamelt), tools (de instrumenten waarmee die gegevens geanalyseerd worden) en gepubliceerde ‘output’ een recente uitvinding. Verschillende disciplines binnen de menswetenschappen hebben zich in de negentiende eeuw kunnen ontwikkelen door zich toe te spitsen op het verzamelen van data en het ontwikkelen van instrumenten. Activiteiten zoals het aanleggen van archieven, het tekenen van kaarten, het compileren van woordenboeken en thesauri, of het verzorgen van tekstedities waren belangrijke expertises die als volwaardig onderzoek werden gehonoreerd. Meer zelfs: vaak verleende het opstellen van een toonaangevend woordenboek, een invloedrijke cataloog of een bepalende teksteditie de hoogste vorm van wetenschappelijke prestige.

Dezelfde onderzoeksactiviteiten bekleden wel degelijk nog steeds een centrale plaats binnen het menswetenschappelijke onderzoek, maar zijn getransformeerd door het gebruik van nieuwe technologieën. Onder de koepel van ‘digital humanities’ creëren onderzoekers databanken en digitale corpora, situeren ze hun data op kaarten via GIS (geographic information systems) en maken ze geavanceerde digitale tekstedities. Vaak gaat men bovendien een stap verder en zet men digitale tools in om niet alleen traditionele methoden sneller en efficiënter toe te passen, maar ook om onderzoek mogelijk te maken dat tot voor kort onmogelijk was (denk bijvoorbeeld aan de geautomatiseerde thematische analyse van grote tekstcorpora). Daarbij moet men zich hoeden voor een wat naïeve opvatting over de relatie tot deze data en het onderzoek. Zo zijn databanken niet zomaar een ‘kopie’ van de bronnen. Ze bevatten niet alleen het ‘ruwe materiaal’, waar dan uiteindelijk het onderzoek op gebeurt. De data zijn zelf het resultaat van onderzoek. Ze zijn onvermijdelijk een interpretatie van de bronnen volgens geijkte procedures en standaarden. Overleg over deze procedures en standaarden vormt een intrinsiek onderdeel van dit soort onderzoek. Digital humanities omvat bovendien een (media)kritisch apparaat dat onderzoekers in staat stelt om de implicaties van het gebruik van bepaalde tools voortdurend te bevragen. Het eigenlijke bouwen van een technisch framework voor onderzoek is namelijk veel eenvoudiger dan goed te begrijpen wat je moet bouwen, voor wie, en hoe het gebruik van deze technologie doorheen de tijd zal veranderen. Over de implementatie en valorisatie van onderzoeksinfrastructuur moet met andere woorden strategisch worden nagedacht, en daarbij is het vaak moeilijk om in te schatten hoe de situatie vandaag is, laat staan hoe ze in de toekomst zal zijn. In ieder geval heeft digital humanities de debatten rond het statuut van ‘bouwen’ of ‘maken’ als legitieme vorm van onderzoek terug aangewakkerd.

Voor menswetenschappers kan het om twee redenen onaannemelijk lijken om datasets en tools als publicaties te beschouwen. Ten eerste verschillen deze instrumenten qua vorm en inhoud sterk van traditionele artikelen of monografieën, zelfs als die elektronisch worden uitgegeven. Een databank kan bijvoorbeeld wel een bepaalde wereldvisie weerspiegelen, maar deze vertelvorm werkt anders dan de expliciete argumentatie die wordt opgebouwd in een wetenschappelijk artikel. Bovendien zijn digitale artefacten zoals databanken minder stabiel dan gedrukte publicaties: ze worden voortdurend uitgebreid of aangepast en fouten kunnen naar believen worden gecorrigeerd. Ten tweede vragen digitale projecten ook om een andere benadering van auteurschap, aangezien ze bijna per definitie steunen op (interdisciplinaire) samenwerkingsverbanden. Het is daardoor ook niet altijd even duidelijk wie welke bijdrage exact geleverd heeft. Kortom, op het eerste gezicht is het niet duidelijk wat beweerd wordt, noch door wie. Maar dat is een kwestie van afspraken, van procedures. Het is wel degelijk mogelijk om ook in databanken duidelijk(er) te maken wie verantwoordelijk is voor welke bijdrage, en waar het onderscheid zit tussen analytische data en observatiedata. Het vraagt echter de verdere ontwikkeling van digitale werkmethoden en referentieregels.

Digitale projecten vragen ook om een andere benadering van auteurschap, aangezien ze bijna per definitie steunen op (interdisciplinaire) samenwerkingsverbanden

Een logische benadering voor de problematiek van valorisatie bestaat erin naast louter traditionele bibliometrische gegevens ook andere indicatoren mee te nemen. Een dergelijke aanpak vinden we in de zogenaamde ‘altmetrics’, waarbij ook de impact van onderzoeksresultaten verspreid via andere media (blogs, nieuwsberichten, sociale media, bookmarks in citatiesoftware zoals Mendeley …) in kaart wordt gebracht. In afwachting van een (meer of minder radicale) ommezwaai in de beoordelingscriteria zijn er ook manieren te bedenken om digitaal onderzoek toch te vatten met de bestaande bibliometrische middelen. Onderzoekers kunnen bijvoorbeeld de duurzaamheid van hun digitale productie verzekeren door verstandig gebruik te maken van de infrastructuur die wordt opgezet in het kader van research data management. Duurzame archivering staat toe om stabiele identificatie te verzekeren. Zo kunnen ISSN of ISBN-nummers worden toegevoegd aan websites of databanken, of DOI’s (digital object identifiers) toegekend worden aan presentaties en blogberichten. Het beschikbaar stellen van datasets hoeft ook niet te impliceren dat de citeerbaarheid ervan afneemt – integendeel. Er is wel een mentaliteitswijziging noodzakelijk die stelt dat het even stringent is om een dataset en de betrokken verantwoordelijke(n) bij gebruik ervan te citeren (zoals men dat bij traditionele publicaties doet), alsook om een stabiele vorm van citeren mogelijk te maken (door het voornoemde gebruik van DOI’s of ISSN/ISBN-nummers). Dit kan worden gestimuleerd door citatie op te nemen in de gebruiksvoorwaarden van de dataset en/of deze beschikbaar te stellen samen met een beschrijving ervan (die men bij gebruik van de dataset moet citeren). Vanuit het standpunt van de bibliotheekprofessional of informatiewetenschapper gaat het hier uiteindelijk om het verder uitwerken van metadatastandaarden en verwijzingsprotocols, waarbij het collaboratief werk op gemeenschappelijke infrastructuren en met gedeelde datasets fijnmaziger in beeld wordt gebracht.

Papieren publicaties en hun elektronisch uitgegeven tegenhangers domineren vandaag de verspreiding en beoordeling van menswetenschappelijk onderzoek. Dit essay is geen pleidooi tegen dergelijke publicaties, die doorgaans inherent waardevol zijn. Wel vestigen we de aandacht op een grote groep alternatieve activiteiten en praktijken die steeds fundamenteler worden voor het hedendaagse onderzoek. Het is daarom nodig onze definities van wetenschappelijke ‘output’ (en bij uitbreiding ‘impact’) te verbreden en ook de ontwikkeling van tools, datasets en de bijbehorende technische dienstverlening mee te laten doorwegen bij de evaluatie van onderzoek en onderzoekers. Dat er nog grote uitdagingen schuilen in de uitbouw van een duurzame ondersteunende infrastructuur voor digitale projecten lijdt geen twijfel, maar dit mag niet verhinderen dat onderzoekers nu al concrete stappen kunnen zetten om hun data en tools op intelligente manieren te managen zodat ze ook kunnen meetellen bij evaluatie. Bibliotheekprofessionals en informatiewetenschappers kunnen onderzoekers en onderzoeksgroepen bijstaan om de benodigde procedures en protocols te ontwikkelen die correcte referentie en evidentiële basis mogelijk maken binnen de gewijzigde onderzoekscontext, zoals ze dat nu vaak al doen bij het ontwikkelen van standaarden voor metadata. Het uitwerken van datamanagementplannen met het oog op de actuele realiteit van wetenschappelijke productie is een ideale gelegenheid om deze samenwerking tussen bibliotheek en onderzoek in de menswetenschappen verder te verdiepen.

Christine L. Borgman, Big Data, Little Data, No Data. Scholarship in the Networked World (Londen en Cambridge: MIT Press, 2015).

Fred Truyen is verbonden aan Culturele Studies (KU Leuven), Demmy Verbeke is bibliothecaris (KU Leuven), Tom Willaert is verbonden aan Digital Humanities (KU Leuven).

Deel dit artikel
Gerelateerde artikelen