Inleiding
Veroudering wordt geassocieerd met een afname van het volume van de hersenen, met name van de corticale grijze stof. Verschillende studies naar normale veroudering rapporteren een forse grijzestofatrofie in frontale, pariĆ«tale en mediaal temporale gebieden. 1 , 2 , 3 , 4 Er wordt daardoor algemeen aangenomen dat krimp van de cortex past bij het normale verouderingsproces. Resultaten uit een recente studie ā die wij onlangs publiceerden in het tijdschrift Neuropsychology – wijzen er echter op dat dit model van het krimpende brein misschien niet helemaal juist is. 5 Deze studie laat zien dat de prevalentie van grijzestofatrofie bij gezonde veroudering wellicht wordt overschat. Deze conclusie heeft alles te maken met de manier waarop proefpersonen aan hersenverouderingsstudies doorgaans worden geĆÆncludeerd.
In dergelijke studies is het gebruikelijk om āongezondeā proefpersonen bij aanvang van de studie uit te sluiten van deelname. Dit gebeurt meestal op basis van een korte medische of cognitieve screening. Exclusie vindt zelden plaats op basis van een uitgebreid neuropsychologisch onderzoek, en al helemaal niet op basis van longitudinaal neuropsychologisch onderzoek waarbij wordt nagegaan of er in de loop van de tijd zich niet toch een cognitieve stoornis heeft ontwikkeld. Immers, herhaalde neuropsychologische metingen zijn nodig om zeker te weten of proefpersonen cognitief gezond zijn en ook blijven. Een eenmalige meting van de cognitieve status is vaak onvoldoende om in een preklinische fase neurodegeneratieve ziekte te detecteren. Het is daarom waarschijnlijk dat studies naar gezonde veroudering die slechts eenmalig de cognitieve status vaststellen ook mensen zullen includeren met een preklinische vorm van dementie. 2 , 6 Vooral bij hoog opgeleide proefpersonen is de kans vrij groot op een fout-negatieve uitslag bij de screening. Er zijn aanwijzingen dat preklinische patiĆ«nten met dementie op grote schaal geĆÆncludeerd worden in hersenverouderingsstudies. Zo schat Sliwinski et al. dat 20 procent van de deelnemers in studies naar gezonde veroudering preklinisch dement zijn. 7 De vraag is daarom of de op groepsniveau gemeten corticale grijzestofatrofie daadwerkelijk een afspiegeling is van het normale verouderingsproces.
In dit artikel wordt door middel van een voorbeeld beschreven welk effect selectiebias kan hebben op ons model van het verouderende brein. Allereerst wordt een korte samenvatting gegeven van onze studie uit 2009. 5 Vervolgens wordt de wetenschappelijke discussie beschreven die volgde op de publicatie van deze studie. Tot slot wordt in meer algemene zin ingegaan op de gevolgen van een selectiebias bij verouderingsonderzoek.
Publicatie Burgmans et al. (2009): āThe prevalence of cortical gray matter atrophy may be overestimated in the healthy aging braināā
De belangrijkste vraag van onze studie was: Wordt de prevalentie van grijzestofatrofie bij gezonde ouderen overschat door een selectiebias? Om een antwoord te krijgen opa deze vraag selecteerden wij 88 deelnemers aan de Maastricht Aging Studie (MAAS), een grote longitudinale studie naar determinanten van cognitieve veroudering. 8 Van alle proefpersonen werd een uitgebreid neuropsychologisch onderzoek afgenomen bij aanvang (t0), en opnieuw na drie jaar (t3) en na 6 jaar (t6). Na 9 jaar (t9) werd een medische vragenlijst afgenomen en werd gescreend op de diagnose dementie. Op t3 kregen alle proefpersonen een MRI scan om het volume van de grijze stof te bepalen.
Figuur 1 geeft een overzicht van de inclusie van proefpersonen en de metingen die verricht zijn. Deelnemers die de diagnose dementie kregen binnen 6 jaar na het scannen werden weggelaten in de analyse. Bovendien werd een aantal proefpersonen geĆ«xcludeerd wegens bewegingsartefacten op de scan of neuroanatomische abnormaliteiten. Uiteindelijk werden twee groepen proefpersonen met elkaar vergeleken. Groep 1 bestond uit 35 proefpersonen (gemiddelde leeftijd op t0 = 69,1 jaar; SD = 7,7; bereik = 49,3 ā 79,3) die cognitief gezond waren en gĆ©n achteruitgang vertoonden op het neuropsychologisch onderzoek tussen t0 en t3. Deze groep had gĆ©n dementie op t9. Van deze groep waren 28 personen (gemiddelde leeftijd op t0 = 71,4 jaar; SD = 7,9; bereik = 52,3 ā 82,0) op t6 nog steeds cognitief gezond, 7 personen voldeden op t6 wel aan onze criteria van cognitieve achteruitgang. Groep 2 bestond uit 30 proefpersonen (gemiddelde leeftijd op t0 = 69,2 jaar; SD = 8,1; bereik = 50,0 ā 81,0) die wĆØl substantiĆ«el cognitief achteruit gingen tussen t0 en t3; d.w.z. ze scoorden minstens 3 punten minder op de MMSE, Ć²f bereikten op t3 een MMSE van 24 of lager, Ć²f scoorden 30% lager op minstens twee van de zes belangrijkste taken uit het neuropsychologisch onderzoek. Deelnemers in groep 2 vertoonden dus een vrij forse cognitieve achteruitgang die als atypisch beschouwd kan worden voor gezonde veroudering en waarvan het cognitieve profiel verdacht is voor preklinische cognitieve pathologie.
Groep 1 en groep 2 verschilden alleen op het gebied van cognitieve prestaties, er was geen verschil in leeftijd, geslacht, opleiding, intracranieel volume en cardiovasculair risicoprofiel. Van alle deelnemers werd het volume van de grijze stof gemeten in verschillende hersengebieden (zie Figuur 2). Tabel 1 (zie downloads) toont de resultaten van de statistische analyse. De cognitief gezonde deelnemers (groep 1) lieten op geen van de gemeten hersengebieden een leeftijdseffect zien, behalve in de hippocampus. Echter, als de 7 mensen uit de analyse werden weggelaten die op t6 voldeden aan onze criteria van cognitieve achteruitgang, dan verdween het leeftijdseffect in de hippocampus. Dit wil zeggen dat bij deelnemers die zowel 3 jaar vĆ³r het scannen als 3 jaar nĆ” het scannen cognitief gezond waren geen enkel significant leeftijdseffect gemeten werd. In tegenstelling tot groep 1, liet groep 2 (de deelnemers met cognitieve achteruitgang) wĆØl een significant leeftijdseffect zien, en wel op alle gemeten volumina van hersengebieden.
Samengevat vonden wij bij cognitief gezonde ouderen gĆ©n leefijdseffect in de gemeten hersengebieden, en bij ouderen met substantiĆ«le cognitieve achteruitgang wĆØl een leeftijdseffect in alle gebieden. Deze resultaten suggereren dat grijzestofatrofie in de hersenen niet zozeer geassocieerd is met het ouder worden, maar met substantiĆ«le cognitieve achteruitgang. Met andere woorden, zolang mensen cognitief gezond blijven, is er mogelijk geen tot weinig grijzestofatrofie in de gemeten hersengebieden. Dus niet het normale verouderingsproces, maar pathologische processen die forse cognitieve achteruitgang veroorzaken zijn mogelijk verantwoordelijk voor corticale atrofie. Het leeftijdseffect dat gemeten werd in eerdere studies naar gezonde veroudering zou dus mogelijk overschat kunnen zijn, omdat in deze studies geen mensen werden geĆ«xcludeerd met substantiĆ«le atypische cognitieve achteruitgang of een preklinische vorm van dementie.
De discussie die volgde
De publicatie van de resultaten van deze studie leverde veel reacties op. In 2010 verschenen twee artikelen in hetzelfde tijdschrift Neuropsychology waarin commentaar werd gegeven door Raz en Lindenberger en door Fjell en anderen. 9 Daarnaast verschenen er enkele commentaren op het Alzheimer Research Forum van Fox, Ridgeway en Scheltens. Bovendien ging er een persbericht uit van het tijdschrift waardoor de bevindingen werden gerapporteerd in enkele kranten, websites en radio. We zullen de belangrijkste commentaren hier bespreken.
EĆ©n van de belangrijkste kritiekpunten die werden aangedragen is het feit dat in onze studie de neuropychologische data weliswaar longitudinaal zijn, maar de MRI scans slechts op Ć©Ć©n moment in de tijd gemaakt werden. We konden daarom geen daadwerkelijke achteruitgang van het volume meten. Een studie met longitudinale MRI data is dus nodig om met zekerheid te kunnen zeggen wat de relatie is tussen leeftijd en corticale krimp. Zowel Fjell et al. (2010) als Raz & Lindenberger (2010) beschikten over een dergelijk longitudinaal databestand. Naar aanleiding van onze studie selecteerden zij een groep proefpersonen uit hun longitudinaal databestand die over de tijd heen cognitief stabiel bleven. Beide onderzoeksgroepen vonden een afname van grijzestofvolume in hun āgezondeā groep. Zij concludeerden daarom dat er wel degelijk atrofie is van de grijze stof bij gezonde ouderen en dat preklinische pathologische processen niet verantwoordelijk zijn voor hersenkrimp. Hoewel dit aannemelijk klinkt, zijn er toch enkele kanttekeningen te plaatsen bij de cognitieve screening van beide studies.
Raz & Lindenberger (2010) hebben gĆ©Ć©n uitgebreide neuropsychologische screening gedaan om hun ācognitief gezondeā proefpersonen te selecteren. Zij selecteerden 10 ācognitief gezondeā proefpersonen op basis van de Cattell IQ, een IQ-test die gevoelig is voor het effect van veroudering. Deze test is echter niet ontworpen om een preklinisch neuropathologisch ziektebeeld te detecteren. Fjell et al. (2010) selecteerden 21 āgezondeā proefpersonen uit het databestand van de Alzheimer’s Disease Neuroimaging Initiative (http://www.adni-info.org). Hierbij is wĆØl uitgebreid neuropsychologisch onderzoek gedaan waarvan de uitkomsten zijn meegenomen in de selectie van de proefpersonen. Echter, de follow-up-periode van de cognitieve metingen bedroeg slechts 2 jaar, wat een vrij korte periode is gezien de vaak langzame progressie bij neurodegeneratieve aandoeningen. Dus ook in de studies van Fjell et al. (2010) en Raz & Lindenberger (2010) bestaat er een aanzienlijke kans dat er deelnemers met een preklinische cognitieve aandoening geĆÆncludeerd zijn.
Ook bij de longitudinale MRI-papers die Scheltens noemt op het Alzheimerforum 11 , 12 zijn niet de strenge inclusiecriteria gebruikt die wij voor onze gezonde proefpersonen konden toepassen. Het is echter van belang om hier stil te staan bij wat de definitie is van ānormale verouderingā. De vraag die door zowel Scheltens, Fox als Raz & Lindeberger werd gesteld was: representeert de āgezondeā groep uit onze studie eigenlijk wel normale veroudering? Hoort cognitieve achteruitgang dan niet bij normale veroudering? Dit blijft een discussiepunt, want er bestaat geen strikte grens tussen normale veroudering en pathologische veroudering. In onze studie is er voor gekozen om proefpersonen te excluderen waarvan wij het cognitieve profiel verdacht vonden voor preklinische cognitieve pathologie. Gezonde proefpersonen mochten dus hooguit minimaal achteruitgegaan zijn op cognitieve tests, maar zeker niet substantieel (zie boven). Hiermee hebben wij een groep gecreĆ«erd die waarschijnlijk vrij is van een onderliggend neurodegeneratief proces. Maar we hebben hier wellicht ook een groep gecreĆ«erd met āextreem gezonde ouderenā die niet representatief zijn voor de gemiddelde oudere populatie.
Hoewel de bovenstaande discussiepunten zeker van belang zijn, veranderen zij de conclusies van onze studie niet. Immers, hoe ānormale verouderingā ook gedefinieerd wordt, het blijft zeer waarschijnlijk dat personen met een preklinische neurodegeneratieve aandoening geĆÆncludeerd zullen worden als er geen strenge inclusiecriteria worden gehanteerd. Dit kan leiden tot een overschatting van de mate van grijzestofatrofie bij normale veroudering.
Selectiebias bij onderzoek naar veroudering
Ons onderzoek demonstreert dat de wijze van selectie en inclusie van proefpersonen zeer bepalend is voor de uiteindelijke resultaten van verouderingsonderzoek. Deze vaststelling is natuurlijk al veel langer een centraal thema binnen dit veld. 13 Zo is algemeen bekend dat in cross-sectioneel verouderingsonderzoek geobserveerde leeftijdseffecten beĆÆnvloed kunnen worden door een a priori selectie van deelnemers: meer capabele, hoger opgeleide en gezondere deelnemers zullen immers eerder voor dergelijk onderzoek beschikbaar zijn. Dit heeft tot gevolg dat er een onderschatting van de verondersteld āwareā leeftijdseffecten kan optreden. Longitudinaal onderzoek naar veranderingen in leeftijdgerelateerde variabelen (zoals cognitie) wordt eveneens beperkt, weliswaar weer door andere bronnen van verstoring, zoals selectieve uitval. Hierdoor kan eveneens de validiteit van uitspraken over de aard van leeftijdgerelateerde veranderingen aangetast worden. Het blijft daarom altijd zinvol om kritisch de effecten van selectie binnen deelnemers aan verouderings- (of beter: ontwikkelings-)onderzoek te benoemen en te bespreken.
Zo zal een strenge gezondheidsselectie in een normeringsonderzoek naar de voorspellende waarde van een cognitief screeningsinstrument voor een cognitieve stoornis algemeen genomen niet erg nuttig zijn wanneer de doelgroep van de screening juist personen bevat die gekenmerkt worden door een gezondheidsbeperking. Anderzijds, wanneer een onderzoeksvraag op dezelfde data gaat over de leeftijdstrend in cognitieve prestaties bij mensen die cognitief gezond zijn, dan kan het gebruik van prospectief verzamelde cognitieve screeningsinformatie een zuiverder schatting van het ware verloop opleveren. In figuur 3 werd de gemiddelde prestatie op een geheugentest (uitgestelde herinnering van geleerde woorden op de standaard woordenleertaak) 14 onderzocht in de volledige groep van MAAS-deelnemers ouder dan 48 jaar op baseline (N=1.029), gecorrigeerd voor het bestaan van een cognitieve stoornis na 9 jaar follow-up. De groep die later een diagnose dementie zal krijgen blijkt duidelijk (en significant) onder de prestatie van de rest van de groep te blijven en geeft daarmee een negatieve bijdrage aan de gemiddelde cognitieve prestatie van de totale groep.
Tot slot
In de praktijk zal screening op (voortekenen van) pathologische cognitieve veranderingen zeer lastig en vaak niet haalbaar zijn. Een uitputtende cognitieve follow-up met adequate diagnostiek van pathologie is niet alleen tijdrovend maar ook erg kostbaar, waardoor in studies waarin dit eigenlijk nodig zou zijn een dergelijke screening toch achterwege blijft. In geval van een eenmalige screening of korte herhaalde screeningsperiode zal er gebruik gemaakt moeten worden van surrogaatmarkers, zoals lage cognitieve prestatie, aanwezigheid van cerebrovasculaire ziekte, bepaalde genetische kenmerken (Apo-E4) en dergelijke. Selectiebias is daardoor nagenoeg onvermijdelijk en de richting van een effect ervan zal middels een zorgvuldige wetenschappelijke beschouwing slechts benaderd kunnen worden.