Inleiding
De Health of Nation Outcome Scales 1 is ontwikkeld in opdracht van het Engelse Ministerie van Volksgezondheid door de Royal College of Psychiatrists Research Unit (CRU) om de clinicus een instrument in handen te geven waarmee deze op eenvoudige, betrouwbare en valide wijze de geestelijke gezondheidstoestand en het sociaal functioneren van psychiatrische patiënten structureel en routinematig in kaart kan brengen. De HoNOS is het meest gebruikte beoordelingsinstrument in Engeland en Australië en blijkt gevoelig voor veranderingen in het toestandsbeeld bij de cliënten. In Engeland behoort dit instrument inmiddels tot de ‘minimum data set’ van de GGZ en het is daar mogelijk om een landelijk beeld te krijgen van de kenmerken van de cliënten die in behandeling zijn en van de veranderingen van hun psychiatrische problemen tijdens en na de geboden interventies. De HoNOS wordt ook in Nederland al veel gebruikt, vooral in de langdurende zorg. 2 Inmiddels zijn er voor uiteenlopende doelgroepen specifieke HoNOS-versies ontwikkeld, waaronder de HoNOS65+ voor de ouderenpsychiatrie. 3 De bruikbaarheid van de HoNOS65+ als een effectmaat in de ouderenpsychiatrie wordt in de Engelstalige literatuur als voldoende betrouwbaar gezien, met name als er aandacht wordt besteed aan training en supervisie van de beoordelaars. 4 Vooral voor bepaalde doelgroepen (zoals mensen met een psychose, kinderen, ouderen), die misschien niet altijd goed in staat zijn de vragenlijst zelf in te vullen, is de HoNOS een geschikt instrument om in Routine Outcome Assessment te worden opgenomen.
Vrijwel alle GGZ instellingen zijn momenteel bezig om Routine Outcome Assessment (ROA) protocollen te implementeren. ROA is een continue meetprocedure, die onderdeel uitmaakt van de dagelijkse klinische praktijk. Dat gebeurt met één of meer uitkomstmaten die met regelmatige tussenpozen worden gescoord. De zorgverzekeraars stimuleren de implementatie van ROA sinds kort sterk via financiële prikkels. Lentis, voorheen GGz Groningen, heeft zich ten doel gesteld om binnen een jaar alle afdelingen en alle patiënten die in zorg zijn aan een ROA-protocol te laten deelnemen. De beoogde hoofddoelen zijn de volgende:
- Inzicht verschaffen in het effect van de behandelingen. In welke mate verbeteren cliënten? Zien we hierin verschillen tussen verschillende cliëntcategorieën of afdelingen? Kunnen we die verschillen verklaren?
- Het verhogen van de kwaliteit van de behandelingen. Door de behandelaar de scores per cliënt te laten zien kan er meer rationeel beslist worden over voortzetting, aanpassing en afsluiting van de behandeling. Het zou bijvoorbeeld een eind kunnen maken aan ineffectieve langdurige behandelcontacten.
- Het meten van de zorgtevredenheid.
Binnen DIGNIS (de afdeling ouderenpsychiatrie van Lentis) is de implementatie van ROA reeds enkele jaren geleden van start gegaan binnen één van haar afdelingen (regio Oost in Winschoten). De enige effectmaat tot nu toe is de HoNOS65+. De afgelopen jaren wordt dit instrument gescoord bij elke nieuwe patiënt die in behandeling komt en tevens bij ontslag. Het proces van implementatie en de eerste resultaten werden reeds eerder door ons beschreven. 5 Wij concludeerden dat de HoNOS65+ een bruikbaar instrument is om de ernst van problemen te scoren op relevante levensgebieden binnen de ouderenpsychiatrie. Het meetinstrument werd door hulpverleners als bruikbaar en nuttig ervaren (acceptatie van het instrument), de interbeoordelaarsbetrouwbaarheid na training was goed (betrouwbaarheid van het instrument) en de gemiddelde somscore bleek significant te verschillen tussen de ambulante en klinische behandelsetting en tussen diagnostische categorieën (onderscheidend vermogen van het instrument). Een goede effectmaat moet daarnaast echter voldoende gevoelig zijn voor verandering. De toetsing daarvan beschrijven we in deze publicatie door de score bij de start van de behandeling te vergelijken met de score bij ontslag, bij 244 patiënten die gemiddeld zeven maanden in behandeling zijn geweest en waarbij de behandeling is afgesloten.
Methode
Setting
De afdeling ouderenpsychiatrie van Lentis werkt transmuraal en heeft zorg voor de inwoners boven de 65 jaar voor een gebied met ruim 85.000 inwoners, waarvan zo’n 15.000 inwoners de leeftijd hebben boven de vijfenzestig jaar. Er worden jaarlijks ruim 500 nieuwe cliënten aangemeld. Er is een klinische behandelafdeling met 24 bedden, een woonafdeling met ruim 90 bedden, een deeltijdbehandeling voor stemmingsstoornissen, vier contactpoli’s, lithiumpoli’s en samenwerkingsverbanden met diverse verzorgingshuizen.
Het instrument
De HoNOS65+ meet gedragsproblemen, symptomatologie en sociale problemen. De HoNOS65+ inventariseert twaalf deelgebieden: gedragsstoornissen, opzettelijke zelfverwonding, problemen met alcohol- of drugsgebruik, cognitieve problemen, problemen die verband houden met lichamelijke ziekte/handicap, problemen die gepaard gaan met hallucinaties en/of wanen (of onjuiste opvattingen), problemen met depressieve symptomen, andere geestelijke en gedragsproblemen, problemen met sociale of ondersteunende relaties, problemen met algemene dagelijkse levensverrichtingen, algemene problemen met woonomstandigheden, problemen met werk en vrijetijdsbesteding.
Elk item wordt op een vijfpunts-Likertschaal gescoord van 0 (geen probleem), 1 (licht; geen interventie), 2 (matig; interventie is gerechtvaardigd), 3 (vrij ernstig; actiepunt) tot 4 (zeer ernstig probleem; onmiddellijke actie). De behandelaren vullen de schaal in. Het invullen duurt vijf tot tien minuten wanneer alle gegevens bekend zijn. De gegevens van de patiënt van de afgelopen twee weken worden gebruikt om de schaal te scoren.
Patiënten
Van 1 januari 2005 tot 31 december 2007 zijn ruim 1200 HoNOS65+ formulieren ingevuld en verwerkt (er zijn ruim 1500 formulieren uitgezet, wat betekent dat de overige formulieren niet zijn ingevuld en/of niet verwerkt). Er waren 389 patiënten waarbij minimaal tweemaal een HoNOS65+ score aanwezig is, dit zijn 778 ingevulde HoNOS65+ formulieren. De overige ingevulde formulieren betreffen patiënten die nog in behandeling zijn. Daarbij kan de tweede meting ook een herhaalde meting zijn in een doorlopende behandeling, deze zijn dus niet meegenomen. De overige scores zijn patiënten die net met hun behandeling zijn begonnen en alleen een beginmeting hebben of patiënten die alleen een eindmeting hebben omdat ze al in behandeling waren toen er werd begonnen met de HoNOS65+. Bij 244 patiënten was de tweede meting de eindmeting behorende bij het afsluiten van de behandeling. De gemiddelde tijd tussen de eerste HoNOS65+ score en de tweede score is ruim zeven maanden. Deze groep patiënten hebben we hier geanalyseerd. De gemiddelde leeftijd van de groep onderzochte patiënten is 76 jaar (sd=15); 67% is vrouw, 33% is man. Van de 244 patiënten zijn 201 patiënten ambulant behandeld en 43 klinisch.
Statistische methode
De grootte van het verschil tussen de begin en de eindmeting is met behulp van de paarsgewijze t-test getoetst. Daarnaast werd de effectsize maat Cohens d berekend als het verschil tussen de eerste meting (M1) en de tweede meting(M2), gedeeld door de gepoolde standaarddeviaties van M1 en M2. Een effectsize tussen 0,5 en 0,8 wordt als matig sterk gezien, daarboven als sterk.
Om op individueel patientniveau een oordeel te kunnen vellen of er tussen twee meetmomenten wel of geen sprake is van verandering werd gebruik gemaakt van de Reliable Change index van Jacobsen & Truax, 6 die wordt berekend op basis van de betrouwbaarheid van de schaal en de standaarddeviatie van de eerste meting. Wij volgen echter het voorstel van Maassen, 7 die stelt dat de gepoolde standaarddeviatie van de eerste en de tweede meting de voorkeur verdient, zeker indien die nogal uiteen lopen. Voor zelfinvullijsten wordt in de regel de test-hertestbetrouwbaarheid als maat voor betrouwbaarheid genomen. Omdat de HoNOS65+ een klinisch beoordelingsinstrument is, is het echter vooral van belang de onderlinge overeenstemming tussen hulpverleners als maat voor betrouwbaarheid te gebruiken. Als maat voor betrouwbaarheid gebruiken wij de interbeoordelaarsbetrouwbaarheid. Om deze te schatten hebben 51 hulpverleners een video en twee papieren cases onafhankelijk van elkaar gescoord tijdens hun trainingssessie5. De interrater correlation coëfficiënt (ICC) van de totaalscore was 0,92.
Resultaten
De HoNOS 65+totaalscore.
Uit tabel 1 blijkt dat patiënten er, zowel in de klinische als in de ambulante setting, significant op vooruitgaan. Een effectsize boven 0,8 wordt als sterk beschouwd en op de grens van dat niveau ligt de gemiddelde effectsize over alle cliënten (d=0,84). De effectsize in de klinische setting is sterker dan in de ambulante setting.
Tabel 1 De gemiddelde totaalscore van de HoNOS65+ aan het begin van de behandeling en aan het eind van de behandeling per behandelsetting en per DSM-IV diagnose, Students paired t-test (tweezijdig getoetst) en Cohens d
beginscore HoNOS65+ | eindscore HoNOS65+ | gemiddelde verbetering | % betrouwbare verbetering | |||
(sd) | (sd) | (sd) | (RC index) | t | Cohens d | |
Totaal (n = 244)
Ambulant (n = 201) Klinisch (n = 43) |
11,7 (6,1)
10,5 (5,4) 17,5 (5,9) |
6,9 (5,3)
6,4 (4,8) 9,4 (6,8) |
4,8 (4,6)
4,1 (3,9) 8,1 (6,0) |
67
64 84 |
16,0*
14,4* 8,9* |
0,84
0,80 1,27 |
DSM-IV diagnose | ||||||
Stemmingsstoornissen (n = 68) | 10,7 (4,9) | 5,2 (4,2) | 5,5 (4,9) | 84 | 9,3* | 1,21 |
Psychotische stoornissen (n = 11) | 14,0 (9,4) | 8,7 (6,8) | 5,3 (4,3) | 73 | 9,3* | 0,65 |
Cognitieve functiest. (n = 62) | 13,5 (5,9) | 9,6 (5,6) | 4,0 (4,2) | 53 | 7,3* | 0,68 |
Overige (n = 103) | 11,0 (6,4) | 6,3 (5,1) | 4,7 (4,7) | 64 | 10,1* | 0,81 |
* p < 0,001
Reliable change
Wij beogen op basis van de RC index een eenvoudige richtlijn voor clinici af te leiden om te bepalen of een verandering voldoende substantieel is om niet aan toeval te kunnen worden toegeschreven. Dit komt in het algemeen neer op het aantal punten verbetering dat minimaal moet worden gehaald om van betrouwbare verbetering te kunnen spreken. Het is echter evident dat dit mede afhankelijk is van de beginscore. We hebben daarom de RC index berekend voor de 25% laagste begin scores (kleiner dan of gelijk aan 6), voor de 50% midden scores (scores tussen 6 en kleiner dan of gelijk aan 15) en voor de 25% hoogste scores (groter dan 15). Bij de lage scores vinden we een gepoolde standaarddeviatie van 1,8; voor de midden scores een gepoolde standaarddeviatie van 3,1 en voor de hoogste scores een gepoolde standaarddeviatie van 5,1. Wij veronderstellen dat de interbeoordelaarsbetrouwbaarheid voor alle scores gelijk is (ICC= 0,92). Op basis van deze gegevens is, naar boven afgerond, de RC = 2 voor lage scores, 3 voor midden scores en 4 voor hoge scores. Ter illustratie: dit betekent dat iemand met een beginscore van 5 en een eindscore van 3 betrouwbaar is verbeterd, maar iemand met een beginscore van 14 en een eindscore van 12 niet.
Tabel 1 laat zien dat er bij 67% van alle patiënten sprake is van betrouwbare verandering. Dit percentage is hoger bij opgenomen patiënten (84%).
Diagnostische hoofdcategorieën.
De patiënten zijn in vier DSM-IV-diagnosegroepen ingedeeld (stemmingsstoornissen, psychotische stoornissen, cognitieve functiestoornissen en overige stoornissen). De paarsgewijze t-toets analyse laat zien dat alle vier diagnosegroepen significant vooruit gaan op de totale HoNOS65+ score (zie tabel 1). De effectsize is sterk voor stemmingsstoornissen (d=1,21) en in mindere mate ook voor overige stoornissen (onder deze groep vallen de patiënten met sociale problemen). De effectsize voor psychotische stoornissen en cognitieve stoornissen is lager. Het percentage betrouwbare verandering laat eveneens zien dat stemmingsstoornissen meer verbeteren (84%) dan de andere stoornissen.
HoNOS65+ schalen.
De paarsgewijze t-toets laat voor alle schalen een significante verbetering zien (zie tabel 2). De effectsize van de subschaal depressieve klachten is sterk (d=0,81). De overige subschalen laten een matige effectsize zien. Wanneer gekeken wordt naar de clusters van subschalen; 2 gedragstoornissen (1 tot en met 3), de beperkingen (4 en 5), de symptomen (6 tot en met 8) en het sociale functioneren (9 tot en met 12) dan is er een sterke effectsize op de symptomen (d=0,79) en een redelijke tot matige effectsize (0,62) op het sociaal functioneren.
Discussie
Effectmeting in de ouderenpsychiatrie gebeurt nog nauwelijks binnen Nederland. Het gebruik van door ouderen zelf in te vullen vragenlijsten lijkt geen haalbare kaart, vanwege de mogelijk verminderde toepasbaarheid en betrouwbaarheid, en daarom is een klinische beoordeling van het functioneren de aangewezen weg. De HoNOS65+ is voor dit doel ontworpen, in het Nederlands vertaald en vrij beschikbaar. De gemiddelde totaalscore op de HoNOS65+ , van de gehele groep waarbij we een beginmeting hebben en een eindmeting komt overeen met de vorige gegevens die we eerder hebben gepresenteerd. 5 Om geschikt te zijn als effectmaat van behandeling, is gevoeligheid voor verandering essentieel. Eerder hebben we al laten zien dat de betrouwbaarheid, het onderscheidingsvermogen en de acceptatie door hulpverleners aanvaardbaar zijn. 5 Uit deze studie blijkt ook de gevoeligheid voor verandering voldoende aanwezig. Er is een beperkt aantal studies beschikbaar waarmee onze resultaten kunnen worden vergeleken. In Australië hebben Spear en anderen HoNOS65+ scores bij intake en ontslag vergeleken van 149 patiënten die ambulant of klinisch werden behandeld. 7 Zij rapporteren een gemiddelde totaalscore van 12,7 bij de intake en een score van 7,1 bij ontslag. Onze scores waren respectievelijk 11,7 en 6,9. Wij vinden een vergelijkbare mate van verbetering. Ook Spear en anderen trokken uit deze bevinding de conclusie dat het instrument voldoende gevoelig is voor verandering. 8
Cheung & Strachan rapporteerden HoNOS65+ scores van een groep van 29 patiënten met een cognitieve functiestoornis en een groep van 101 patiënten met een psychiatrische stoornis in een acute psychogeriatrische setting in Nieuw-Zeeland. 9 Beide groepen gingen significant vooruit op de gemiddelde totale HoNOS65+ score. De patiënten met een cognitieve functiestoornis verbeteren van 16,5 naar 12,3 en de patiënten met een psychiatrische stoornis van 14,0 naar 8,8. Op subschaal niveau blijkt dat deze patiënten vooral winst boekten op de gedragsproblemen naast de psychiatrische stoornissen. 9 De patiënten in onze studie boeken vooral winst op de schaal voor depressieve symptomen.
De Reliable Change index is nog niet eerder op de HoNOS65+ toegepast. Wij beogen daarmee een eenvoudige richtlijn te verschaffen voor het beoordelen van verschilscores op dit instrument. Daarbij differentiëren wij tussen lage (scores kleiner dan 6), midden (scores tussen 6 en 15) en hoge scores (scores boven de 15), waarbij respectievelijk 2, 3 en 4 punten verschil een betrouwbare verandering indiceert. We zien dit als een eerste aanzet. Onderbouwing door meer onderzoek is noodzakelijk.
Een mogelijk beperking van onze studie is dat behandelaren de score positief zouden kunnen beïnvloeden. Bij ontslag zouden ze een lagere score kunnen opgeven om zodoende een grotere vooruitgang te kunnen laten zien. De behandelaar had echter geen inzage in de eerste score, wat de waarschijnlijkheid van een objectieve registratie van psychiatrische problemen bij de tweede meting vergroot.
Een tweede beperking is dat wij alleen de patiënten in het onderzoek hebben betrokken waarvan de begin- en de eindscore bekend waren. Dit zijn patiënten die hun behandeling hebben afgerond. Daarnaast is er een groep die langdurig of permanent in behandeling blijft. In die groep zal niet of nauwelijks sprake zijn van verbetering. Voor een deel zal de tendens eerder een achteruitgang zijn. Onze resultaten hebben dus een beperkte generaliseerbaarheid die zich beperkt tot de groep patiënten die na de behandeling worden ontslagen en geen langdurige zorg behoeven.
De auteurs bedanken alle hulpverleners die hebben bijgedragen aan het verzamelen van data voor dit onderzoek.