Tijdschrift voor Evidence-Based Medicine



De valkuilen van subgroepanalyses


  • 0
  • 0
  • 0
  • 0



Minerva 2006 Volume 5 Nummer 10 Pagina 154 - 154



Als clinici vragen we ons af of de resultaten van klinische trials van toepassing zijn op onze eigen patiënten. Kunnen we hetzelfde effect verwachten bij al onze patiënten die aan de inclusiecriteria van een studie voldoen? Of is het effect verschillend voor subgroepen van patiënten? Aan de hand van die informatie kunnen we immers de behandeling voorbehouden aan die patiënten die de meeste baat hebben bij de interventie. In veel studies met grote onderzoekspopulaties rapporteren de auteurs daarom ook resultaten van subgroepanalyses. Een voorbeeld is de CHARISMAstudie (1,2), waarin men geen voordeel zag van een behandeling met de combinatie van clopidogrel plus aspirine versus aspirine alleen in de totale onderzoekspopulatie. Maar in de subgroepanalyse vond men wel een effect bij mensen die een cardiovasculair incident hadden doorgemaakt (en niet bij mensen met belangrijke risicofactoren zonder cardiovasculair incident). Evenzo stelde men in de GAIT-studie in de totale onderzoekspopulatie van patiënten met gonartrose geen effect vast van glucosamine en chondroïtine op de pijn. In een analyse van de subgroepen volgens ernst van de pijn vond men wel een voordeel bij patiënten met matige tot ernstige pijn (3,4).

 

Die bevindingen kunnen we niet meteen naar de praktijk vertalen. We moeten voorzichtig blijven bij het interpreteren en gebruiken van resultaten van subgroepanalyses. De uitkomsten moeten namelijk aan een aantal belangrijke voorwaarden voldoen. Ten eerste moeten de subgroepanalyses ingebouwd zijn in het protocol van een studie. Alleen op die manier kan men ervoor zorgen dat de randomisatie bewaard blijft en de groepen groot genoeg zijn. Tevens moet men duidelijk beschrijven waarom men een subgroepanalyse doet en waarom men verwacht dat het effect verschillend zal zijn voor specifieke groepen patiënten (5,6). De observatie in de ISIS-2-studie dat aspirine bij patiënten na een myocardinfarct alleen effectief is bij personen die onder een specifiek teken van de dierenriem zijn geboren, illustreert hoe belangrijk het toeval is bij dergelijke analyses. Daarnaast is het belangrijk dat de power van de studie is afgestemd op de geplande subgroepanalyses (6). Zoals de auteurs in commentaren bij de genoemde studies opmerken, moeten we conclusies op basis van subgroepanalyses altijd met enige reserve bekijken (7,8,9). Om het resultaat op een studie-eindpunt statistisch significant te noemen, eisen we over het algemeen een p-waarde <0,05. De kans dat het gevonden resultaat aan toeval te wijten is, moet dus kleiner zijn dan 5%. Voor de resultaten van subgroepanalyses moeten we veel strenger zijn. Het toeval speelt daar immers een veel grotere rol (5,6). Dat auteurs daar niet altijd rekening mee houden, blijkt uit de CHARISMA-studie (1). In de subgroep van patiënten met een bestaande cardiovasculaire pathologie is het relatieve risico van een nieuw ernstig cardiovasculair incident 0,88 (95% BI 0,77 tot 0,998; p=0,046). Dat lijkt statistisch significant, maar is het niet! De grens voor statistische significantie ligt in subgroepanalyses bij een veel lagere pwaarde. Men moet de algemeen aanvaarde grens van 5% delen door het product van het aantal subgroepanalyses en het aantal eindpunten dat men evalueert (7,10,11). Als men er, zoals in deze studie, 20 uitvoert, is het resultaat pas significant bij een p-waarde van 0,0025 (9). Die drempel is lager dan de gevonden p-waarde (0,046). Het effect in deze subgroep van de CHARISMA-studie mag dus niet significant genoemd worden.

 

In veel gevallen worden subgroepen pas ingedeeld bij het analyseren van de studie. Dergelijke post-hocanalyses moeten met nog meer reserve bekeken worden. Statistische toetsen zijn dan niet betrouwbaar en eventuele significantie heeft geen enkele betekenis (11). Subgroepanalyses zijn aantrekkelijk en kunnen voor de kliniek ook belangrijke praktische informatie geven, maar ze kunnen ons ook misleiden. De resultaten ervan moeten we de juiste waarde toekennen: ze beschouwen als zuiver hypothesevormend.

 

P. Chevalier en M. van Driel


Literatuur
  1. Bhatt D, Fox K, Hacke W, et al. Clopidogrel and aspirin versus aspirin alone for the prevention of atherothrombic events. N Engl J Med 2006;354:1706-17.
  2. Chevalier P. Clopidogrel plus aspirine versus aspirine alleen in cardiovasculaire preventie. Minerva 2006;5(5):76-9.
  3. Clegg D, Reda D, Harris C, et al. Glucosamine, chondroitin sulfate, and the two in combination for painful knee osteoarthritis. N Engl J Med 2006;354:795-808.
  4. Chevalier P. Glucosamine en/of chondroïtine voor gonartrose? Minerva 2006;5(9):148-50.
  5. Parker A, Naylor D. Subgroups, treatment effects, and baseline risks: some lessons from major cardiovascular trials. Am Heart J 2000;139:952-61.
  6. Rothwell PM. Subgroup analysis in randomised controlled trials: importance, indications, and interpretation. Lancet 2005;365:176-86.
  7. Lagakos S. The challenge of subgroup analyses – Reporting without distorting. N Engl J Med 2006;354:1667-9.
  8. Pfeffer MA, Jarcho JA. The charisma of subgroups and the subgroups of CHARISMA. N Engl J Med 354:1744-5.
  9. Hochberg M. Nutritional supplements for knee osteoarthritis – Still no resolution. N Engl J Med 2006;354:858-60.
  10. Assmann S, Pocock S, Enos L, Kasten L. Subgroup analysis and other (mis)uses of baseline data in clinical trials. Lancet 2000;355:1064-9.
  11. Yusuf S, Wittes J, Probstfield J, Tyroler H. Analysis and interpretation of treatment effects in subgroups of patients in randomized clinical trials. JAMA 1991;266:93-8.

 

 

De valkuilen van subgroepanalyses

Auteurs

Chevalier P.
médecin généraliste

van Driel M.
Vakgroep Huisartsgeneeskunde en Eerstelijnsgezondheidszorg, UGent

Woordenlijst

subgroepanalyse


Commentaar

Commentaar