Abstract

De term ‘multivariate analysis’ wordt vaak gebruikt wanneer men het heeft over een multivariabele analyse. Multivariaat’ impliceert echter een statistische analyse met meerdere uitkomsten. Een multivariabele analyse daarentegen is een statistisch instrument om de relatieve bijdragen van verschillende factoren aan één gebeurtenis of uitkomst te bepalen. Het doel van dit artikel is zich te concentreren op analyses waarbij meerdere voorspellers in aanmerking worden genomen. Een dergelijke analyse staat in contrast met een univariabele (of “eenvoudige”) analyse, waarbij enkele voorspellende variabelen in aanmerking worden genomen. We bespreken de basisprincipes van multivariabele analyses, welke aannames eraan ten grondslag liggen en hoe ze moeten worden geïnterpreteerd en geëvalueerd.

© 2013 S. Karger AG, Basel

Inleiding

De termen ‘multivariate analyse’ en ‘multivariabele analyse’ worden vaak door elkaar gebruikt in medisch en gezondheidswetenschappelijk onderzoek. Multivariate analyse verwijst echter naar de analyse van meerdere uitkomsten, terwijl multivariabele analyse telkens slechts één uitkomst behandelt.

Zoals duidelijk uit de titel blijkt, richten wij ons op multivariabele, en niet op multivariate, analyse. Multivariabele analyse is een statistisch hulpmiddel om de relatieve bijdrage van verschillende oorzaken aan een enkele gebeurtenis of uitkomst te bepalen. Zo zijn er factoren die in verband worden gebracht met de ontwikkeling van cerebrovasculaire aandoeningen, waaronder familiegeschiedenis van beroerte, hogere leeftijd, hoge bloeddruk (BP), diabetes, overgewicht, verhoogd cholesterolgehalte, interventies en roken van sigaretten . Multivariabele analyse stelt ons in staat de onafhankelijke bijdrage van elk van deze risicofactoren (verklarende variabelen) tot de ontwikkeling van de ziekte (responsvariabele) te bepalen. Met andere woorden, het risico van een uitkomst kan worden gewijzigd door andere risicovariabelen of door hun interacties, en deze effecten kunnen worden beoordeeld door middel van multivariabele analyse.

In dit artikel laten wij de clinicus kennismaken met de verschillende multivariabele analyses die voortvloeien uit het gebruik van verschillende meetschalen voor de uitkomst en geven wij een gedetailleerde beschrijving van de veronderstellingen achter elk type multivariabele analyse. We bespreken ook hoe de verschillende multivariabele analyses worden geïnterpreteerd, met enkele illustratieve voorbeelden.

Rol van confounders

De relatie tussen een gebeurtenis (of uitkomstmaat) en een risicofactor kan worden verstoord door andere variabelen. Confounding treedt op wanneer de schijnbare associatie tussen een risicofactor en een uitkomst wordt beïnvloed door de relatie van een derde variabele met de risicofactor en met de uitkomst (fig. 1).

Fig. 1

Relatie tussen risicofactor en uitkomst (bovenste paneel). Het vermogen van multivariabele analyse om tegelijkertijd de onafhankelijke bijdrage van een aantal risicofactoren aan het resultaat te beoordelen, is belangrijk wanneer er sprake is van “confounding” (verwarring) (onderste paneel). Confounding treedt op wanneer het schijnbare verband tussen een risicofactor en een uitkomst wordt beïnvloed door de relatie van een derde variabele (confounder) met de risicofactor en de uitkomst.

http://www.karger.com/WebMaterial/ShowPic/169434

Een variabele kan geen confounder zijn als zij een stap is in de causale keten of het causale pad. Matig alcoholgebruik verhoogt bijvoorbeeld het serumgehalte aan hogedichtheid-lipoproteïnen, dat op zijn beurt het risico op een beroerte verlaagt. In deze context is het gehalte aan hogedichtheid-lipoproteïnen een stap in deze causale keten, en geen confounder die moet worden gecontroleerd.

Een eenvoudige en praktische techniek om confounding te beoordelen en te elimineren is gestratificeerde analyse. Gestratificeerde analyse meet het effect van een risicofactor op het resultaat terwijl een andere variabele constant wordt gehouden.

Als voorbeeld, beschouw de relatie tussen hypertensieve doelorgaanbeschadiging en het risico van een beroerte . Met gegevens uit de Progetto Ipertensione Umbria Monitoraggio Ambulatoriale (PIUMA) studie kunnen wij illustreren hoe een gestratificeerde analyse kan worden uitgevoerd. In het bijzonder testen wij de associatie van linkerventrikel (LV) hypertrofie op ECG met het risico van cerebrovasculaire gebeurtenissen. De ruwe percentages van beroerte tussen hypertensieve personen zonder of met LV hypertrofie waren 0,56 voorvallen × 100 patiëntjaren in de eerste groep en 1,46 voorvallen × 100 patiëntjaren in de tweede groep. Bij de univariabele overlevingsanalyse geeft de aanwezigheid van LV hypertrofie bij ECG een verhoogd risico op toekomstige cerebrovasculaire voorvallen (HR 2,37; 95% CI 1,69-3,32; p < 0,0001).

De systolische bloeddruk is echter een potentiële confounder, omdat deze is geassocieerd met zowel LV hypertrofie als cerebrovasculaire aandoeningen. Daarom vergelijken we de prognostische impact van LV hypertrofie afzonderlijk bij patiënten met hypertensie met een systolische bloeddruk onder en boven de mediaan (152 mm Hg). De ruwe percentages van beroerte en het risico van cerebrovasculaire aandoeningen zijn groter bij hypertensieve patiënten met LV hypertrofie in vergelijking met die zonder LV hypertrofie, zowel bij patiënten met een systolische bloeddruk lager dan 152 mm Hg als hoger dan 152 mm Hg. Stratum-specifieke HRs (2.84 voor patiënten met systolische BP ≤152 mm Hg en 1.86 voor patiënten met systolische BP >152 mm Hg) verschillen sterk van de HR berekend voor de gehele populatie (2.34), wat aangeeft dat er confounding is door systolische BP.

Bedenk dat andere variabelen de relatie tussen LV hypertrofie en het risico van beroerte kunnen beïnvloeden. In het bijzonder kunnen verschillende gestratificeerde analyses aantonen dat het effect van LV hypertrofie op beroerte niet alleen wordt beïnvloed door systolische bloeddruk, maar ook door leeftijd, geslacht en diabetes.

Om te stratificeren naar twee variabelen (bijvoorbeeld systolische bloeddruk en geslacht), moeten we het verband tussen LV hypertrofie en beroerte beoordelen in vier groepen (mannen met systolische bloeddruk ≤152 mm Hg, mannen met systolische bloeddruk >152 mm Hg, vrouwen met systolische bloeddruk ≤152 mm Hg en vrouwen met systolische bloeddruk >152 mm Hg). Als we diabetes als variabele toevoegen aan de vorige gestratificeerde analyse, hebben we acht groepen.

Voor elke stratificatievariabele die we toevoegen, nemen we het aantal subgroepen toe waarvoor we individueel moeten beoordelen of het verband tussen LV hypertrofie en beroerte standhoudt, en we kunnen in sommige van deze subgroepen een ontoereikende steekproefgrootte hebben, zelfs als we met een grote steekproefgrootte zijn begonnen. Multivariabele analyse ondervangt deze beperkingen en stelt ons in staat om gelijktijdig de impact van meerdere onafhankelijke variabelen op het resultaat te beoordelen.

Gemeenschappelijke typen multivariabele analyse

Multivariabele analyses worden veel gebruikt in observationele studies van de etiologie, interventiestudies (gerandomiseerd en niet-gerandomiseerd), studies van de diagnose en studies van de prognose . De meest gebruikte soorten multivariabele analyse in klinisch onderzoek zijn lineaire regressie, logistische regressie en proportionele hazard regressie (Cox).

Lineaire regressie wordt gebruikt met continue (zoals BP) uitkomsten, terwijl logistische regressie wordt gebruikt met binaire uitkomsten (bijv. LV hypertrofie, ja vs. nee). Proportionele hazards (Cox) regressie wordt gebruikt wanneer de uitkomst de verstreken tijd tot een voorval is (bv. tijd van baseline evaluatie tot beroerte voorval).

Multivariabele lineaire regressie is een methode die wordt gebruikt om het lineaire verband tussen een afhankelijke variabele en een of meer onafhankelijke variabelen te modelleren. De afhankelijke variabele wordt soms ook de predictand genoemd, en de onafhankelijke variabelen de predictoren. De onderliggende veronderstelling van meervoudige lineaire regressie is dat, naarmate de onafhankelijke variabelen toe- of afnemen, de gemiddelde waarde van de uitkomst lineair toe- of afneemt.

Een regressieanalyse is gebaseerd op kleinste-kwadraten en het model is zo geschikt dat de som der kwadraten van verschillen tussen waargenomen en voorspelde waarden wordt geminimaliseerd. In een multivariabel model wordt de regressiecoëfficiënt voor elke variabele geschat door het model aan de gegevens aan te passen en te corrigeren voor andere variabelen in het model. Met andere woorden, een multivariabele regressieanalyse geeft voorspellingen op basis van het gecombineerde voorspellende effect van voorspellers.

Om de kracht van een lineair regressiemodel voor het voorspellen van de uitkomst te beoordelen, kan de aangepaste R2 worden gerapporteerd. De waarde van R2 varieert van 0 tot 1 en, vermenigvuldigd met 100, kan R2 worden beschouwd als het percentage van de variantie in de uitkomst dat door de onafhankelijke variabelen wordt verklaard. In een model met een R2 dicht bij 1, voorspellen de afhankelijke variabelen samen nauwkeurig de uitkomst.

Een recente analyse van postmenopauzale hypertensie uit onze groep illustreerde hoe een multivariabele lineaire regressieanalyse kan worden uitgevoerd. Wij testten de onafhankelijke associatie van neutrofielenaantal, een marker van chronische ontsteking, met polsdruk (PP), een erkende marker van atherosclerose en risicofactor voor cardiale en cerebrovasculaire gebeurtenissen.

Omdat de lineaire combinatie van leeftijd, serumglucosespiegels en ECG Cornell-spanning een goede voorspeller was van PP in een multivariabel model (model 1; tabel 1), werd de onafhankelijke associatie van neutrofielenaantal met PP getest na aanpassing voor de invloed van deze factoren. Met name in dit multivariabele model (model 2; tabel 1) bleef de associatie tussen PP en neutrofielenaantal significant na correctie voor de significante invloed van deze confounders.

Tabel 1

Multivariabele lineaire regressieanalyses om de onafhankelijke relatie tussen polsdruk en andere klinische variabelen te testen

http://www.karger.com/WebMaterial/ShowPic/169436

Binaire logistische regressie schat de waarschijnlijkheid van een uitkomst en modelleert hoe die waarschijnlijkheid verandert bij een verandering in de voorspellende variabelen. De basisaanname is dat elke toename van een eenheid in een voorspeller de kans op de uitkomst met een bepaalde factor vermenigvuldigt en dat het effect van meerdere variabelen het vermenigvuldigingsproduct is van hun afzonderlijke effecten. De logistische functie levert een uitkomstkans op die begrensd is door 0 en 1. Het centrale wiskundige concept dat ten grondslag ligt aan logistische regressie is de logit (de natuurlijke logaritme van een odds ratio). Het eenvoudigste voorbeeld van een logit vloeit voort uit een 2 × 2 contingentietabel.

Bekijkt u eens dezelfde gegevens uit de PIUMA-studie, waarin de associatie van LV hypertrofie met het risico van beroerte werd beoordeeld. De verdeling van een binaire uitkomstvariabele (beroerte, ja vs. nee) wordt gekoppeld aan een dichotome voorspellende variabele (LV hypertrofie, ja vs. nee). De resultaten suggereren dat patiënten met LV hypertrofie bij baseline evaluatie 2.58 keer meer kans hebben, dan patiënten zonder LV hypertrofie, om een beroerte te ontwikkelen. De odds ratio is afgeleid van twee odds en de natuurlijke logaritme ervan is een logit, die gelijk is aan 0,95. De waarde van 0,95 is de regressiecoëfficiënt van de logistische regressie. De antilogaritme van de regressiecoëfficiënt is gelijk aan de odds ratio voor een toename met één eenheid van de voorspeller. In het geval van continue verklarende variabelen kunnen de eenheden van verandering worden gespecificeerd (bijv. 10-mm Hg toename in BP) waarvoor de odds ratio wordt geschat.

Omdat systolische BP een confounder is voor de associatie met zowel LV hypertrofie als cerebrovasculaire ziekte, modelleren we een multivariabele logistische regressie met LV hypertrofie en systolische BP als voorspellers. Na correctie voor de significante invloed van systolische bloeddruk, is de aanwezigheid van LV hypertrofie nog steeds geassocieerd met een verhoogd risico op beroerte (OR 1,98, 95% CI 1,37-2,86; p < 0,0001).

Proportionele hazards modellen gaan ervan uit dat de verhouding van de hazards voor personen met en zonder een bepaalde risicofactor de constante is over de gehele studieperiode . Dit staat bekend als de proportionaliteitsveronderstelling en is het voornaamste aandachtspunt bij de aanpassing van een Cox-model. Deze veronderstelling houdt in dat de overlevingsfuncties elkaar niet kruisen en dat de verklarende variabelen alleen op de hazard ratio inwerken. Een voordeel van een proportionele hazard-analyse is dat ze proefpersonen met verschillende follow-up-duur omvat. Een proefpersoon die aan het eind van de studie de uitkomst van belang niet heeft meegemaakt, wordt als gecensureerd beschouwd. De antilogaritme van de proportionele hazards regressiecoëfficiënt is gelijk aan het relatieve gevaar voor een toename van de voorspeller met één eenheid. In het geval van continue verklarende variabelen biedt de meeste moderne software de mogelijkheid de eenheden van verandering te specificeren (b.v. 10-mm Hg stijging van de bloeddruk) waarvoor de aangepaste hazard ratio wordt geschat.

Neem bijvoorbeeld een studie naar het verband tussen regressie van LV hypertrofie en het risico van beroerte . Person-time analysis demonstrated that hypertensive subjects with lack of regression or new development of LV hypertrophy had a markedly increased rate of stroke when compared with subjects who never developed LV hypertrophy or with regression of LV hypertrophy (1.16 vs. 0.25 × 100 patients per year; p = 0.0001).

Het onafhankelijke effect van seriële veranderingen in LV hypertrofie werd getest met een multivariabel Cox-model. Andere geteste confounders waren ambulante 24-uurs systolische bloeddruk, leeftijd, geslacht (mannen, vrouwen), body mass index, diabetes (nee, ja), totaal cholesterol, serum triglyceriden, familiegeschiedenis van hart- en vaatziekten (nee, ja), rookgewoonten, type antihypertensieve behandeling bij het follow-up bezoek, en statinebehandeling bij het follow-up bezoek. In de multivariabele analyse was het risico op cerebrovasculaire voorvallen 2,8 maal hoger (95% CI 1,18-6,69) in de subgroep met gebrek aan regressie of nieuwe ontwikkeling van LV-hypertrofie dan in die met LV-hypertrofie regressie of aanhoudend normale LV-massa. Een dergelijk effect was onafhankelijk van leeftijd en 24-uurs systolische BP bij het follow-up bezoek (tabel 2).

Tabel 2

Onafhankelijke voorspellers van cerebrovasculaire voorvallen in de PIUMA-studie

http://www.karger.com/WebMaterial/ShowPic/169435

Cox’s semiparametrische model, omdat het geen verdeling van het uitgangsrisico veronderstelt, staat ook tijdsafhankelijke verklarende variabelen toe. Een verklarende variabele is tijdafhankelijk als de waarde ervan in de loop van de tijd verandert. U kunt bijvoorbeeld een tijdsafhankelijke variabele gebruiken om het effect te modelleren van personen die van behandelingsgroep of blootstellingsstatus veranderen. Of u kunt tijdsafhankelijke variabelen opnemen, zoals bloeddruk, die in de loop van een onderzoek met de tijd variëren.

Hoeveel variabelen in een model?

Een veelvoorkomend probleem bij regressieanalyse is de selectie van variabelen. Wanneer het effect van een risicofactor wordt onderzocht, kunnen verschillende correcties voor andere factoren verschillende of zelfs verwarrende conclusies opleveren. Een methode voor de selectie van variabelen is een manier om een bepaalde reeks voorspellers te selecteren voor gebruik in een regressiemodel, of het kan een poging zijn om een “beste” model te vinden wanneer er verschillende kandidaat-voorspellers zijn. De beslissing over wat moet worden aangepast, moet worden ingegeven door een a priori theoretisch of biologisch verband tussen de verschillende factoren en de uitkomst . Omgekeerd wordt het aantal variabelen in een model vaak verkregen door “bivariate screening” of door gebruik te maken van geautomatiseerde procedures voor variabelenselectie, zoals voorwaartse, achterwaartse, of stapsgewijze selectie. Bij bivariate screening wordt eerst gekeken naar alle bivariate relaties met de afhankelijke variabele, en worden alle relaties die significant zijn in een hoofdmodel opgenomen. Helaas is dit meestal niet voldoende. Wegens de correlaties tussen de verklarende variabelen kan een variabele weinig uniek voorspellend vermogen hebben, vooral wanneer het aantal voorspellers groot is. Geautomatiseerde procedures bepalen de volgorde waarin de voorspellende variabelen volgens statistische criteria in het model worden opgenomen. Bij voorwaartse selectie worden variabelen één voor één in het model opgenomen in een volgorde die wordt bepaald door de sterkte van hun associatie met de criteriumvariabele. Het effect van de toevoeging van elke variabele wordt beoordeeld bij de invoering ervan, en variabelen die geen significante bijdrage leveren aan het welslagen van het model worden uitgesloten. Bij achterwaartse selectie worden alle voorspellende variabelen in het model ingevoerd. De zwakste voorspellende variabele wordt dan verwijderd en de regressie wordt herberekend. Indien het model hierdoor significant wordt verzwakt, wordt de voorspellende variabele opnieuw in het model opgenomen, zo niet wordt hij verwijderd. Deze procedure wordt vervolgens herhaald totdat alleen nog bruikbare voorspellende variabelen in het model overblijven. Bij stapsgewijze selectie worden afwisselend voorwaartse en achterwaartse selecties uitgevoerd, waarbij variabelen worden toegevoegd en verwijderd die voldoen aan de statistische criteria voor toevoeging of verwijdering, totdat een stabiele reeks variabelen is bereikt. Indien de toevoeging van de variabele bijdraagt tot het model, wordt zij behouden, maar alle andere variabelen in het model worden vervolgens opnieuw getest om te zien of zij nog steeds bijdragen tot het succes van het model. Indien zij niet langer een significante bijdrage leveren, worden zij verwijderd. Deze methode bepaalt theoretisch de kleinst mogelijke set van voorspellende variabelen die in het uiteindelijke model worden opgenomen.

Resultaten van stapsgewijze regressie zijn gevoelig voor schendingen van de veronderstellingen die aan de regressie ten grondslag liggen. Meer in het algemeen kan willekeurig gebruik van variabelenselectieprocedures leiden tot modellen met een vertekende selectie van variabelen, onbetrouwbare coëfficiënten en onnauwkeurige voorspellingen.

Hoewel er weinig consensus bestaat over de beste methoden om variabelen te selecteren, wordt het gebruik van sommige methoden over het algemeen afgeraden, zoals het in- of uitsluiten van variabelen op basis van univariabele analyse. Wij stellen eenvoudige vuistregels voor de selectie van verklarende variabelen voor: neem een voldoende aantal voorspellers op om het model bruikbaar te maken voor theoretische en praktische doeleinden en om een goede voorspellende kracht te verkrijgen. Sluit variabelen niet uit louter op grond van een nominaal niet-significante associatie of omdat zij, mogelijk door toeval, in de specifieke steekproef niet voorspellend zijn. Het toevoegen van variabelen met weinig voorspellend vermogen heeft nadelen. Overbodige variabelen leiden meestal niet tot een verbetering van de model fit-waarden omdat zij niet bijdragen tot de algemene voorspelling. Om collineariteit te voorkomen, is het nuttig dat de verklarende variabelen gecorreleerd zijn met de responsvariabele, maar onderling niet sterk gecorreleerd zijn.

De ‘stopregel’ voor het opnemen of uitsluiten van voorspellers is een brandende vraag bij modelselectie. Naast het standaard significantieniveau voor het toetsen van hypothesen (α = 0,05) is ook het gebruik van het Akaike’s Information Criterion (AIC) en het Bayesian Information Criterion (BIC) zeer populair. AIC en BIC vergelijken modellen op basis van hun geschiktheid voor de gegevens, maar bestraffen de complexiteit van het model, d.w.z. het aantal vrijheidsgraden. AIC vereist dat de toename in model χ2 groter is dan twee maal de vrijheidsgraden. Wanneer bijvoorbeeld een voorspeller met 1 vrijheidsgraad, zoals geslacht, in aanmerking wordt genomen, betekent dit dat de χ2 van het model groter moet zijn dan 2. BIC bestraft de geschiktheid van het model zodanig dat de χ2 van het model groter moet zijn dan het aantal voorspellers vermenigvuldigd met de logaritme van de effectieve steekproefgrootte, bijvoorbeeld het aantal gebeurtenissen in een Cox survivalmodel. Modellen met een lagere AIC en/of BIC genieten gewoonlijk de voorkeur.

Ten slotte kunnen enkele hints worden gegeven met betrekking tot het aantal kandidaat-voorspellers dat op betrouwbare wijze kan worden bestudeerd in verhouding tot de steekproefgrootte. Een bekende vuistregel is de 1 op 10 of 1 op 20 regel. Voor lineaire modellen suggereert deze regel dat 1 kandidaat-voorspeller kan worden bestudeerd voor elke 10 of 20 patiënten. Voor logistische of Cox-modellen is de 1 op 10 regel eerder oppervlakkig tenzij er een volledig voorgespecificeerde set predictoren is. Bovendien mag niet uit het oog worden verloren dat de power en de validiteit van een multivariabele overlevingsanalyse eerder verband houden met het aantal outcome events in vergelijking met het aantal kandidaat-voorspellers (d.w.z. de effectieve steekproefgrootte) dan met het aantal deelnemers (totale steekproefgrootte). Wij stellen de 1 op 20 regel voor voor deze modellen met een beperkte reeks vooraf gespecificeerde voorspellers en de 1 op 50 regel voor stapsgewijze selectie. In een studie met 60 patiënten die een “outcome event” (60 voorvallen) op 3.000 blootgestelden ondergingen, konden volgens de 1 op 20-regel dus slechts 3 vooraf gespecificeerde voorspellers betrouwbaar worden bestudeerd. Wanneer de regel wordt overtreden, is het aantal kandidaat-voorspellers in het algemeen te groot voor de dataset, en treedt bijna onvermijdelijk overfitting op.

Overfitting

Wat is overfitting? Het principe van parsimony of het scheermes van Occam dicteert het gebruik van modellen die alles bevatten wat nodig is voor de modellering, maar niets meer dan dat. Als een eenvoudiger model statistisch niet te onderscheiden is van een complexer model, dicteert parsimony dat we de voorkeur moeten geven aan het eenvoudiger model. Bijvoorbeeld, als een regressiemodel met 3 voorspellers volstaat om de uitkomst te verklaren, dan moeten niet meer dan deze voorspellers worden gebruikt. Bovendien, als het verband kan worden gevat door een lineaire functie in deze voorspellers, dan is het gebruik van een kwadratische term in strijd met de parsimony. Overfitting is het gebruik van modellen of procedures die in strijd zijn met de parsimony, dat wil zeggen dat meer termen worden gebruikt dan nodig is of dat een ingewikkelder aanpak wordt gevolgd dan nodig is.

Goodness of Fit

Een belangrijk aspect van multivariabele regressiemodellering is hoe goed het model overeenkomt met de gegevens, d.w.z. de goodness of fit van het model. Deskundige auteurs hebben erop gewezen dat, hoewel goodness of fit van fundamenteel belang is om de geldigheid van regressiemodellen te evalueren, dit in gepubliceerde artikelen slechts zelden aan de orde komt. Zo wordt de goodness of fit van logistische modellen gewoonlijk als volgt geëvalueerd: ten eerste worden globale maatstaven voor de model fit gebruikt, zoals likelihood-statistieken, en ten tweede worden individuele waarnemingen geëvalueerd om na te gaan of zij problematisch zijn voor het regressiemodel. Residu-analyse is een doeltreffende manier om uitbijters of te invloedrijke waarnemingen op te sporen. Grote residuen wijzen erop dat het model niet bij de gegevens past. Helaas worden in artikelen in medische tijdschriften zelden of nooit residuplots gepresenteerd.

Interacties

Volgens Concato e.a. is er sprake van een interactie tussen onafhankelijke variabelen als het effect van de ene variabele op de uitkomst afhankelijk is van het niveau van een andere variabele. Met multivariabele methoden worden interacties niet automatisch beoordeeld; deze kunnen worden geëvalueerd door expliciet interactietermen aan het model toe te voegen. Wanneer er sprake is van een interactie-effect, hangt het effect van de ene variabele af van het niveau van de andere variabele en is de interpretatie wellicht niet eenduidig. Bijvoorbeeld, in een interventiestudie worden de effecten van een behandeling op een uitkomstmaat getest. De behandelingsvariabele is samengesteld uit twee groepen, behandeling en controle. De uitkomstincidentie in de behandelingsgroep is lager dan in de controlegroep. Op grond van eerdere studies stellen wij echter de hypothese op dat het effect van de behandeling mogelijk niet gelijk is voor mannen en vrouwen, d.w.z. is er een verschil in behandeling naar gelang van het geslacht? Dit is een kwestie van interactie, en om deze aan te pakken zouden wij een specifieke interactieterm (behandeling naar geslacht) aan het model toevoegen. Het opnemen van interacties, wanneer de studie niet specifiek was opgezet om ze te evalueren, kan het ramen en interpreteren van de andere effecten in het model echter bemoeilijken. Als een studie dus niet specifiek was ontworpen om interacties te beoordelen en er a priori geen reden is om er een te verwachten, of als interactietermen alleen worden beoordeeld omdat de statistische software dat eenvoudig maakt, en er feitelijk geen interactie wordt gevonden, kan het verstandig zijn het model zonder de interactieterm te fitten, gezien het ontbreken van een universele regel die in alle omstandigheden geschikte tests voor interacties voorschrijft

Conclusies

Het was ons doel klinische lezers, die vaak onwennig zijn met statistiek, vertrouwd te maken met multivariabele analyse met behulp van praktische suggesties en niet-technische taal. In het bijzonder hebben we de basisprincipes besproken van multivariabele modellen die het meest worden gebruikt in klinisch onderzoek, hoe ze worden samengesteld, en hoe ze kunnen worden geïnterpreteerd en geëvalueerd.

  1. Katz MH: Multivariable Analysis: A Practical Guide for Clinicians and Public Health Researchers. Londen, Cambridge University Press, 2011.
  2. Whisnant JP: Modellering van risicofactoren voor ischemische beroerte. De Willis-lezing. Stroke 1997;28:1840-1844.
  3. Verdecchia P, Angeli F, Achilli P, Castellani C, Broccatelli A, Gattobigio R, et al: Echocardiografische linkerventrikelhypertrofie bij hypertensie: marker voor toekomstige gebeurtenissen of mediator van gebeurtenissen? Curr Opin Cardiol 2007;22:329-334.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
  4. Verdecchia P, Angeli F, Gattobigio R, Sardone M, Pede S, Reboldi GP: Regressie van linkerventrikelhypertrofie en preventie van beroerte bij hypertensieve personen. Am J Hypertens 2006;19:493-499.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
  5. Verdecchia P, Angeli F, Gattobigio R, Guerrieri M, Benemio G, Porcellati C: Does the reduction in systolic blood pressure alone explain the regression of left ventricular hypertrophy? J Hum Hypertens 2004;18(suppl 2):S23-S28.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
  6. Katz MH: Multivariable analysis: a primer for readers of medical research. Ann Intern Med 2003;138:644-650.
    Externe bronnen

    • Pubmed/Medline (NLM)
  7. Angeli F, Angeli E, Ambrosio G, Mazzotta G, Cavallini C, Reboldi G, et al: Neutrophil count and ambulatory pulse pressure as predictors of cardiovascular adverse events in postmenopauzale vrouwen met hypertensie. Am J Hypertens 2011;24:591-598.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
  8. Harrell FE Jr, Lee KL, Mark DB: Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Stat Med 1996;15:361-387.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
    • Cambridge Scientific Abstracts (CSA)
    • ISI Web of Science

    Rao SR, Schoenfeld DA: Overlevingsmethoden. Circulation 2007;115:109-113.

    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)

  9. Kleinbaum DG, Klein M: Survival Analysis: A Self-Learning Text, ed 2. New York, Springer, 2005.
  10. Greenland S: Modeling and variable selection in epidemiologic analysis. Am J Public Health 1989;79:340-349.
  11. Harrell FE: Regression Modeling Strategies: with Applications to Linear Models, Logistic Regression, and Survival Analysis. New York, Springer, 2001.
  12. Steyerberg EW: Klinische Voorspellingsmodellen: A Practical Approach to Development, Validation, and Updating. New York, Springer, 2009.
  13. LaValley MP: Logistic regression. Circulation 2008;117:2395-2399.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
  14. Bagley SC, White H, Golomb BA: Logistic regression in the medical literature: standards for use and reporting, with particular attention to one medical domain. J Clin Epidemiol 2001;54:979-985.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
    • Chemical Abstracts Service (CAS)

    • Cambridge Scientific Abstracts (CSA)
  15. Concato J, Feinstein AR, Holford TR: The risk of determining risk with multivariable models. Ann Intern Med 1993;118:201-210.
    Externe bronnen

    • Pubmed/Medline (NLM)
    • Chemical Abstracts Service (CAS)
    • ISI Web of Science

Author Contacts

Gianpaolo Reboldi, MD, PhD, MSc

Departement Interne Geneeskunde

Universiteit van Perugia

IT-06126 Perugia (Italië)

E-Mail [email protected]

Artikel / Publicatie Details

First-Page Preview

Abstract of Methodological Notes

Received: 07 augustus 2012
Accepted: 24 oktober 2012
Online gepubliceerd: 21 februari 2013
Uitgiftedatum: maart 2013

Aantal gedrukte pagina’s: 7
Aantal Figuren: 1
Aantal Tabellen: 2

ISSN: 1015-9770 (Print)
eISSN: 1421-9786 (Online)

Voor aanvullende informatie: https://www.karger.com/CED

Copyright / Geneesmiddeldosering / Disclaimer

Copyright: Alle rechten voorbehouden. Niets uit deze uitgave mag worden vertaald in andere talen, gereproduceerd of gebruikt in enige vorm of op enige wijze, hetzij elektronisch of mechanisch, met inbegrip van fotokopieën, opnamen, microkopieën, of door enig informatie-opslag- en informatiezoeksysteem, zonder schriftelijke toestemming van de uitgever.
Drugsdosering: De auteurs en de uitgever hebben alles in het werk gesteld om ervoor te zorgen dat de keuze en dosering van geneesmiddelen in deze tekst in overeenstemming zijn met de huidige aanbevelingen en praktijk op het moment van publicatie. Echter, met het oog op voortdurend onderzoek, veranderingen in overheidsvoorschriften en de constante stroom van informatie met betrekking tot geneesmiddelentherapie en -reacties, wordt de lezer dringend verzocht de bijsluiter van elk geneesmiddel te raadplegen voor eventuele wijzigingen in indicaties en dosering en voor toegevoegde waarschuwingen en voorzorgsmaatregelen. Dit is vooral van belang wanneer het aanbevolen middel een nieuw en/of weinig gebruikt geneesmiddel is.
Disclaimer: De verklaringen, meningen en gegevens in deze publicatie zijn uitsluitend die van de individuele auteurs en medewerkers en niet die van de uitgevers en de redacteur(en). Het verschijnen van advertenties en/of productreferenties in de publicatie is geen garantie, goedkeuring of bekrachtiging van de geadverteerde producten of diensten of van hun effectiviteit, kwaliteit of veiligheid. De uitgever en de redacteur(s) wijzen elke verantwoordelijkheid af voor enig letsel aan personen of eigendom als gevolg van ideeën, methoden, instructies of producten waarnaar in de inhoud of advertenties wordt verwezen.