Abstract

Termin 'multivariate analysis' jest często używany, gdy ktoś odnosi się do analizy wieloczynnikowej. Termin „wieloczynnikowa” oznacza jednak analizę statystyczną z wieloma wynikami. W przeciwieństwie do tego, analiza wielowariantowa jest narzędziem statystycznym do określania względnego wkładu różnych czynników do pojedynczego zdarzenia lub wyniku. Celem niniejszego artykułu jest skupienie się na analizach, w których uwzględnia się wiele predyktorów. Taka analiza jest przeciwieństwem analizy jednoczynnikowej (lub „prostej”), w której bierze się pod uwagę pojedyncze zmienne predykcyjne. Omawiamy podstawy analiz wielowariantowych, jakie założenia leżą u ich podstaw oraz jak należy je interpretować i oceniać.

© 2013 S. Karger AG, Basel

Wprowadzenie

Pojęcia „analiza wielowariantowa” i „analiza wielozmienna” są często używane zamiennie w badaniach medycznych i naukach o zdrowiu. Jednakże analiza wielowariantowa odnosi się do analizy wielu wyników, podczas gdy analiza wielozmienna zajmuje się tylko jednym wynikiem za każdym razem.

Jak wynika z tytułu, skupiamy się na analizie wielowariantowej, a nie wielozmiennowej. Analiza wielowariantowa jest narzędziem statystycznym do określania względnego wkładu różnych przyczyn do pojedynczego zdarzenia lub wyniku. Na przykład, niektóre czynniki są związane z rozwojem choroby mózgowo-naczyniowej, w tym rodzinne występowanie udaru, starszy wiek, wysokie ciśnienie krwi (BP), cukrzyca, nadwaga, podwyższony poziom cholesterolu, interwencje i palenie papierosów. Analiza wielowariantowa pozwala nam określić niezależny wkład każdego z tych czynników ryzyka (zmienne objaśniające) w rozwój choroby (zmienna odpowiedzi). Innymi słowy, ryzyko wystąpienia danego wyniku może być modyfikowane przez inne zmienne ryzyka lub przez ich interakcje, a efekty te można ocenić za pomocą analizy wieloczynnikowej.

W niniejszym opracowaniu przedstawiamy klinicystom różne analizy wieloczynnikowe wynikające z zastosowania różnych skal pomiaru wyniku i szczegółowo opisujemy założenia stojące za każdym rodzajem analizy wieloczynnikowej. Omawiamy również sposób interpretacji różnych analiz wielozmiennowych, dodając kilka ilustrujących przykładów.

Rola czynników zakłócających

Zależność między zdarzeniem (lub miarą wyniku) a czynnikiem ryzyka może być zakłócona przez inne zmienne. Konfundacja występuje wtedy, gdy na pozorny związek między czynnikiem ryzyka a wynikiem wpływa związek trzeciej zmiennej z czynnikiem ryzyka i z wynikiem (ryc. 1) .

Rys. 1

Zależność między czynnikiem ryzyka a wynikiem (górny panel). Zdolność analizy wielowariantowej do jednoczesnej oceny niezależnego wkładu wielu czynników ryzyka w wynik jest ważna, gdy występuje „konfundacja” (panel dolny). Konfundowanie występuje, gdy na pozorny związek między czynnikiem ryzyka a wynikiem wpływa związek trzeciej zmiennej (konfundatora) z czynnikiem ryzyka i wynikiem.

http://www.karger.com/WebMaterial/ShowPic/169434

Zmienna nie może być konfundatorem, jeśli jest etapem w łańcuchu lub ścieżce przyczynowej. Na przykład umiarkowane spożycie alkoholu zwiększa stężenie lipoprotein o wysokiej gęstości w surowicy, co z kolei zmniejsza ryzyko udaru mózgu. W tym kontekście, poziom lipoprotein o wysokiej gęstości jest krokiem w tym łańcuchu przyczynowym, a nie czynnikiem zakłócającym, który musi być kontrolowany.

Prostą i praktyczną techniką oceny i eliminacji czynników zakłócających jest analiza stratyfikowana. Analiza stratyfikowana mierzy wpływ czynnika ryzyka na wynik przy zachowaniu stałej innej zmiennej.

Jako przykład rozważ związek między uszkodzeniem narządów docelowych w nadciśnieniu tętniczym a ryzykiem udaru mózgu. Dane z badania Progetto Ipertensione Umbria Monitoraggio Ambulatoriale (PIUMA) pozwalają nam zilustrować, jak przeprowadzić analizę stratyfikowaną. W szczególności badamy związek przerostu lewej komory (LV) w EKG z ryzykiem zdarzeń mózgowo-naczyniowych. Surowe wskaźniki udaru mózgu między osobami z nadciśnieniem tętniczym bez przerostu LV i z przerostem LV wynosiły 0,56 zdarzenia × 100 pacjentolat w pierwszej grupie i 1,46 zdarzenia × 100 pacjentolat w drugiej. W jednoczynnikowej analizie przeżycia obecność przerostu LV w EKG wiązała się ze zwiększonym ryzykiem przyszłych zdarzeń naczyniowo-mózgowych (HR 2,37; 95% CI 1,69-3,32; p < 0,0001).

Jednakże skurczowe BP jest potencjalnym czynnikiem zakłócającym, ponieważ wiąże się zarówno z przerostem LV, jak i chorobą naczyniowo-mózgową. Porównujemy więc wpływ przerostu LV na rokowanie oddzielnie wśród pacjentów z nadciśnieniem tętniczym ze skurczowym BP poniżej i powyżej mediany (152 mm Hg). Surowe wskaźniki udaru mózgu i ryzyka zdarzeń mózgowo-naczyniowych są większe wśród pacjentów z nadciśnieniem tętniczym z przerostem LV w porównaniu z tymi bez przerostu LV, zarówno wśród osób z ciśnieniem skurczowym poniżej, jak i powyżej 152 mm Hg. HR specyficzne dla poszczególnych warstw (2,84 dla pacjentów z ciśnieniem skurczowym ≤152 mm Hg i 1,86 dla pacjentów z ciśnieniem skurczowym >152 mm Hg) w znacznym stopniu różnią się od HR obliczonego dla całej populacji (2,34), co wskazuje na konfundowanie przez skurczowe ciśnienie tętnicze.

Uważa się, że inne zmienne mogą wpływać na związek między przerostem LV a ryzykiem udaru. W szczególności, różne analizy stratyfikacyjne mogą wykazać, że wpływ przerostu LV na udar mózgu jest związany nie tylko ze skurczowym BP, ale także z wiekiem, płcią i cukrzycą.

Aby dokonać stratyfikacji według dwóch zmiennych (na przykład skurczowego BP i płci), musimy ocenić związek między przerostem LV a udarem mózgu w czterech grupach (mężczyźni z skurczowym BP ≤152 mm Hg, mężczyźni ze skurczowym BP >152 mm Hg, kobiety ze skurczowym BP ≤152 mm Hg i kobiety ze skurczowym BP >152 mm Hg). Dodając cukrzycę jako zmienną do poprzedniej analizy stratyfikacyjnej, mamy osiem grup.

Dla każdej dodanej zmiennej stratyfikacyjnej zwiększamy liczbę podgrup, dla których musimy indywidualnie ocenić, czy związek między przerostem LV a udarem mózgu istnieje, i możemy mieć niewystarczającą wielkość próby w niektórych z tych podgrup, nawet jeśli zaczynaliśmy z dużą liczebnością próby. Analiza wielowariantowa przezwycięża te ograniczenia i pozwala na jednoczesną ocenę wpływu wielu niezależnych zmiennych na wynik.

Wspólne typy analizy wielowariantowej

Analizy wielowariantowe są szeroko stosowane w obserwacyjnych badaniach etiologii, badaniach interwencyjnych (randomizowanych i nierandomizowanych), badaniach diagnozy i badaniach rokowania. Do najczęściej stosowanych w badaniach klinicznych rodzajów analizy wielowariantowej należą regresja liniowa, regresja logistyczna i regresja proporcjonalnych zagrożeń (Cox).

Regresja liniowa jest stosowana w przypadku wyników ciągłych (takich jak ciśnienie tętnicze), natomiast regresja logistyczna w przypadku wyników binarnych (np. przerost LV, tak vs. nie). Regresję proporcjonalnych zagrożeń (Cox) stosuje się, gdy wynikiem jest czas, jaki upłynął do wystąpienia zdarzenia (np. czas od oceny wyjściowej do wystąpienia udaru).

Wielozmienna regresja liniowa jest metodą stosowaną do modelowania liniowej zależności między zmienną zależną a jedną lub więcej zmiennymi niezależnymi. Zmienna zależna jest czasami nazywana również predyktorem, a zmienne niezależne predyktorami. Podstawowym założeniem wielokrotnej regresji liniowej jest to, że wraz ze wzrostem lub spadkiem zmiennych niezależnych średnia wartość wyniku wzrasta lub maleje w sposób liniowy.

Analiza regresji opiera się na najmniejszych kwadratach, a model jest dopasowany w taki sposób, że suma kwadratów różnic wartości obserwowanych i przewidywanych jest zminimalizowana. W modelu wielozmiennym współczynnik regresji dla każdej zmiennej jest szacowany poprzez dopasowanie modelu do danych i dostosowanie do innych zmiennych w modelu. Innymi słowy, analiza regresji wielozmiennej dostarcza przewidywań opartych na połączonym efekcie predykcyjnym predyktorów.

Aby ocenić moc modelu regresji liniowej do przewidywania wyniku, można podać skorygowane R2. Wartość R2 waha się od 0 do 1, a po pomnożeniu przez 100, R2 może być rozumiane jako procent wariancji wyniku uwzględniający zmienne niezależne. W modelu o R2 bliskim 1 zmienne zależne razem dokładnie przewidują wynik.

Ostatnia analiza nadciśnienia pomenopauzalnego przeprowadzona przez naszą grupę zilustrowała sposób wykonania analizy wieloczynnikowej regresji liniowej. Testowaliśmy niezależny związek liczby neutrofilów, markera przewlekłego stanu zapalnego, z ciśnieniem tętna (PP), uznanym markerem miażdżycy i czynnikiem ryzyka zdarzeń sercowych i naczyniowo-mózgowych.

Ponieważ liniowa kombinacja wieku, stężenia glukozy w surowicy i napięcia Cornell EKG była dobrym predyktorem PP w modelu wieloczynnikowym (model 1; tabela 1), niezależny związek liczby neutrofilów z PP został przetestowany po dostosowaniu do wpływu tych czynników. Warto zauważyć, że w tym modelu wielowariantowym (model 2; tabela 1), związek między PP a liczbą neutrofilów pozostał istotny po dostosowaniu do znaczącego wpływu tych czynników zakłócających.

Tabela 1

Wielozmiennowa analiza regresji liniowej w celu zbadania niezależnego związku między ciśnieniem tętna a innymi zmiennymi klinicznymi

http://www.karger.com/WebMaterial/ShowPic/169436

Binarna regresja logistyczna szacuje prawdopodobieństwo wyniku i modeluje, jak to prawdopodobieństwo zmienia się wraz ze zmianą zmiennych predykcyjnych. Podstawowym założeniem jest to, że każdy wzrost o jedną jednostkę w predyktorze mnoży prawdopodobieństwo wyniku przez pewien czynnik i że efekt kilku zmiennych jest multiplikatywnym iloczynem ich indywidualnych efektów. Funkcja logistyczna daje prawdopodobieństwo wyniku ograniczone przez 0 i 1. Centralną koncepcją matematyczną, która leży u podstaw regresji logistycznej, jest logit (logarytm naturalny ilorazu szans). Najprostszy przykład logitu pochodzi z tabeli kontyngencji 2 × 2.

Rozważmy te same dane z badania PIUMA, w którym oceniano związek przerostu LV z ryzykiem udaru. Rozkład binarnej zmiennej wynikowej (udar mózgu, tak vs. nie) jest sparowany z dychotomiczną zmienną predykcyjną (przerost LV, tak vs. nie). Wyniki sugerują, że u pacjentów z przerostem LV w ocenie wyjściowej prawdopodobieństwo wystąpienia udaru mózgu jest 2,58 razy większe niż u pacjentów bez przerostu LV. Współczynnik szans jest pochodną dwóch szans i jego logarytmu naturalnego – logitu, który jest równy 0,95. Wartość 0,95 jest współczynnikiem regresji regresji logistycznej. Antylogarytm współczynnika regresji równa się ilorazowi szans dla wzrostu predyktora o jedną jednostkę. W przypadku ciągłych zmiennych objaśniających można określić jednostki zmiany (np. wzrost ciśnienia tętniczego o 10 mm Hg), dla których szacuje się iloraz szans.

Ponieważ skurczowe ciśnienie tętnicze jest czynnikiem zakłócającym jego związek zarówno z przerostem LV, jak i z chorobą naczyniowo-mózgową, modelujemy wieloczynnikową regresję logistyczną z uwzględnieniem przerostu LV i skurczowego ciśnienia tętniczego jako predyktorów. Po skorygowaniu o istotny wpływ skurczowego BP, obecność przerostu LV jest nadal związana ze zwiększonym ryzykiem udaru mózgu (OR 1,98, 95% CI 1,37-2,86; p < 0,0001).

Modele proporcjonalnych zagrożeń zakładają, że stosunek zagrożeń dla osób z danym czynnikiem ryzyka i bez niego jest stały w całym okresie badania. Jest to znane jako założenie proporcjonalności i stanowi główny problem przy dopasowywaniu modelu Coxa. Założenie to oznacza, że funkcje przeżycia nie krzyżują się, a zmienne objaśniające oddziałują jedynie na współczynnik zagrożenia. Zaletą analizy zagrożeń proporcjonalnych jest to, że obejmuje ona uczestników o różnej długości obserwacji. Uczestnik, u którego nie wystąpił interesujący go wynik do końca badania, jest uważany za cenzurowanego. Antylogarytm współczynnika regresji proporcjonalnych zagrożeń równa się względnemu zagrożeniu dla wzrostu predyktora o jedną jednostkę. W przypadku ciągłych zmiennych objaśniających większość nowoczesnego oprogramowania pozwala na określenie jednostek zmiany (np. wzrost ciśnienia tętniczego o 10 mm Hg), dla których szacowany jest dostosowany współczynnik ryzyka.

Przykładem może być badanie związku między regresją przerostu LV a ryzykiem udaru mózgu. W analizie osobowo-czasowej wykazano, że u osób z nadciśnieniem tętniczym, u których nie doszło do regresji przerostu mięśnia LV lub doszło do jego ponownego rozwoju, częstość udaru mózgu była znacznie większa niż u osób, u których przerost mięśnia LV nigdy nie wystąpił lub u których doszło do regresji przerostu mięśnia LV (1,16 vs. 0,25 × 100 pacjentów na rok; p = 0,0001).

Niezależny wpływ seryjnych zmian przerostu mięśnia LV badano za pomocą wieloczynnikowego modelu Coxa. Innymi badanymi czynnikami zakłócającymi były: ambulatoryjne 24-godzinne skurczowe ciśnienie tętnicze, wiek, płeć (mężczyźni, kobiety), wskaźnik masy ciała, cukrzyca (nie, tak), stężenie cholesterolu całkowitego, stężenie triglicerydów w surowicy, wywiad rodzinny w kierunku chorób układu sercowo-naczyniowego (nie, tak), nałóg palenia tytoniu, rodzaj leczenia przeciwnadciśnieniowego w czasie wizyty kontrolnej oraz leczenie statyną w czasie wizyty kontrolnej. W analizie wieloczynnikowej ryzyko zdarzeń naczyniowo-mózgowych było 2,8-krotnie większe (95% CI 1,18-6,69) w podgrupie z brakiem regresji lub ponownym rozwojem przerostu LV niż w podgrupie z regresją przerostu LV lub utrzymującą się prawidłową masą LV. Efekt ten był niezależny od wieku i 24-godzinnego skurczowego ciśnienia tętniczego w czasie wizyty kontrolnej (tabela 2).

Tabela 2

Zależne predyktory zdarzeń mózgowo-naczyniowych w badaniu PIUMA

http://www.karger.com/WebMaterial/ShowPic/169435

Model semiparametryczny Coxa, ponieważ nie zakłada żadnego rozkładu dla wyjściowego zagrożenia , dopuszcza również zmienne objaśniające zależne od czasu. Zmienna objaśniająca jest zależna od czasu, jeśli jej wartość zmienia się w czasie. Na przykład, można użyć zmiennej zależnej od czasu do modelowania efektu zmiany grupy leczenia lub statusu ekspozycji przez uczestników. Można też uwzględnić zmienne zależne od czasu, takie jak ciśnienie tętnicze, które zmienia się w czasie w trakcie trwania badania.

Ile zmiennych w modelu?

Powszechnym problemem w analizie regresji jest wybór zmiennych. Kiedy badamy wpływ czynnika ryzyka, różne korekty innych czynników mogą dać różne lub nawet mylące wnioski. Metoda selekcji zmiennych jest sposobem wyboru określonego zestawu predyktorów do wykorzystania w modelu regresji lub może być próbą znalezienia „najlepszego” modelu, gdy istnieje kilka predyktorów kandydujących. Decyzja o tym, co należy dostosować, powinna być kierowana przez teoretyczny lub biologiczny związek a priori między różnymi czynnikami a wynikiem. Z drugiej strony, liczba zmiennych w modelu jest często uzyskiwana poprzez „screening dwuczynnikowy” lub poprzez zastosowanie zautomatyzowanych procedur selekcji zmiennych, takich jak selekcja w przód, wstecz lub krokowa. Screening dwuczynnikowy rozpoczyna się od przyjrzenia się wszystkim dwuczynnikowym związkom ze zmienną zależną i włącza wszystkie, które są istotne w modelu głównym. Niestety, jest to zazwyczaj niewystarczające. Ze względu na korelacje pomiędzy zmiennymi objaśniającymi, każda pojedyncza zmienna może mieć niewielką unikalną moc predykcyjną, szczególnie gdy liczba predyktorów jest duża. Zautomatyzowane procedury określają kolejność, w jakiej zmienne predykcyjne są wprowadzane do modelu zgodnie z kryteriami statystycznymi. W selekcji w przód, zmienne są wprowadzane do modelu pojedynczo w kolejności określonej przez siłę ich powiązania ze zmienną kryterialną. Efekt dodawania każdej z nich jest oceniany w miarę ich wprowadzania, a zmienne, które nie przyczyniają się znacząco do powodzenia modelu, są wyłączane. W selekcji wstecznej, wszystkie zmienne predykcyjne są wprowadzane do modelu. Następnie usuwa się najsłabszą zmienną predykcyjną i ponownie oblicza regresję. Jeżeli to znacznie osłabia model, wówczas zmienna predykcyjna jest wprowadzana ponownie, w przeciwnym razie jest usuwana. Procedura ta jest następnie powtarzana do momentu, gdy w modelu pozostaną tylko użyteczne zmienne predykcyjne. Selekcja krokowa przebiega naprzemiennie w przód i w tył, wprowadzając i usuwając zmienne, które spełniają kryteria statystyczne dla wprowadzenia lub usunięcia, aż do osiągnięcia stabilnego zestawu zmiennych. Jeśli dodanie zmiennej przyczynia się do modelu, wówczas jest ona zachowywana, ale wszystkie inne zmienne w modelu są następnie ponownie testowane, aby sprawdzić, czy nadal przyczyniają się do sukcesu modelu. Jeśli nie przyczyniają się już znacząco, są usuwane. Ta metoda teoretycznie definiuje najmniejszy możliwy zestaw zmiennych predykcyjnych zawartych w ostatecznym modelu.

Wyniki regresji krokowej są wrażliwe na naruszenia założeń leżących u podstaw regresji. Ogólnie rzecz biorąc, bezkrytyczne stosowanie procedur selekcji zmiennych może skutkować modelami z tendencyjnym doborem zmiennych, niewiarygodnymi współczynnikami i niedokładnymi przewidywaniami.

Chociaż nie ma zgody co do najlepszych metod selekcji zmiennych, stosowanie niektórych metod jest ogólnie odradzane, takich jak włączanie lub wyłączanie zmiennych na podstawie analizy jednozmiennowej. Proponujemy proste zasady doboru zmiennych objaśniających: uwzględnij odpowiednią liczbę predyktorów, aby model był użyteczny dla celów teoretycznych i praktycznych oraz aby uzyskać dobrą moc predykcyjną. Nie należy wykluczać zmiennych wyłącznie z powodu nominalnie nieistotnego związku lub dlatego, że są one, być może przypadkowo, nieprognozowalne w danej próbie. Dodawanie zmiennych o małej mocy predykcyjnej ma wady. Zbędne zmienne zazwyczaj nie poprawiają wartości dopasowania modelu, ponieważ nie przyczyniają się do ogólnej predykcji. Aby zapobiec współliniowości, pomocne jest, aby zmienne objaśniające były skorelowane ze zmienną odpowiedzi, ale nie wysoko skorelowane między nimi.

Reguła zatrzymania” dla włączenia lub wyłączenia predyktorów jest palącą kwestią w wyborze modelu. Oprócz standardowego poziomu istotności dla testowania hipotez (α = 0,05), bardzo popularne jest również stosowanie kryterium informacyjnego Akaike’a (AIC) oraz bayesowskiego kryterium informacyjnego (BIC). AIC i BIC porównują modele na podstawie ich dopasowania do danych, ale penalizują złożoność modelu, tj. liczbę stopni swobody. AIC wymaga, aby wzrost χ2 modelu był większy niż dwukrotność stopni swobody. Na przykład, biorąc pod uwagę predyktor o 1 stopniu swobody, taki jak płeć, oznacza to, że model χ2 musi przekroczyć 2. BIC penalizuje dopasowanie modelu w taki sposób, że model χ2 musi przekroczyć liczbę predyktorów pomnożoną przez logarytm efektywnej wielkości próby, np. liczbę zdarzeń w modelu przeżycia Coxa. Modele z niższym AIC i/lub BIC są zwykle preferowane.

Na koniec można podać pewne wskazówki dotyczące liczby kandydatów na predyktorów, które mogą być rzetelnie zbadane w odniesieniu do wielkości próby. Dobrze znaną zasadą jest reguła 1 na 10 lub 1 na 20 . W przypadku modeli liniowych reguła ta sugeruje, że na każde 10 lub 20 pacjentów można zbadać 1 kandydata na predyktor. W przypadku modeli logistycznych lub Coxa reguła 1 na 10 jest raczej powierzchowna, chyba że istnieje w pełni predefiniowany zestaw predyktorów. Poza tym należy pamiętać, że moc i ważność wieloczynnikowej analizy przeżycia jest związana raczej z liczbą zdarzeń wynikowych w porównaniu z liczbą kandydatów na predyktorów (tj. efektywna wielkość próby) niż z liczbą uczestników (całkowita wielkość próby). Sugerujemy regułę 1 na 20 dla tych modeli z ograniczonym zestawem wstępnie określonych predyktorów i regułę 1 na 50 dla selekcji krokowej. Tak więc w badaniu z 60 pacjentami doświadczającymi zdarzenia skutkującego (60 zdarzeń) z 3000 narażonych, tylko 3 wstępnie określone predyktory mogły być wiarygodnie badane zgodnie z regułą 1 na 20. Kiedy reguła jest naruszona, liczba kandydatów na predyktory jest generalnie zbyt duża dla zestawu danych i prawie nieuchronnie wystąpi przepasowanie.

Overfitting

Co to jest przepasowanie? Zasada parsymonii lub brzytwa Occama nakazuje używanie modeli, które zawierają wszystko, co jest niezbędne do modelowania, ale nic więcej. Jeśli prostszy model jest statystycznie nieodróżnialny od modelu bardziej złożonego, parsymonia nakazuje, że powinniśmy preferować prostszy model. Na przykład, jeśli model regresji z 3 predyktorami jest wystarczający do wyjaśnienia wyniku, to nie powinno się używać więcej niż tych predyktorów. Co więcej, jeśli związek może być uchwycony przez liniową funkcję w tych predyktorach, wtedy użycie kwadratowego terminu narusza parsymonię. Nadmierne dopasowanie to użycie modeli lub procedur, które naruszają parsymonię, czyli zawierają więcej terminów niż jest to konieczne lub używają bardziej skomplikowanych podejść niż jest to konieczne.

Dobroć dopasowania

Jednym z kluczowych aspektów modelowania regresji wielorakiej jest to, jak dobrze model zgadza się z danymi, tj. dobroć dopasowania modelu. Autorzy zwrócili uwagę, że chociaż dobroć dopasowania ma fundamentalne znaczenie dla oceny poprawności modeli regresji, jest ona rzadko opisywana w opublikowanych artykułach. Na przykład, dobroć dopasowania modeli logistycznych jest zwykle oceniana w następujący sposób: po pierwsze, należy użyć globalnych miar dopasowania modelu, takich jak statystyki prawdopodobieństwa, a po drugie, ocenić poszczególne obserwacje, aby zobaczyć, czy któreś z nich są problematyczne dla modelu regresji. Analiza reszt jest skutecznym sposobem wykrywania obserwacji odstających lub zbyt wpływowych. Duże resztki sugerują, że model nie pasuje do danych. Niestety, artykuły w czasopismach medycznych rzadko, jeśli w ogóle, przedstawiają wykresy reszt.

Interakcje

Według Concato et al. „Interakcja występuje między niezależnymi zmiennymi, jeśli wpływ jednej zmiennej na zdarzenie wynikowe zależy od poziomu innej zmiennej. Metody wielowariantowe nie oceniają automatycznie interakcji, które mogą być oceniane poprzez wyraźne dodanie warunków interakcji do modelu. Kiedy efekt interakcji jest obecny, wpływ jednej zmiennej zależy od poziomu drugiej zmiennej i interpretacja może nie być prosta. Na przykład, badanie interwencyjne testuje wpływ leczenia na miarę wyniku. Zmienna traktowania składa się z dwóch grup, traktowania i kontroli. Częstość występowania wyników w grupie leczonej jest niższa niż w grupie kontrolnej. Jednakże, na podstawie poprzednich badań można wysunąć hipotezę, że efekt leczenia może nie być równy dla mężczyzn i kobiet, tzn. czy istnieje różnica w leczeniu w zależności od płci? Jest to kwestia interakcji i aby ją rozwiązać, dodalibyśmy do modelu specjalny termin interakcji (leczenie według płci). Jednak włączenie interakcji, gdy badanie nie zostało zaprojektowane specjalnie do ich oceny, może utrudnić oszacowanie i interpretację innych efektów w modelu. Dlatego też, jeśli badanie nie zostało zaprojektowane specjalnie do oceny interakcji i nie ma żadnego powodu a priori, aby ich oczekiwać, lub też warunki interakcji są oceniane tylko dlatego, że oprogramowanie statystyczne to ułatwia, a w rzeczywistości nie znaleziono interakcji, rozsądnym rozwiązaniem może być dopasowanie modelu bez warunku interakcji, biorąc pod uwagę brak uniwersalnej reguły nakazującej odpowiednie testy dla interakcji we wszystkich okolicznościach.

Wnioski

Naszym celem było wprowadzenie czytelników klinicznych, często nie czujących się komfortowo ze statystyką, do analizy wielozmiennowej przy użyciu praktycznych sugestii i nietechnicznego języka. W szczególności, dokonaliśmy przeglądu podstaw modeli wielozmiennowych najczęściej stosowanych w badaniach klinicznych, sposobu ich składania oraz możliwości ich interpretacji i oceny.

  1. Katz MH: Multivariable Analysis: A Practical Guide for Clinicians and Public Health Researchers. London, Cambridge University Press, 2011.
  2. Whisnant JP: Modelowanie czynników ryzyka udaru niedokrwiennego mózgu. The Willis Lecture. Stroke 1997;28:1840-1844.
  3. Verdecchia P, Angeli F, Achilli P, Castellani C, Broccatelli A, Gattobigio R, et al: Echocardiographic left ventricular hypertrophy in hypertension: marker for future events or mediator of events? Curr Opin Cardiol 2007;22:329-334.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)

  4. Verdecchia P, Angeli F, Gattobigio R, Sardone M, Pede S, Reboldi GP: Regresja przerostu lewej komory serca i zapobieganie udarowi mózgu u osób z nadciśnieniem tętniczym. Am J Hypertens 2006;19:493-499.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)

  5. Verdecchia P, Angeli F, Gattobigio R, Guerrieri M, Benemio G, Porcellati C: Does the reduction in systolic blood pressure alone explain the regression of left ventricular hypertrophy? J Hum Hypertens 2004;18(suppl 2):S23-S28.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)

  6. Katz MH: Multivariable analysis: a primer for readers of medical research. Ann Intern Med 2003;138:644-650.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)

  7. Angeli F, Angeli E, Ambrosio G, Mazzotta G, Cavallini C, Reboldi G, et al: Neutrophil count and ambulatory pulse pressure as predictors of cardiovascular adverse events in postmenopausal women with hypertension. Am J Hypertens 2011;24:591-598.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)

  8. Harrell FE Jr, Lee KL, Mark DB: Multivariable prognostic models: issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Stat Med 1996;15:361-387.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
    • Cambridge Scientific Abstracts (CSA)
    • ISI Web of Science

  9. Rao SR, Schoenfeld DA: Metody przeżycia. Circulation 2007;115:109-113.
    Zasoby zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)

  10. Kleinbaum DG, Klein M: Survival Analysis: A Self-Learning Text, ed 2. New York, Springer, 2005.
  11. Greenland S: Modeling and variable selection in epidemiologic analysis. Am J Public Health 1989;79:340-349.
  12. Harrell FE: Regression Modeling Strategies: with Applications to Linear Models, Logistic Regression, and Survival Analysis. New York, Springer, 2001.
  13. Steyerberg EW: Clinical Prediction Models: A Practical Approach to Development, Validation, and Updating. New York, Springer, 2009.
  14. LaValley MP: Logistic regression. Circulation 2008;117:2395-2399.
    Źródła zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
  15. Bagley SC, White H, Golomb BA: Logistic regression in the medical literature: standards for use and reporting, with particular attention to one medical domain. J Clin Epidemiol 2001;54:979-985.
    Zasoby zewnętrzne

    • Pubmed/Medline (NLM)
    • Crossref (DOI)
    • . Chemical Abstracts Service (CAS)
    • Cambridge Scientific Abstracts (CSA)

  16. Concato J, Feinstein AR, Holford TR: Ryzyko określania ryzyka za pomocą modeli wielowariantowych. Ann Intern Med 1993;118:201-210.
    Zasoby zewnętrzne

    • Pubmed/Medline (NLM)
    • Chemical Abstracts Service (CAS)
    • ISI Web of Science
  • Kontakty z autorami

    Gianpaolo Reboldi, MD, PhD, MSc

    Department of Internal Medicine

    University of Perugia

    IT-06126 Perugia (Italy)

    E-.Mail [email protected]

    Dane o artykule / publikacji

    Podgląd pierwszej strony

    Abstract of Methodological Notes

    Received: August 07, 2012
    Accepted: October 24, 2012
    Published online: 21 lutego 2013
    Data wydania: marzec 2013

    Liczba stron wydruku: 7
    Liczba rycin: 1
    Liczba tabel: 2

    ISSN: 1015-9770 (Print)
    eISSN: 1421-9786 (Online)

    Dodatkowe informacje: https://www.karger.com/CED

    Copyright / Drug Dosage / Disclaimer

    Copyright: Wszelkie prawa zastrzeżone. Żadna część tej publikacji nie może być tłumaczona na inne języki, reprodukowana lub wykorzystywana w jakiejkolwiek formie lub za pomocą jakichkolwiek środków, elektronicznych lub mechanicznych, w tym fotokopiowanie, nagrywanie, mikrokopiowanie lub za pomocą jakiegokolwiek systemu przechowywania i wyszukiwania informacji, bez pisemnej zgody wydawcy.
    Dawkowanie leków: Autorzy i wydawca dołożyli wszelkich starań, aby zapewnić, że wybór leku i dawkowanie określone w niniejszym tekście są zgodne z aktualnymi zaleceniami i praktyką w momencie publikacji. Jednak ze względu na trwające badania, zmiany w przepisach rządowych oraz ciągły napływ informacji dotyczących terapii lekowej i reakcji na leki, zaleca się czytelnikowi sprawdzenie ulotki dołączonej do opakowania każdego leku pod kątem zmian we wskazaniach i dawkowaniu oraz dodatkowych ostrzeżeń i środków ostrożności. Jest to szczególnie ważne, gdy zalecany środek jest nowym i/lub rzadko stosowanym lekiem.
    Zrzeczenie się odpowiedzialności: Stwierdzenia, opinie i dane zawarte w tej publikacji są wyłącznie opiniami poszczególnych autorów i współpracowników, a nie wydawców i redaktora(ów). Pojawienie się reklam lub/i odniesień do produktów w publikacji nie stanowi gwarancji, poparcia lub zatwierdzenia reklamowanych produktów lub usług lub ich skuteczności, jakości lub bezpieczeństwa. Wydawca i redaktor(y) zrzekają się odpowiedzialności za jakiekolwiek obrażenia osób lub mienia wynikające z jakichkolwiek pomysłów, metod, instrukcji lub produktów, o których mowa w treści lub reklamach.

    Dodaj komentarz

    Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *