Elementy oceny
Ważność tego przeglądu MMT nieuchronnie zależy od jakości procesu przeglądu. Nie wydaje się, aby intencją autorów było przeprowadzenie pełnego systematycznego przeglądu piśmiennictwa, dlatego nie wymagamy od nich przestrzegania tego standardu. Jednak elementy projektu dobrego systematycznego przeglądu badań diagnostycznych, jak również krytyczna ocena literatury dotyczącej oceny pomiarów, są istotne dla omawianej dyskusji. Nawet bardziej tradycyjny przegląd narracyjny dzieli wiele z tych elementów. Zebraliśmy pytania, które muszą być rozważone w celu wyciągnięcia ważnych wniosków na temat użyteczności procedur diagnostycznych AK (Tabela 1); pytania te są oparte na metodologii badań i syntezy z cytatów powyżej. Odpowiedzi na te kilka pytań stanowią poważne wyzwanie dla wniosków autorów na temat przydatności AK.
AK uwikłanie
AK ma długą i bogatą historię w chiropraktyce . Wiele chiropraktycy zgłosić wykorzystanie techniki w jakiejś formie . Wyraźnie, AK jest postrzegane przez jego zwolenników jako więcej niż standardowe ortopedyczne / neurologiczne testowanie mięśni. MMT, jak wykonywane przez chiropraktyków, nie musi różnić się w jego realizacji i interpretacji z ręcznego testowania mięśni, jak wykonywane i interpretowane przez standardy stosowane w medycynie fizycznej. Dla każdego z tych lekarzy, słaby mięsień może sugerować pierwotną patologię mięśniową lub neurologiczną. Jednak technika AK wykorzystuje manualne testy mięśniowe nie tylko do oceny funkcjonalnej integralności mięśni i zaopatrzenia nerwowego, ale także jako środek do „diagnozowania strukturalnych, chemicznych i psychicznych dysfunkcji”. Niektóre z jego wyróżniających procedur diagnostycznych obejmują wykorzystanie testów prowokacyjnych (tj. wyzwanie AK i lokalizacji terapii) w połączeniu z MMT w celu identyfikacji potrzeby leczenia nerwowo-mięśniowo-szkieletowych, organicznych i metabolicznych warunków. Osłabienie mięśni jest również uważane za diagnostykę przed/podklinicznej organicznej, nie-neuromięśniowo-szkieletowej choroby.
MMT jest standardowym składnikiem badania fizykalnego neuromięśniowo-szkieletowego. Zgadzamy się z autorami, że MMT jest przydatna w ocenie słabości mięśni bezpośrednio związanych z bólem, urazami i zaburzeniami nerwowo-mięśniowo-szkieletowymi. Jednakże, ekstrapolacja właściwości MMT do unikalnych zastosowań w AK jest ryzykowna z kilku powodów. Wiarygodność/ważność MMT dla specyficznych schorzeń nerwowo-mięśniowo-szkieletowych może nie być możliwa do uogólnienia na inne zastosowania, takie jak identyfikacja zaburzeń organicznych. MMT może być wiarygodna/dokładna dla oceny siły mięśniowej w izolacji, ale nie w połączeniu z próbą kręgosłupową (siła przyłożona do stawu kręgowego) lub innym testem prowokacyjnym używanym do specyficznej diagnostyki AK. Autorzy mylą również dwa zastosowania terminu „ważność”: dokładność testu i ważność diagnostyczną. Test może być niezwykle dokładny, powiedzmy na przykład dynamometryczna ocena siły mięśniowej w niutonach, ale nadal nie ma czułości ani swoistości dla rozpoznania konkretnego schorzenia. Cuthbert i Goodheart pomylili dowody na AK z dowodami na wiarygodność/ważność standardowego ortopedycznego MMT. Wiarygodność i dokładność MMT nie ustanawia przydatności MMT dla jego unikalnych zastosowań AK.
Strategia wyszukiwania i kryteria włączenia
Przegląd przez Cuthbert i Goodheart ilustruje, jak brak wykorzystania skrupulatnej strategii wyszukiwania może przegapić krytyczne cytaty i wpływ ustaleń przeglądu. Autorzy przeszukali PubMed i CINAHL, używając terminów „manualny test mięśni” i „manualne testowanie mięśni”. Nie podano dalszych szczegółów, więc nie można dokładnie powielić wyszukiwania. Istnieje kilka problemów odnoszących się do zakresu wyszukiwania, które mogły doprowadzić do pominięcia istotnych artykułów. W naszym wyszukiwaniu w PubMed, dodanie terminu „testowanie mięśni” zwiększyło liczbę znalezionych prac z 639 do 13,802. Przeszukaliśmy również MEDLINE i CINAHL. Włączenie dodatkowego terminu „testowanie mięśni” zwiększyło liczbę trafień z 454 do 709, a liczbę prac odnoszących się konkretnie do rzetelności/ważności z 97 do 136. Drugim problemem jest to, że Cuthbert i Goodheart nie przeszukali chiropraktycznej bazy danych, MANTIS. Przeszukanie tej bazy zwiększyło liczbę prac dotyczących testów mięśniowych z 709 do 1297, a liczbę prac dotyczących wiarygodności/ważności z 136 do 221. Przeprowadziliśmy również wyszukiwanie z zastosowaniem strategii Boole’a: Applied Kinesiology AND (reliability OR validity). Włączenie MANTIS zwiększyło uzysk z 15 do 32 artykułów. Autorzy mogli również nie zastosować innej ważnej strategii wyszukiwania, a mianowicie sprawdzenia referencji artykułów w celu zidentyfikowania dalszych istotnych badań.
Autorzy stwierdzili, że wybrali badania na podstawie istotności, ale nie podali definicji operacyjnej. Wydaje się, że za istotny uznano każdy artykuł na temat MMT dotyczący zaburzeń związanych z bólem. Nie jest jasne, w jaki sposób „wiarygodność/ważność” i „MMT” zostały użyte w procesie selekcji. Negatywne badania z pewnością zostały pominięte. Gdyby autorzy posłużyli się hasłem „testy mięśniowe” i włączyli bazę danych MANTIS, nie pominęliby badań z randomizacją zaprojektowanych specjalnie w celu oceny wpływu procedury AK-challenge na wyniki MMT. W każdym razie, autorzy powinni być świadomi badania Triano z 1982 roku, które zostało przeprowadzone z pomocą International College of Applied Kinesiology i skrytykowane przez Goodheart w liście do redakcji.
Jedno kryterium wyboru wprowadziło wyraźną i znaczącą stronniczość do przeglądu. Badania były włączane tylko wtedy, gdy kappa ≥ 0,5 dla oceny wiarygodności lub ważności (chociaż kappa nie jest generalnie wskaźnikiem ważności). Najwyraźniej to kryterium włączenia nie było stosowane jednolicie, ponieważ wiele z włączonych badań nie dotyczyło wiarygodności i dlatego nie podawało wartości kappa. Co ważniejsze, stosowanie tego kryterium wynikało z niezrozumienia opinii Swinklesa i wsp. Autorzy ci użyli tego kryterium do ustalenia standardów określających, czy określone instrumenty mają dobrą wiarygodność konstruktu; nie użyli progu kappa ≥ 0,5 do określenia kwalifikowalności do ich przeglądu systematycznego. Rezultatem zastosowania przez Cuthberta i Goodhearta kryterium doboru kappa było wykluczenie wszystkich badań z wyjątkiem tych o umiarkowanej lub doskonałej rzetelności/ważności. Nieobiektywne kryterium włączenia wyraźnie stworzyło tautologię, która przesądziła o pozytywnym wniosku dotyczącym użyteczności MMT.
Ocena jakości i synteza dowodów
Ocena jakości badań jest ważnym aspektem przeglądów literatury i z pewnością istnieje wiele metod, aby to zrobić. Cuthbert i Goodheart piszą w części poświęconej metodom, że dokonano oceny jakości. Dopiero na końcu pracy autorzy przyznają, że wewnętrzna i zewnętrzna ważność nie została poddana krytycznej ocenie. Autorzy nie mieli formalnych kryteriów ani algorytmu syntezy piśmiennictwa w celu wyciągnięcia wniosków na temat MMT w ogóle i AK w szczególności. Bez oceny jakości, badania o dużej wartości merytorycznej nieuchronnie nie będą miały większej wagi niż badania z poważnymi wadami projektowymi i niepopartymi wnioskami. W szczególności, nie jest wskazane, aby brać wnioski autorów z włączonych artykułów za wartość nominalną. Błędne interpretacje występują. Niektóre przykłady w literaturze chiropraktyka wniosków niezgodnych z projektem badania i wyników są zidentyfikowane w kilku przeglądach .
Dowody z badań leczenia
Cuthbert i Goodheart próbują wnioskować kliniczne znaczenie dla diagnozy MMT z badań z pozytywnymi wynikami leczenia. Jednym z przykładów przytoczonych przez autorów w tabeli 4 jest badanie obserwacyjne Moncayo i wsp. Sugerowana logika jest taka, że jeśli procedura AK jest używana do identyfikacji potrzeby leczenia, a pacjenci mają pozytywne wyniki, to są dowody, że procedura AK jest wartościowym narzędziem diagnostycznym. Wadą tego rozumowania jest to, że stan pacjentów może się poprawić pomimo zastosowanych procedur diagnostycznych. Zostało to faktycznie wykazane w randomizowanym badaniu oceniającym skuteczność powszechnie stosowanej chiropraktycznej procedury diagnostycznej. Skuteczne leczenie (np. manipulacja kręgosłupa) nie wymaga ważnego lub skutecznego testu diagnostycznego jako wskaźnika leczenia.
Dowody z randomizowanych badań
Autorzy zauważają kilka razy w tekście, że MMT został zbadany w randomizowanych badaniach. Twierdzenie to wymaga pewnego wyjaśnienia. We wszystkich cytowanych badaniach z randomizacją pacjenci byli randomizowani do leczenia lub kontroli leczenia, a nie do testu diagnostycznego lub kontroli testu diagnostycznego. Oznacza to, że badana była skuteczność leczenia, a nie skuteczność MMT. Jednak autorzy zawyżyli znaczenie oceny wiarygodności i ważności MMT, powołując się na prestiż badań z randomizacją; nierandomizowane badania przekrojowe/podłużne mają taką samą wagę dla oceny testów diagnostycznych i prognostycznych.
Skuteczność (wkład w wyniki pacjenta) testów diagnostycznych i wskaźników manipulacji może i powinna być oceniana w zaślepionych badaniach z randomizacją. Zgadzamy się zatem z twierdzeniem autorów, że więcej randomizowanych badań jest niezbędnych do walidacji zastosowań MMT w AK. Jednakże, randomizowane próby skuteczności leczenia nie zwalidują diagnostyki AK, jak twierdzą autorzy.
Ślepe randomizowane próby mogą być użyte nie tylko do oceny skuteczności testu, ale także do zbadania ważności konstruktu i wkładu testów prowokacyjnych (np., wyzwanie stawu) do wyników MMT. Kilka badań wiarygodności konstruktu testów stosowanych w AK omówiono poniżej w części dotyczącej wiarygodności konstruktu.
Reliability
Reliability jest zwykle uważana za warunek konieczny, ale niewystarczający do ustalenia przydatności testu diagnostycznego. To znaczy, słaba rzetelność generalnie wyklucza przydatność testu (przynajmniej w kontekście tego, jak jest mierzony), ale dobra rzetelność nie zapewnia przydatności. Jak wspomniano powyżej, nie kwestionujemy rzetelności ortopedycznego/neurologicznego MMT, a interesuje nas jedynie rzetelność wyraźnie AK-owskich zastosowań MMT. Kilka takich podwójnie ślepych badań zostały pominięte w przeglądzie.
Jacobs wykazał dobrą wiarygodność w niezaślepionym teście roztworów cukru, ale tylko uczciwa wiarygodność w podwójnie ślepym teście odpowiedzi MMT na doustnie podawanych roztworów olejowych. Haas i wsp. stwierdzili niską wiarygodność międzyegzaminacyjną MMT dla wyzwania kręgowego (zmiana „siły” mięśni po kierunkowym nacisku na wyrostek kolczysty kręgu). Dwa małe badania z podwójnie ślepą próbą dotyczyły odpowiedzi MMT na substancje w butelkach trzymane w ręku pacjenta. Ludtke i wsp. stwierdzili, że odpowiedź nie była lepsza niż zgadywanie zarówno dla jadu osy, jak i substancji obojętnej, Garrow wykazał brak odtwarzalności testu-retest MMT dla identyfikacji potencjalnych alergenów. Pothmann i wsp. stwierdzili dobrą, ale słabą (kappa = 0) wiarygodność testów mięśniowych stosowanych do identyfikacji nietolerancji pokarmowej u dzieci. Należy pamiętać, że przejrzeliśmy tylko angielski abstrakt przetłumaczony z języka niemieckiego.
Inne badania wiarygodności, które nie zostały uwzględnione w przeglądzie, opisano poniżej. Były one albo źle zaprojektowane, albo miały negatywne wyniki.
Peterson stwierdził niską wiarygodność w badaniu pobudzenia emocjonalnego; wiarygodność poprawiła się radykalnie, gdy uwzględniono zmienne zakłócające. Jednak badanie to było źle zaprojektowane, ponieważ negatywne czynniki zakłócające zostały zidentyfikowane i wyeliminowane post hoc za pomocą wywiadów półstrukturalnych, podczas gdy pozytywne czynniki zakłócające nie były poszukiwane. W badaniu Kenney i wsp. 11 osób zostało przebadanych przez 3 wyszkolonych testerów mięśni pod kątem potrzeby suplementacji 4 różnych składników odżywczych (cynk, witamina C, tiamina i witamina A). Egzaminatorzy nie zgadzali się ze sobą, ani żaden z ich indywidualnych wyników nie korelował z wynikami badań laboratoryjnych, nie było też korelacji między ręcznymi i mechanicznymi pomiarami siły mięśniowej (słaba wiarygodność i ważność).
Rybeck i Swenson stwierdzili, że ręczne badanie mięśni (z Latissimus dorsi), ale nie mechaniczne badanie mięśni, jest w stanie rozróżnić między cukrem a brakiem cukru umieszczonym pod językiem. Należy zauważyć, że osoby badane nie były zaślepione. Chociaż Friedman i Weisberg próbowali przetestować pewne procedury AK, ich badanie po prostu wymieniało dane i nie zawierało żadnej analizy statystycznej, co utrudniało jego interpretację.
Ważność konstruktu
Leboeuf i wsp. badali tzw. test ramienia dołu pachowego, metodę ręcznego testowania mięśni stosowaną w technice Sacro-Occipital (SOT). Ocenili konstrukt SOT, że test ramię- dół (test mięśniowy w stylu AK z powiązanym testem wyzwań) reaguje na właściwe, zalecane leczenie blokujące, ale nie reaguje (bez zmian) po niewłaściwym leczeniu lub bez leczenia (N = 45). Test powrócił do normy podczas obserwacji odpowiednio u 73%, 37,5% i 14% uczestników. Wyniki w tym badaniu były niejednoznaczne. Na korzyść konstruktu przemawia fakt, że osoby prawidłowo leczone częściej miały prawidłowy wynik badania kontrolnego niż osoby nieleczone. W przeciwieństwie do przewidywań, testy post hoc nie wykazały różnicy między grupami leczonymi prawidłowo i nieprawidłowo, ani między grupami leczonymi nieprawidłowo i nieleczonymi (P > .025). Tylko grupa prawidłowo leczona wykazała wyniki testów uzupełniających różniące się od zwykłego zgadywania. Należy podkreślić, że dowody te nie są silne, ze względu na małą liczebność próby i niezaślepionych uczestników badania.
Ważne dowody negatywne nie zostały uwzględnione w przeglądzie: praca Jacobsa i wsp, Triano oraz Haasa i wsp . Jacobs stwierdził, że odpowiedzi MMT na roztwory doustne nie były zgodne z teoretycznymi oczekiwaniami AK w podwójnie ślepym eksperymencie .
Triano przeprowadził dwa eksperymenty z podwójnie ślepą próbą (używając krzyżowego projektu randomizowanej próby), aby ocenić konstrukt AK, że słaby Latissimus dorsi jest związany z potrzebą trzustkowej suplementacji odżywczej . Bardziej szczegółowo, dwa teoretyczne konstrukty badane były takie, że podjęzykowe lub skórne wyzwanie z ekstraktem z tkanki trzustki może przywrócić Latissimus dorsi MMT do normy. Wyzwaniami kontrolnymi były ekstrakty z serca, grasicy i jąder, które zostały zidentyfikowane przez praktyków AK jako mało prawdopodobne, aby wpłynąć na MMT. Nie było różnic w ilości pozytywnych testów po wyzwaniu pomiędzy ekstraktami, co wskazuje na brak związku pomiędzy wyzwaniem z ekstraktem trzustkowym a siłą Latissimus dorsi. Triano zasugerował, że przyszłe badania kliniczne AK powinny być informowane przez konstrukty opracowane na podstawie badań nauk podstawowych mechanizmów AK.
Haas i wsp. przeprowadzili randomizowane badanie z podwójnie ślepą próbą, na grupie uczestników z i bez bólu pleców, aby ocenić związek odpowiedzi MMT na prowokacyjne wyzwanie kręgów i manipulację kręgosłupa. Badano konstrukt AK, że MMT z prowokacją kręgosłupa może być użyta do monitorowania odpowiedzi na manipulację kręgosłupem. Pierwsza faza badania była projektem crossover w celu porównania odpowiedzi MMT mięśnia gruszkowatego na prowokacyjne wyzwanie kręgowe i wyzwanie pozorowane. Druga faza badania była projektem równoległych grup w celu porównania odpowiedzi MMT na wyzwanie kręgów u uczestników otrzymujących manipulację lub nie otrzymujących manipulacji kręgosłupa. Interesujące jest to, że wskaźniki pozytywnych testów były zgodne przed leczeniem na wszystkich segmentach kręgów (średnia = 5.6%), a po interwencji zarówno dla grupy leczonej jak i kontrolnej po manipulacji na poziomach kręgów z przedtestem pozytywnym i z przedtestem negatywnym MMT (8% do 10%). Autorzy doszli do wniosku, że „Dla badanej populacji odpowiedź mięśniowa wydaje się być zjawiskiem losowym, niezwiązanym z podwichnięciem stawu. Samo w sobie, testowanie mięśni wydaje się być wątpliwe w użyciu dla przesiewowych badań kręgosłupa i oceny po korekcji.”
W tych badaniach jest powtarzający się temat. Ślepa próba MMT wykazuje jednolity wskaźnik pozytywnych testów, niezależnie od obecności/braku lub rodzaju testu prowokacyjnego (np. wyzwanie kręgosłupowe). Możemy postawić hipotezę, że może istnieć nieodłączny wskaźnik pozytywnych testów związanych z poszczególnymi mięśniami. Być może wskaźnik ten jest zależny od stanu zdrowia pacjenta. Co ciekawe, ponieważ odsetek pozytywnych testów jest dość mały, wszelkie dalsze testy, z lub bez testu prowokacyjnego, mają wysokie prawdopodobieństwo wyniku negatywnego. Dlatego klinicyści będą nieuchronnie myśleć, że skutecznie leczyli stan zidentyfikowany przez pierwotny test, pomimo faktu, że wyniki testu kontrolnego mogą być niezależne od interwencji. Oznacza to, że klinicysta może zostać oszukany przez statystycznie przypadkowe zjawisko związane z bezwartościowym testem, testem z wynikami niezwiązanymi z procedurą prowokacyjną i niewrażliwymi na manipulację kręgosłupem.
Ważność kryterium
Cuthbert i Goodheart nie ustalili ważności kryterium dla jakiegokolwiek MMT przypuszczalnie związanego z warunkiem (nerwowo-mięśniowo-szkieletowym lub innym) niezwiązanym z nerwowo-mięśniowo-szkieletowym warunkiem tego samego mięśnia. Tak więc, nie przedstawili dowodów na ważność kryterium dla każdego wyzwania AK lub testu lokalizacji terapii.
Autorzy przytaczają badanie testu lokalizacji terapii przeprowadzone przez Pollard i wsp, które wykorzystywało kontakt dłoni pacjenta z „punktem zastawki krętniczo-kątniczej” w połączeniu z MMT mięśnia deltoidalnego w celu identyfikacji pacjentów z bólem dolnej części pleców (złoty standard). Badanie wykazało wysoką czułość i specyficzność testu. Jednakże, unikalne efekty związane z lokalizacją terapii i MMT różnych populacji z wykorzystaniem mięśnia deltoidalnego zostały pomieszane, a efekty żadnego z komponentów nie zostały ocenione. Na przykład, obserwowana ważność mogła być spowodowana różnym wskaźnikiem bazowych testów pozytywnych u osób z i bez bólu dolnej części pleców, a nie miała nic wspólnego z testem lokalizacji terapii. Różnice w ilości pozytywnych testów mogły być związane z rozproszeniem uwagi lub dyskomfortem spowodowanym samym bólem pleców, tak że te same wyniki można było uzyskać z każdego mięśnia. Nie było gwarancji, że uczestnicy będą naiwni co do celu badania. Kwestie te można było rozwiązać za pomocą opisanych powyżej badań randomizowanych. Wreszcie, wysoka czułość i specyficzność w tym konkretnym badaniu nie jest klinicznie przekonywująca z dwóch powodów. Nie wskazuje ono na żadne specyficzne leczenie, a istnieje doskonale dokładny, opłacalny i łatwy do wykonania test: zgłoszenie przez pacjenta bólu w dolnej części pleców.
Autorzy włączyli wczesne badanie Jacobsa i wsp. które dotyczyło korelacji baterii testów AK dla funkcji tarczycy z niezależną oceną za pomocą objawów klinicznych i badań laboratoryjnych. Pacjenci byli oceniani w 7-punktowej skali od niekwestionowanej niedoczynności tarczycy do niekwestionowanej nadczynności tarczycy. Nie opisano protokołu ustalania ocen w skali na podstawie baterii wyników badań. Korelacja między schematem AK a innymi bateriami testów wynosiła r = 0,32 do 0,36, co wskazuje na umiarkowaną dokładność. Wyniki te można również tłumaczyć brakiem definitywnego złotego standardu lub, być może, niestandaryzowanymi metodami interpretacji testów.
Nieobecni byli Pothmann i wsp., którzy nie stwierdzili istotnego związku AK MMT z testami laboratoryjnymi służącymi do identyfikacji nietolerancji pokarmowej u dzieci: RAST (radioallergosorbent test) i Cytolisa (czułość 73,6%, swoistość 45,2%) oraz wodorowym testem oddechowym na laktozę (czułość 77,1%, swoistość 43,2%) . Słabe pozytywne współczynniki prawdopodobieństwa (1,34 i 1,36) i słaba wiarygodność międzyegzaminacyjna sugerują, że test działa nie lepiej niż zgadywanie.
Reviews and critiques
Autorzy nie uznali wcześniejszych przeglądów i krytyki AK. Teuber i Porch-Curren zauważają, że kilka badań obala AK w diagnostyce alergii pokarmowych i konkludują: „Waga dotychczasowych dowodów sugeruje, że ta metoda diagnostyczna nie jest zatwierdzona, gdy poddaje się ją kontroli”. Tschernitschek i Fink dokonali przeglądu procedur AK, w tym tych stosowanych w stomatologii. Stwierdzili, że brak jest dowodów na skuteczność, niezawodność i ważność AK . Haas stwierdził, że wiarygodność MMT nie może być potwierdzona przed 1991 r. z powodu ograniczeń metodologicznych i statystycznych opublikowanych badań. Klinkoski i LeBoeuf dokonali przeglądu prac naukowych opublikowanych przez International College of Applied Kinesiology w latach 1981-1987. Autorzy stwierdzili, że nie można wyciągnąć żadnych wniosków ze względu na niedostateczną jakość metodologiczną opartą na jasnym określeniu wielkości próby, kryteriów włączenia, ślepych i naiwnych uczestników, wiarygodnych metod badawczych, ślepych oceniających i analizy statystycznej. Motyka i Yanuck stwierdzili, że badania nad AK są niejednoznaczne, czasami potwierdzające wiarygodność i ważność, innym razem nie potwierdzające, a często po prostu nieistotne z powodu różnych wad projektowych.
Diagnozowanie przedklinicznych i subklinicznych chorób
Przedstawiciele AK twierdzą, że są w stanie zdiagnozować przedkliniczne i subkliniczne warunki. Wykazanie ważności MMT dla takich warunków wymagałoby porównania do standardu o silnej ważności predykcyjnej choroby, lub wykazanie, że opieka profilaktyczna oparta na wynikach AK MMT zapobiega lub zmniejsza rozwój choroby w stosunku do nieleczonej grupy kontrolnej. Nie udało nam się znaleźć takich badań.