Elementi di valutazione

La validità di questa revisione della MMT dipende inevitabilmente dalla qualità del processo di revisione. Non sembra che l’intento degli autori sia stato quello di condurre una revisione sistematica completa della letteratura, e noi non li riteniamo in grado di farlo. Tuttavia, gli elementi di progettazione di una buona revisione sistematica dei test diagnostici, così come la valutazione critica della letteratura sulla valutazione delle misure, sono pertinenti alla discussione in corso. Anche la più tradizionale revisione narrativa condivide molti di questi elementi. Abbiamo compilato delle domande che devono essere considerate per trarre un’inferenza valida sull’utilità delle procedure diagnostiche AK (Tabella 1); queste domande sono basate sulla ricerca e sulla metodologia di sintesi delle citazioni di cui sopra. Le risposte a queste poche domande pongono una seria sfida alla conclusione degli autori sull’utilità della AK.

Tabella 1 Domande di valutazione critica per la Kinesiologia Applicata (AK)

L’intreccio AK

AK ha una lunga e ricca storia nella chiropratica. Molti chiropratici riportano l’uso della tecnica in qualche forma . Chiaramente, AK è visto dai suoi sostenitori come qualcosa di più di un test muscolare ortopedico/neurologico standard. La MMT, come eseguita dai chiropratici, non differisce necessariamente nella sua esecuzione e interpretazione dal test muscolare manuale come eseguito e interpretato dagli standard applicati in medicina fisica. Per entrambi i professionisti, un muscolo debole potrebbe suggerire una patologia muscolare o neurologica primaria. Tuttavia, la tecnica AK utilizza il test muscolare manuale non solo per valutare l’integrità funzionale del muscolo e la fornitura di nervi, ma anche come un mezzo per “diagnosticare disfunzioni strutturali, chimiche e mentali”. Alcune delle sue procedure diagnostiche distintive includono l’uso di test provocatori (cioè, AK challenge e localizzazione della terapia) in combinazione con MMT per identificare la necessità di trattamento di condizioni neuromuscoloscheletriche, organiche e metaboliche. La debolezza muscolare è anche considerata diagnostica della malattia organica pre/subclinica, non neuromuscoloscheletrica.

MMT è una componente standard dell’esame fisico neuromuscoloscheletrico. Siamo d’accordo con gli autori che la MMT è utile nella valutazione della debolezza dei muscoli direttamente coinvolti nel dolore, nelle lesioni e nei disturbi neuromuscoloscheletrici. Tuttavia, l’estrapolazione delle proprietà della MMT alle applicazioni uniche di AK è rischiosa per diverse ragioni. L’affidabilità/validità della MMT per specifiche condizioni neuromuscoloscheletriche potrebbe non essere generalizzabile ad altre applicazioni come l’identificazione di disturbi organici. La MMT può essere affidabile/accurata per la valutazione della forza muscolare in modo isolato, ma non quando viene usata insieme a una sfida spinale (forza applicata a un’articolazione vertebrale) o altri test provocatori usati per la diagnosi specifica di AK. Gli autori confondono anche due usi del termine validità: accuratezza del test e validità diagnostica. Un test può essere estremamente accurato, diciamo per esempio la valutazione dinamometrica della forza muscolare in newton, ma non ha ancora sensibilità o specificità per la diagnosi di una condizione specifica. Cuthbert e Goodheart hanno confuso le prove per l’AK con le prove di affidabilità/validità della MMT ortopedica standard. L’affidabilità e l’accuratezza della MMT non stabilisce l’utilità della MMT per le sue applicazioni uniche di AK.

Strategia di ricerca e criteri di inclusione

La revisione di Cuthbert e Goodheart illustra come l’incapacità di utilizzare una strategia di ricerca fastidiosa può perdere citazioni critiche e impattare i risultati della revisione. Gli autori hanno condotto una ricerca online su PubMed e CINAHL, utilizzando i termini di ricerca “manual muscle test” e “manual muscle testing”. Non sono stati forniti ulteriori dettagli, quindi la ricerca non può essere duplicata esattamente. Ci sono diversi problemi relativi alla portata della ricerca che possono aver portato all’omissione di articoli rilevanti. Nella nostra ricerca su PubMed, l’aggiunta del termine di ricerca “muscle testing” ha aumentato il numero di articoli trovati da 639 a 13.802. Abbiamo anche condotto una ricerca utilizzando MEDLINE e CINAHL. Includendo il termine aggiuntivo “muscle testing”, il numero di risultati è aumentato da 454 a 709, e il numero di articoli riguardanti specificamente l’affidabilità/validità da 97 a 136. Il secondo problema è che Cuthbert e Goodheart non hanno cercato nel database chiropratico, MANTIS. Includere una ricerca in questo database ha aumentato il numero di articoli sui test muscolari da 709 a 1297 e il numero di articoli relativi all’affidabilità/validità da 136 a 221. Abbiamo anche condotto una ricerca utilizzando la strategia booleana: Applied Kinesiology AND (reliability OR validity). L’inclusione di MANTIS ha aumentato il nostro rendimento da 15 a 32 articoli. Gli autori potrebbero anche non aver usato un’altra importante strategia di ricerca, cioè controllare i riferimenti degli articoli per identificare ulteriori studi pertinenti.

Gli autori hanno dichiarato di aver selezionato gli studi in base alla rilevanza, ma non hanno incluso una definizione operativa. Sembra che qualsiasi articolo di MMT su un disturbo legato al dolore sia stato considerato rilevante. Non è chiaro come “affidabilità/validità” e “MMT” siano stati usati nel processo di selezione. Gli studi negativi sono stati certamente omessi. Se gli autori avessero usato il termine di ricerca “test muscolare” e incluso il database MANTIS, non avrebbero mancato di identificare studi randomizzati progettati specificamente per valutare il contributo di una procedura di AK-challenge ai risultati MMT. In ogni caso, gli autori avrebbero dovuto essere a conoscenza dello studio del 1982 di Triano, condotto con l’assistenza dell’International College of Applied Kinesiology e criticato da Goodheart in una lettera all’editore.

Un criterio di selezione ha introdotto un bias chiaro e significativo nella revisione. Gli studi sono stati inclusi solo se è stato riportato un kappa ≥ 0,5 per la valutazione dell’affidabilità o della validità (sebbene il kappa non sia generalmente un indice di validità). Chiaramente questo criterio di inclusione non è stato applicato uniformemente, poiché molti degli studi inclusi non hanno affrontato l’affidabilità e quindi non hanno riportato un valore di kappa. Ancora più importante, l’uso di questo criterio era basato su un malinteso di Swinkles et al . Questi autori hanno usato il criterio per stabilire gli standard per determinare se certi strumenti avessero una buona validità di costrutto; non hanno usato una soglia di kappa ≥ 0,5 per identificare l’ammissibilità per la loro revisione sistematica. Il risultato dell’utilizzo di questo criterio di selezione kappa da parte di Cuthbert e Goodheart è stata l’esclusione di tutti gli studi tranne quelli con affidabilità/validità da moderata a eccellente. Il criterio di inclusione distorto ha chiaramente impostato una tautologia che predeterminava una conclusione positiva sull’utilità della MMT.

Valutazione della qualità e sintesi delle prove

La valutazione della qualità degli studi è un aspetto importante delle revisioni della letteratura, e certamente ci sono molti metodi per farlo. Cuthbert e Goodheart scrivono nella sezione metodi che è stata effettuata una valutazione della qualità. Non è fino alla fine del documento che gli autori riconoscono che la validità interna ed esterna non sono state valutate criticamente. Gli autori non avevano alcun criterio formale o algoritmo per sintetizzare la letteratura per raggiungere una conclusione sulla MMT in generale e sulla AK in particolare. Senza una valutazione della qualità, gli studi di grande merito non hanno inevitabilmente più peso degli studi con gravi difetti di progettazione e conclusioni non supportate. In particolare, non è consigliabile prendere le conclusioni degli autori degli articoli inclusi al valore nominale. Si verificano interpretazioni errate. Alcuni esempi nella letteratura chiropratica di conclusioni incoerenti con il disegno dello studio e i risultati sono identificati in diverse recensioni.

Evidenza dalle indagini sul trattamento

Cuthbert e Goodheart tentano di dedurre la rilevanza clinica per la diagnosi di MMT da studi con risultati positivi del trattamento. Un esempio citato dagli autori nella loro tabella 4 è uno studio osservazionale di Moncayo et al . La logica implicita è che se una procedura AK è usata per identificare la necessità di trattamento e i pazienti hanno risultati positivi, allora c’è la prova che la procedura AK è un valido strumento diagnostico. Il difetto di questa linea di ragionamento è che i pazienti possono migliorare nonostante le procedure diagnostiche utilizzate. Questo è stato effettivamente dimostrato in uno studio randomizzato che valuta l’efficacia di una procedura diagnostica chiropratica comunemente usata. Un trattamento efficace (per esempio la manipolazione spinale) non richiede un test diagnostico valido o efficace come indicatore di trattamento.

Evidenza da studi randomizzati

Gli autori notano più volte nel testo che la MMT è stata studiata in studi randomizzati. Questa affermazione richiede alcuni chiarimenti. In tutti gli studi randomizzati citati, i pazienti sono stati randomizzati al trattamento o al controllo del trattamento, e non al test diagnostico o al controllo del test diagnostico. Questo significa che l’efficacia del trattamento era sotto esame, piuttosto che l’efficacia della MMT. Tuttavia, gli autori hanno gonfiato l’importanza della valutazione dell’affidabilità e della validità della MMT invocando il prestigio dello studio randomizzato; gli studi cross-sectional/longitudinali non randomizzati hanno lo stesso peso per la valutazione dei test diagnostici e prognostici.

L’efficacia (contributo agli esiti dei pazienti) dei test diagnostici e degli indicatori di manipolazione può e deve essere valutata in studi randomizzati in cieco. Siamo quindi d’accordo con l’affermazione degli autori che sono necessari più studi randomizzati per convalidare le applicazioni AK della MMT. Tuttavia, gli studi randomizzati sull’efficacia del trattamento non convalideranno la diagnostica dell’AK, come sostengono gli autori.

Gli studi randomizzati in cieco possono essere utilizzati non solo per valutare l’efficacia dei test, ma anche per indagare la validità del costrutto e il contributo dei test provocatori (ad esempio, la sfida articolare) ai risultati della MMT. Diversi test di validità di costrutto dei test usati nella AK sono discussi sotto la voce validità di costrutto.

Affidabilità

L’affidabilità è solitamente considerata una condizione necessaria ma non sufficiente per stabilire l’utilità di un test diagnostico. Cioè, una scarsa affidabilità generalmente esclude l’utilità di un test (almeno nel contesto di come viene misurato), ma una buona affidabilità non assicura l’utilità. Come detto sopra, non contestiamo l’affidabilità della MMT ortopedica/neurologica, e siamo solo interessati all’affidabilità delle applicazioni della MMT distintamente AK. Diversi studi in doppio cieco sono stati omessi dalla revisione.

Jacobs ha mostrato una buona affidabilità in un test non cieco di soluzioni di zucchero ma solo una discreta affidabilità in un test in doppio cieco della risposta della MMT a soluzioni di olio somministrate per via orale. Haas et al hanno trovato una scarsa affidabilità interesaminatori della MMT di una sfida vertebrale (cambiamento di “forza” muscolare a seguito di una pressione direzionale sul processo spinoso vertebrale). Due piccoli studi in doppio cieco hanno esaminato la risposta della MMT a sostanze in bottiglia tenute in mano dal paziente. Ludtke et al. hanno trovato che la risposta non era migliore dell’indovinare sia per il veleno di vespa che per la sostanza inerte, Garrow non ha mostrato alcuna riproducibilità test-retest della MMT per identificare potenziali allergeni. Pothmann et al. hanno trovato una buona affidabilità intra-esaminatore, ma scarsa inter-esaminatore (kappa = 0) per i test muscolari utilizzati per identificare l’intolleranza alimentare nei bambini. Si noti che abbiamo visto solo l’abstract inglese tradotto dal tedesco.

Altri studi di affidabilità non inclusi nella revisione sono descritti di seguito. Questi erano progettati male o avevano risultati negativi.

Peterson ha trovato una scarsa affidabilità in uno studio sull’eccitazione emotiva; l’affidabilità è migliorata notevolmente quando le variabili di confondimento sono state prese in considerazione. Tuttavia, questo studio è stato progettato male in quanto i confondenti negativi sono stati identificati ed eliminati post hoc utilizzando interviste semi-strutturate, mentre i confondenti positivi non sono stati cercati. In Kenney et al, 11 soggetti sono stati esaminati da 3 tester muscolari addestrati per la necessità di integrazione con 4 diversi nutrienti (zinco, vitamina C, tiamina e vitamina A). Gli esaminatori non erano d’accordo tra loro, né nessuno dei loro risultati individuali era correlato con i test di laboratorio, né c’era alcuna correlazione tra le misure manuali e meccaniche della forza muscolare (scarsa affidabilità e validità).

Rybeck e Swenson hanno trovato il test muscolare manuale (con il Latissimus dorsi), ma non il test muscolare meccanico, in grado di discriminare tra zucchero e non zucchero posto sotto la lingua. Va notato che i soggetti non erano ciechi. Anche se Friedman e Weisberg hanno tentato di testare alcune procedure AK, il loro studio ha semplicemente elencato i dati e mancava qualsiasi analisi statistica, rendendolo difficile da interpretare.

Validità del costrutto

Leboeuf et al hanno studiato il cosiddetto test braccio-fossa, un metodo di test muscolare manuale utilizzato nella Tecnica Sacro-Occipitale (SOT) . Hanno valutato il costrutto SOT secondo il quale il test braccio-fossa (test muscolare stile AK con test di sfida associato) risponde a un trattamento di blocco corretto prescritto, ma non risponde (invariato) dopo un trattamento improprio o nessun trattamento (N = 45). Il test è tornato normale al follow-up nel 73%, 37,5% e 14% dei partecipanti rispettivamente. I risultati sono stati misti in questo studio in cieco. A sostegno del costrutto, i soggetti trattati correttamente avevano più probabilità di avere un follow-up normale rispetto ai soggetti non trattati. Contrariamente alle previsioni, i test post hoc non hanno mostrato alcuna differenza tra i gruppi trattati correttamente e quelli non trattati, o tra i gruppi trattati impropriamente e quelli non trattati (P > .025). Solo il gruppo trattato correttamente ha dimostrato risultati dei test di follow-up diversi dalla semplice supposizione. Va sottolineato che l’evidenza non è forte, a causa della piccola dimensione del campione e dei soggetti non ciechi.

Un’importante evidenza negativa non è stata inclusa nella revisione: il lavoro di Jacobs et al, Triano, e Haas et al . Jacobs ha trovato che le risposte della MMT alle soluzioni orali non erano coerenti con le aspettative teoriche dell’AK in un esperimento in doppio cieco.

Triano ha condotto due esperimenti in doppio cieco (utilizzando un design di prova randomizzato crossover) per valutare il costrutto dell’AK secondo cui un Latissimus dorsi debole è associato alla necessità di un’integrazione nutrizionale pancreatica. Più specificamente, i due costrutti teorici studiati erano che una sfida sublinguale o cutanea con estratto di tessuto pancreatico può ripristinare la MMT del Latissimus dorsi alla normalità. Le sfide di controllo erano estratti cardiaci, timici e testicolari che sono stati identificati dai professionisti di AK come improbabili per influenzare la MMT. Non ci sono state differenze nei tassi di test positivi post-challenge tra gli estratti, indicando che non c’è relazione tra la sfida dell’estratto pancreatico e la forza del Latissimus dorsi. Triano ha suggerito che la futura ricerca clinica sull’AK dovrebbe essere informata dai costrutti sviluppati dagli studi scientifici di base sui meccanismi dell’AK.

Haas et al hanno condotto uno studio randomizzato in doppio cieco, su un mix di partecipanti con e senza mal di schiena, per valutare la relazione della risposta della MMT a una sfida vertebrale provocatoria e alla manipolazione spinale. Hanno studiato il costrutto AK che la MMT con la sfida spinale può essere usata per monitorare la risposta alla manipolazione spinale. La prima fase dello studio era un disegno crossover per confrontare la risposta MMT del piriforme a una sfida vertebrale e una sfida finta. La seconda fase dello studio era un disegno a gruppi paralleli per confrontare la risposta della MMT al challenge vertebrale nei partecipanti che ricevevano una manipolazione o non ricevevano alcuna manipolazione della colonna vertebrale. È interessante notare che i tassi di test positivi erano coerenti prima del trattamento tra i segmenti vertebrali (media = 5,6%), e dopo l’intervento per entrambi i gruppi di trattamento e di controllo dopo la manipolazione ai livelli vertebrali con MMT positiva e negativa al pre-test (dall’8% al 10%). Gli autori hanno concluso: “Per la popolazione in studio, la risposta muscolare sembrava essere un fenomeno casuale non collegato alla sublussazione manipolabile. Di per sé, il test muscolare sembra essere di uso discutibile per lo screening spinale e la valutazione post-aggiustamento.”

C’è un tema ricorrente in questi studi. La MMT in cieco dimostra tassi uniformi di test positivi, indipendentemente dalla presenza/assenza o dal tipo di test provocatorio (ad esempio, la sfida spinale). Possiamo ipotizzare che ci possa essere un tasso intrinseco di test positivi associato a particolari muscoli. Forse questo tasso dipende dallo stato di salute del paziente. È interessante notare che, poiché queste percentuali di test positivi sono abbastanza piccole, qualsiasi test di follow-up, con o senza test provocatorio, ha un’alta probabilità di essere negativo. Pertanto, i medici penseranno inevitabilmente di aver trattato con successo una condizione identificata dal test originale, nonostante il fatto che i risultati del test di follow-up possano essere indipendenti dall’intervento. Cioè, il clinico potrebbe essere ingannato da un fenomeno statisticamente casuale associato a un test senza valore, un test con risultati non correlati alla procedura provocatoria e insensibile alla manipolazione spinale.

Validità di criterio

Cuthbert e Goodheart non hanno stabilito la validità di criterio per qualsiasi MMT putativamente associata a una condizione (neuromuscoloscheletrica o altro) non correlata a una condizione neuromuscoloscheletrica dello stesso muscolo. Così, non hanno presentato prove per la validità del criterio per qualsiasi AK challenge o test di localizzazione della terapia.

Gli autori citano uno studio di un test di localizzazione della terapia di Pollard et al, che ha utilizzato il contatto della mano del paziente sul “punto della valvola ileocecale” in combinazione con una MMT deltoide per identificare i pazienti con dolore lombare (gold standard). Lo studio ha mostrato un’alta sensibilità e specificità del test. Tuttavia, gli effetti unici associati alla localizzazione della terapia e alla MMT di popolazioni diverse che utilizzano il muscolo deltoide sono stati confusi e gli effetti di nessuna delle due componenti sono stati valutati. Per esempio, la validità osservata potrebbe essere dovuta a diversi tassi di test positivi di base in persone con e senza dolore lombare, e nulla a che fare con il test di localizzazione della terapia. La diversa percentuale di test positivi potrebbe essere banalmente legata alla distrazione o al disagio del mal di schiena stesso, per cui si sarebbero potuti ottenere gli stessi risultati da qualsiasi muscolo. Non era garantito che i partecipanti fossero ingenui rispetto allo scopo dello studio. Questi problemi potrebbero essere risolti utilizzando studi randomizzati come descritto sopra. Infine, l’alta sensibilità e specificità in questo studio particolare non sono clinicamente convincenti per due motivi. Non indica alcun trattamento specifico, e c’è un test perfettamente accurato, conveniente e facilmente eseguibile: il rapporto del paziente sul dolore lombare.

Gli autori hanno incluso un primo studio di Jacobs et al che ha esaminato la correlazione di una batteria di test AK per la funzione tiroidea con una valutazione indipendente utilizzando segni e sintomi clinici e test di laboratorio. I pazienti sono stati valutati su una scala di 7 punti da ipotiroidismo indiscutibile a ipertiroidismo indiscutibile. Il protocollo per determinare le valutazioni della scala dalla batteria di risultati dei test non è stato descritto. La correlazione tra il regime AK e altre batterie di test era r = 0,32 a 0,36, indicando una precisione modesta. I risultati potrebbero anche essere spiegati dalla mancanza di un gold standard definitivo o, forse, dai metodi non standardizzati di interpretazione dei test.

Mancava Pothmann et al, che non ha trovato alcuna relazione significativa della AK MMT con i test di laboratorio per identificare l’intolleranza nutrizionale nei bambini: RAST (radioallergosorbent test) e Cytolisa (sensibilità 73,6%, specificità 45,2%) e test dell’idrogeno alito al lattosio (sensibilità 77,1%, specificità 43,2%). Gli scarsi rapporti di verosimiglianza positiva (1,34 e 1,36) e la scarsa affidabilità interesaminatori suggeriscono che il test non funziona meglio di un’ipotesi.

Revisioni e critiche

Gli autori non hanno riconosciuto precedenti recensioni e critiche di AK. Teuber e Porch-Curren notano che diversi studi confutano l’AK nella diagnosi delle allergie alimentari e concludono: “Il peso delle prove fino ad oggi suggerisce che questa modalità diagnostica non è convalidata quando è sottoposta a controllo.” Tschernitschek e Fink hanno esaminato le procedure AK, comprese quelle utilizzate in odontoiatria. Hanno concluso che c’è una mancanza di prove per l’efficacia, l’affidabilità e la validità della AK. Haas ha trovato che l’affidabilità della MMT non poteva essere provata prima del 1991 a causa delle limitazioni metodologiche e statistiche degli studi pubblicati. Klinkoski e LeBoeuf hanno esaminato gli articoli scientifici pubblicati dall’International College of Applied Kinesiology tra il 1981 e il 1987. Gli autori hanno concluso che non si potevano trarre conclusioni a causa dell’inadeguata qualità metodologica basata su una chiara identificazione delle dimensioni del campione, dei criteri di inclusione, dei soggetti ciechi e ingenui, dei metodi di test affidabili, dei valutatori ciechi e dell’analisi statistica. Motyka e Yanuck hanno trovato che il corpo della ricerca AK è equivoco, a volte confermativo dell’affidabilità e della validità, altre volte non confermativo, e spesso semplicemente irrilevante a causa di vari difetti di progettazione.

Diagnosi di malattie precliniche e subcliniche

I sostenitori di AK affermano di essere in grado di diagnosticare condizioni precliniche e subcliniche. La dimostrazione della validità della MMT per tali condizioni richiederebbe un confronto con uno standard con una forte validità predittiva della malattia, o la dimostrazione che la cura profilattica basata sui risultati della AK MMT previene o diminuisce lo sviluppo della malattia rispetto ad un gruppo di controllo non trattato. Non siamo riusciti a trovare studi di questo tipo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *