Éléments d’appréciation

La validité de cette revue de la MMT dépend inévitablement de la qualité du processus de revue. Il ne semble pas que les auteurs aient eu l’intention de procéder à une revue systématique complète de la littérature, et nous ne leur demandons pas de respecter cette norme. Cependant, les éléments de conception d’une bonne revue systématique des tests de diagnostic, ainsi que l’évaluation critique de la littérature sur l’évaluation des mesures, sont pertinents pour la discussion en cours. Même l’examen narratif plus traditionnel partage plusieurs de ces éléments. Nous avons compilé les questions qui doivent être prises en compte afin de tirer des conclusions valables sur l’utilité des procédures de diagnostic des AK (tableau 1) ; ces questions sont basées sur la méthodologie de recherche et de synthèse des citations ci-dessus. Les réponses à ces quelques questions posent un sérieux défi à la conclusion des auteurs sur l’utilité de la KA.

Tableau 1 Questions d’évaluation critique pour la kinésiologie appliquée (KA)

Enchevêtrement de la KA

La KA a une longue et riche histoire en chiropraxie . De nombreux chiropraticiens déclarent utiliser la technique sous une forme ou une autre . Il est clair que l’AK est considéré par ses partisans comme étant plus que le test musculaire orthopédique/neurologique standard. Le TMM, tel qu’il est pratiqué par les chiropraticiens, ne diffère pas nécessairement dans son exécution et son interprétation du test musculaire manuel tel qu’il est pratiqué et interprété selon les normes appliquées en médecine physique. Pour l’un ou l’autre praticien, un muscle faible peut suggérer une pathologie musculaire ou neurologique primaire. Cependant, la technique AK utilise le test musculaire manuel non seulement pour évaluer l’intégrité fonctionnelle de l’approvisionnement en muscles et en nerfs, mais aussi comme un moyen de « diagnostiquer les dysfonctionnements structurels, chimiques et mentaux ». Certaines de ses procédures de diagnostic distinctives comprennent l’utilisation de tests de provocation (c’est-à-dire le test AK et la localisation de la thérapie) en conjonction avec le TEM pour identifier le besoin de traitement des conditions neuromusculosquelettiques, organiques et métaboliques. La faiblesse musculaire est également considérée comme un diagnostic de maladie organique pré/subclinique, non neuromusculosquelettique.

La MMT est une composante standard de l’examen physique neuromusculosquelettique . Nous sommes d’accord avec les auteurs pour dire que la MMT est utile pour évaluer la faiblesse des muscles directement impliqués dans la douleur, les blessures et les troubles neuromusculosquelettiques. Cependant, l’extrapolation des propriétés de la MMT aux applications uniques de l’AK est risquée pour plusieurs raisons. La fiabilité/validité des MMT pour des conditions neuromusculosquelettiques spécifiques peut ne pas être généralisable à d’autres applications telles que l’identification de troubles organiques. La MMT peut être fiable/précise pour l’évaluation de la force musculaire de manière isolée, mais pas lorsqu’elle est utilisée conjointement avec un test de provocation vertébrale (force appliquée à une articulation vertébrale) ou un autre test provocateur utilisé pour le diagnostic spécifique des AK. Les auteurs confondent également deux utilisations du terme validité : la précision du test et la validité du diagnostic. Un test peut être extrêmement précis, par exemple l’évaluation dynamométrique de la force musculaire en newtons, mais n’avoir aucune sensibilité ou spécificité pour le diagnostic d’une affection spécifique. Cuthbert et Goodheart ont confondu les preuves de l’AK avec les preuves de la fiabilité/validité de la MMT orthopédique standard. La fiabilité et la précision de la MMT n’établissent pas l’utilité de la MMT pour ses applications uniques en matière de AK.

Stratégie de recherche et critères d’inclusion

L’examen de Cuthbert et Goodheart illustre comment le fait de ne pas utiliser une stratégie de recherche fastidieuse peut manquer des citations critiques et avoir un impact sur les résultats de l’examen. Les auteurs ont effectué une recherche en ligne dans PubMed et CINAHL, en utilisant les termes de recherche « manual muscle test » et « manual muscle testing ». Aucun autre détail n’a été fourni, de sorte que la recherche ne peut être reproduite exactement. Plusieurs problèmes liés à la portée de la recherche peuvent avoir conduit à l’omission d’articles pertinents. Dans notre recherche sur PubMed, l’ajout du terme de recherche « muscle testing » a fait passer le nombre d’articles trouvés de 639 à 13 802. Nous avons également effectué une recherche sur MEDLINE et CINAHL. L’ajout du terme « muscle testing » a fait passer le nombre d’occurrences de 454 à 709, et le nombre d’articles portant spécifiquement sur la fiabilité/validité de 97 à 136. Le deuxième problème est que Cuthbert et Goodheart n’ont pas effectué de recherche dans la base de données chiropratique MANTIS. L’inclusion d’une recherche dans cette base de données a fait passer le nombre d’articles sur les tests musculaires de 709 à 1297 et le nombre d’articles sur la fiabilité/validité de 136 à 221. Nous avons également effectué une recherche en utilisant la stratégie booléenne : Kinésiologie appliquée ET (fiabilité OU validité). L’inclusion de MANTIS a augmenté notre rendement de 15 à 32 articles. Les auteurs peuvent également avoir omis d’utiliser une autre stratégie de recherche importante, à savoir la vérification des références des articles pour identifier d’autres études pertinentes.

Les auteurs ont déclaré avoir sélectionné les études en fonction de leur pertinence, mais n’ont pas inclus de définition opérationnelle. Il semble que tout article de MMT sur un trouble lié à la douleur ait été considéré comme pertinent. Il n’est pas clair comment  » fiabilité/validité  » et  » MMT  » ont été utilisés dans le processus de sélection. Les études négatives ont certainement été omises. Si les auteurs avaient utilisé le terme de recherche  » muscle testing  » et inclus la base de données MANTIS, ils n’auraient pas manqué d’identifier des essais randomisés conçus spécifiquement pour évaluer la contribution d’une procédure de provocation AK aux résultats du MMT. Quoi qu’il en soit, les auteurs auraient dû avoir connaissance de l’étude de Triano réalisée en 1982 avec l’aide de l’International College of Applied Kinesiology et critiquée par Goodheart dans une lettre à la rédaction .

Un critère de sélection a introduit un biais clair et significatif dans l’examen. Les études n’étaient incluses que si un kappa ≥ 0,5 était rapporté pour l’évaluation de la fiabilité ou de la validité (bien que le kappa ne soit généralement pas un indice de validité). Il est clair que ce critère d’inclusion n’a pas été appliqué de manière uniforme, puisque de nombreuses études incluses ne traitaient pas de la fiabilité et ne rapportaient donc pas de valeur de kappa. Plus important encore, l’utilisation de ce critère était fondée sur une mauvaise compréhension de Swinkles et al . Ces auteurs ont utilisé ce critère pour établir des normes permettant de déterminer si certains instruments avaient une bonne validité de construction ; ils n’ont pas utilisé un seuil de kappa ≥ 0,5 pour identifier l’éligibilité pour leur revue systématique. Le résultat de l’utilisation de ce critère de sélection kappa par Cuthbert et Goodheart a été l’exclusion de toutes les études, sauf celles dont la fiabilité/validité était modérée à excellente. Le critère d’inclusion biaisé a clairement mis en place une tautologie qui a prédéterminé une conclusion positive sur l’utilité du TEM.

Évaluation de la qualité et synthèse des preuves

L’évaluation de la qualité des études est un aspect important des revues de la littérature , et il existe certainement de nombreuses méthodes pour le faire . Cuthbert et Goodheart écrivent dans la section des méthodes qu’une évaluation de la qualité a été effectuée. Ce n’est qu’à la fin de l’article que les auteurs reconnaissent que la validité interne et externe n’a pas été évaluée de manière critique. Les auteurs n’avaient pas de critères ou d’algorithme formel pour synthétiser la littérature afin de parvenir à une conclusion sur le TEM en général et sur l’AK en particulier. Sans évaluation de la qualité, les études de grand mérite n’ont inévitablement pas plus de poids que les études présentant de graves défauts de conception et des conclusions non étayées. En particulier, il n’est pas conseillé de prendre pour argent comptant les conclusions des auteurs des articles inclus. Des erreurs d’interprétation se produisent. Certains exemples dans la littérature chiropratique de conclusions incompatibles avec la conception de l’étude et les résultats sont identifiés dans plusieurs revues.

Preuves tirées d’enquêtes sur le traitement

Cuthbert et Goodheart tentent de déduire la pertinence clinique pour le diagnostic du MMT à partir d’études avec des résultats de traitement positifs. Un exemple cité par les auteurs dans leur tableau 4 est une étude observationnelle de Moncayo et al . La logique implicite est que si une procédure de KA est utilisée pour identifier la nécessité d’un traitement et que les patients ont des résultats positifs, alors il est prouvé que la procédure de KA est un outil de diagnostic précieux. La faille de ce raisonnement est que l’état des patients peut s’améliorer malgré les procédures de diagnostic utilisées. Cela a été démontré dans un essai randomisé évaluant l’efficacité d’une procédure de diagnostic chiropratique couramment utilisée. Un traitement efficace (par exemple, la manipulation vertébrale) ne nécessite pas un test de diagnostic valide ou efficace comme indicateur de traitement .

Preuves issues d’essais randomisés

Les auteurs notent à plusieurs reprises dans le texte que le TEM a été étudié dans des essais randomisés. Cette affirmation nécessite quelques éclaircissements. Dans tous les essais randomisés cités, les patients ont été randomisés pour le traitement ou le contrôle du traitement, et non pour le test diagnostique ou le contrôle du test diagnostique. Cela signifie que l’efficacité du traitement était étudiée, plutôt que l’efficacité du TEM. Cependant, les auteurs ont gonflé l’importance de l’évaluation de la fiabilité et de la validité du TEM en invoquant le prestige de l’essai randomisé ; les études transversales/longitudinales non randomisées ont le même poids pour l’évaluation des tests diagnostiques et pronostiques.

L’efficacité (contribution aux résultats des patients) des tests diagnostiques et des indicateurs de manipulation peut et doit être évaluée dans des essais randomisés en aveugle . Nous sommes donc d’accord avec l’affirmation des auteurs selon laquelle davantage d’essais randomisés sont nécessaires pour valider les applications AK de la MMT. Cependant, les essais randomisés sur l’efficacité du traitement ne valideront pas les diagnostics AK comme le soutiennent les auteurs.

Les essais randomisés en aveugle peuvent être utilisés non seulement pour évaluer l’efficacité des tests, mais aussi pour étudier la validité de construction et la contribution des tests provocateurs (par exemple, le défi articulaire) aux résultats de la MMT. Plusieurs essais sur la validité du construit des tests utilisés dans les AK sont discutés sous la rubrique validité du construit ci-dessous .

Viabilité

La fiabilité est généralement considérée comme une condition nécessaire mais insuffisante pour établir l’utilité d’un test de diagnostic . Autrement dit, une mauvaise fiabilité exclut généralement l’utilité d’un test (au moins dans le contexte de la façon dont il est mesuré ), mais une bonne fiabilité ne garantit pas l’utilité. Comme nous l’avons mentionné plus haut, nous ne contestons pas la fiabilité du TEM orthopédique/neurologique et nous ne nous intéressons qu’à la fiabilité des applications distinctes du TEM dans le domaine des AK. Plusieurs études en double aveugle de ce type ont été omises de la revue .

Jacobs a montré une bonne fiabilité dans un test non aveugle de solutions de sucre, mais seulement une fiabilité passable dans un test en double aveugle de la réponse de la MMT à des solutions huileuses administrées par voie orale . Haas et al ont trouvé une faible fiabilité inter-examinateur de la MMT d’un défi vertébral (changement de « force » musculaire suite à une pression directionnelle sur le processus épineux vertébral) . Deux petites études en double aveugle ont examiné la réponse MMT à des substances en bouteille tenues dans la main du patient. Ludtke et al. ont trouvé que la réponse n’était pas meilleure que celle de l’intuition pour le venin de guêpe et la substance inerte, Garrow n’a montré aucune reproductibilité test-retest du TEM pour identifier les allergènes potentiels. Pothmann et al. ont trouvé une bonne fiabilité intra-examinateur, mais une mauvaise fiabilité inter-examinateur (kappa = 0) pour les tests musculaires utilisés pour identifier l’intolérance alimentaire chez les enfants. Notez que nous n’avons consulté que le résumé anglais traduit de l’allemand.

Les autres études de fiabilité non incluses dans l’examen sont décrites ci-dessous. Celles-ci étaient soit mal conçues, soit avaient des résultats négatifs.

Peterson a trouvé une faible fiabilité dans une étude de l’éveil émotionnel ; la fiabilité s’est améliorée de façon spectaculaire lorsque les variables de confusion ont été prises en compte . Cependant, cette étude était mal conçue dans la mesure où les facteurs de confusion négatifs ont été identifiés et éliminés post hoc à l’aide d’entretiens semi-structurés, alors que les facteurs de confusion positifs n’ont pas été recherchés. Dans l’étude de Kenney et al, 11 sujets ont été examinés par 3 testeurs musculaires formés pour déterminer la nécessité d’une supplémentation en 4 nutriments différents (zinc, vitamine C, thiamine et vitamine A). Les examinateurs n’étaient pas d’accord entre eux, et aucun de leurs résultats individuels n’était en corrélation avec les tests de laboratoire, pas plus qu’il n’y avait de corrélation entre les mesures manuelles et mécaniques de la force musculaire (fiabilité et validité médiocres).

Rybeck et Swenson ont trouvé le test musculaire manuel (avec le Latissimus dorsi), mais pas le test musculaire mécanique, capable de discriminer entre le sucre et l’absence de sucre placé sous la langue . Il convient de noter que les sujets n’étaient pas en aveugle. Bien que Friedman et Weisberg aient tenté de tester certaines procédures de AK, leur étude a simplement répertorié les données et n’a pas fait d’analyse statistique, ce qui la rend difficile à interpréter .

Validité de construction

Leboeuf et al ont étudié le test dit du bras-fosse, une méthode de test musculaire manuel utilisée dans la technique sacro-occipitale (SOT) . Ils ont évalué la construction de la SOT selon laquelle le test bras-fosse (test musculaire de style AK avec test de provocation associé) répond à un traitement de blocage prescrit approprié mais ne répond pas (inchangé) après un traitement inapproprié ou l’absence de traitement (N = 45). Le test est redevenu normal lors du suivi chez 73 %, 37,5 % et 14 % des participants respectivement. Les résultats sont mitigés dans cette étude en aveugle. En faveur du concept, les sujets correctement traités étaient plus susceptibles d’avoir un suivi normal que les sujets non traités. Contrairement à la prédiction, les tests post hoc n’ont montré aucune différence entre les groupes correctement et incorrectement traités, ou entre les groupes incorrectement et non traités (P > .025). Seul le groupe traité correctement a démontré des résultats aux tests de suivi différents de la simple supposition. Il convient de souligner que les preuves ne sont pas solides, en raison de la petite taille de l’échantillon et des sujets non aveuglés.

Des preuves négatives importantes n’ont pas été incluses dans la revue : les travaux de Jacobs et al, Triano, et Haas et al . Jacobs a constaté que les réponses de la MMT aux solutions orales n’étaient pas conformes aux attentes théoriques de l’AK dans une expérience en double aveugle .

Triano a mené deux expériences en double aveugle (en utilisant un plan d’essai randomisé croisé) pour évaluer le construit de l’AK selon lequel un Latissimus dorsi faible est associé au besoin de supplémentation nutritionnelle pancréatique . Plus précisément, les deux constructions théoriques étudiées étaient qu’une provocation sublinguale ou cutanée avec un extrait de tissu pancréatique peut restaurer la MMT du latissimus dorsi à la normale. Les défis de contrôle étaient des extraits cardiaques, thymiques et testiculaires qui ont été identifiés par les praticiens AK comme étant peu susceptibles d’affecter le MMT. Il n’y a pas eu de différences dans les taux de tests positifs après le défi entre les extraits, ce qui indique qu’il n’y a pas de relation entre le défi de l’extrait pancréatique et la force du latissimus dorsi. Triano a suggéré que la future recherche clinique sur les AK devrait être informée par des constructions développées à partir d’études de sciences fondamentales sur les mécanismes des AK.

Haas et al ont mené un essai randomisé en double aveugle, sur un mélange de participants avec et sans douleurs dorsales, pour évaluer la relation de la réponse de la MMT à un défi vertébral provocateur et à la manipulation spinale . Ils ont étudié le concept AK selon lequel la MMT avec provocation vertébrale peut être utilisée pour surveiller la réponse à la manipulation vertébrale. La première phase de l’étude était un plan croisé pour comparer la réponse MMT du piriforme à un défi vertébral et à un défi fictif. La deuxième phase de l’étude était un plan à groupes parallèles pour comparer la réponse MMT à un défi vertébral chez les participants recevant une manipulation ou non de la colonne vertébrale. Il est intéressant de noter que les taux de tests positifs étaient cohérents avant le traitement pour tous les segments vertébraux (moyenne = 5,6 %), et après l’intervention pour les groupes de traitement et de contrôle après manipulation aux niveaux vertébraux avec un TEM positif avant le traitement et avec un TEM négatif avant le traitement (8 % à 10 %). Les auteurs ont conclu :  » Pour la population étudiée, la réponse musculaire semble être un phénomène aléatoire sans rapport avec la subluxation manipulable. En soi, le test musculaire semble être d’une utilité discutable pour le dépistage rachidien et l’évaluation post-adjuvante . »

Il y a un thème récurrent dans ces essais. Le TEM à l’aveugle démontre des taux de tests positifs uniformes, indépendamment de la présence/absence ou du type de test provocateur (par exemple, le challenge spinal). Nous pouvons émettre l’hypothèse qu’il peut y avoir un taux de tests positifs inhérent associé à des muscles particuliers. Peut-être ce taux dépend-il de l’état de santé du patient. Il est intéressant de noter que, puisque ces taux de tests positifs sont assez faibles, tout test de suivi, avec ou sans test de provocation, a une forte probabilité d’être négatif. Par conséquent, les cliniciens penseront inévitablement qu’ils ont traité avec succès une affection identifiée par le test initial, malgré le fait que les résultats du test de suivi puissent être indépendants de l’intervention. En d’autres termes, le clinicien pourrait être trompé par un phénomène statistiquement aléatoire associé à un test sans valeur, un test dont les résultats ne sont pas liés à la procédure de provocation et insensibles à la manipulation vertébrale.

Validité de critère

Cuthbert et Goodheart n’ont pas établi la validité de critère pour toute MMT putativement associée à une condition (neuromusculosquelettique ou autre) non liée à une condition neuromusculosquelettique du même muscle. Ainsi, ils n’ont pas présenté de preuves de la validité du critère pour tout test de provocation AK ou de localisation de la thérapie.

Les auteurs citent une étude d’un test de localisation de la thérapie par Pollard et al, qui a utilisé le contact de la main du patient sur le  » point de la valve iléo-calcaire  » en conjonction avec une MMT deltoïde pour identifier les patients souffrant de lombalgie (étalon-or) . L’étude a montré une sensibilité et une spécificité élevées du test. Cependant, les effets uniques associés à la localisation du traitement et à la MMT de différentes populations utilisant le muscle deltoïde ont été confondus et les effets d’aucune des deux composantes n’ont été évalués. Par exemple, la validité observée pourrait être due à des taux de tests positifs de base différents chez les personnes souffrant ou non de lombalgie, et n’avoir rien à voir avec le test de localisation de la thérapie. La différence de taux de tests positifs pourrait être trivialement liée à la distraction ou à la gêne occasionnée par le mal de dos lui-même, de sorte que les mêmes résultats auraient pu être obtenus avec n’importe quel muscle. Il n’était pas garanti que les participants soient naïfs quant à l’objectif de l’étude. Ces problèmes pourraient être résolus en utilisant des essais randomisés comme décrit ci-dessus. Enfin, la sensibilité et la spécificité élevées de cette étude particulière ne sont pas cliniquement convaincantes pour deux raisons. Elle n’indique aucun traitement spécifique, et il existe un test parfaitement précis, rentable et facile à réaliser : le rapport du patient sur la lombalgie.

Les auteurs ont inclus une étude ancienne de Jacobs et al qui a examiné la corrélation d’une batterie de tests AK pour la fonction thyroïdienne avec une évaluation indépendante utilisant des signes et symptômes cliniques et des tests de laboratoire . Les patients ont été évalués sur une échelle de 7 points allant d’une hypothyroïdie incontestable à une hyperthyroïdie incontestable. Le protocole de détermination des notes de l’échelle à partir de la batterie de tests n’a pas été décrit. La corrélation entre le régime AK et les autres batteries de tests était de r = 0,32 à 0,36, ce qui indique une précision modeste. Les résultats pourraient également s’expliquer par l’absence d’étalon-or définitif ou, peut-être, par les méthodes non standardisées d’interprétation des tests.

L’absence de Pothmann et al, qui n’a trouvé aucune relation significative entre le TEM AK et les tests de laboratoire pour identifier l’intolérance nutritionnelle chez les enfants : RAST (radioallergosorbent test) et Cytolisa (sensibilité 73,6 %, spécificité 45,2 %) et test respiratoire à l’hydrogène au lactose (sensibilité 77,1 %, spécificité 43,2 %) . Les mauvais rapports de vraisemblance positifs (1,34 et 1,36) et la faible fiabilité inter-examinateurs suggèrent que le test ne fait pas mieux que de deviner.

Revues et critiques

Les auteurs n’ont pas reconnu les revues et critiques précédentes de AK. Teuber et Porch-Curren notent que plusieurs études réfutent l’AK dans le diagnostic des allergies alimentaires et ils concluent : « Le poids de la preuve à ce jour suggère que cette modalité de diagnostic n’est pas validée lorsqu’elle est soumise à un examen minutieux . » Tschernitschek et Fink ont examiné les procédures de AK, y compris celles utilisées en dentisterie. Ils ont conclu qu’il n’y a pas de preuves de l’efficacité, de la fiabilité et de la validité des AK. Haas a constaté que la fiabilité du TEM n’a pu être prouvée avant 1991 en raison des limites méthodologiques et statistiques des études publiées . Klinkoski et LeBoeuf ont examiné les articles scientifiques publiés par l’International College of Applied Kinesiology entre 1981 et 1987. Les auteurs ont conclu qu’aucune conclusion ne pouvait être tirée en raison d’une qualité méthodologique inadéquate basée sur une identification claire de la taille de l’échantillon, des critères d’inclusion, des sujets aveugles et naïfs, des méthodes de test fiables, des évaluateurs aveugles et de l’analyse statistique. Motyka et Yanuck ont constaté que le corpus de recherche sur les AK est équivoque, parfois confirmant la fiabilité et la validité, d’autres fois non confirmant, et souvent simplement non pertinent en raison de divers défauts de conception .

Diagnostic des maladies précliniques et subcliniques

Les partisans des AK prétendent être en mesure de diagnostiquer les conditions précliniques et subcliniques . La démonstration de la validité du TMM pour de telles conditions nécessiterait une comparaison avec une norme ayant une forte validité prédictive de la maladie, ou la démonstration que les soins prophylactiques basés sur les résultats du TMM AK empêchent ou diminuent le développement de la maladie par rapport à un groupe témoin non traité. Nous n’avons pu trouver aucune étude de ce type.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *