Appraisal elements
MMTに関するこのレビューの有効性は、必然的にレビュープロセスの質に依存する。 文献の完全なシステマティックレビューを行うことは著者の意図したところではないと思われるので、その基準を求めるものではない。 しかし,診断テストの優れたシステマティックレビューの設計要素や,測定評価文献の批判的評価は,ここでの議論に関連している. より伝統的なナラティブレビューでさえ、これらの要素の多くを共有しています。 ここでは,AKの診断手順の有用性について有効な推論を行うために考慮しなければならない質問をまとめました(表1)。これらの質問は,上記の引用文献から得られた研究および統合方法に基づいています。 これらのいくつかの質問に対する答えは、AKの有用性に関する著者の結論に重大な異議を唱えるものです。
AKのもつれ
AKはカイロプラクティックにおいて長く豊かな歴史を持っています。 多くのカイロプラクターが、何らかの形でこのテクニックを使用していると報告しています。 AKの支持者は、AKを標準的な整形外科的/神経学的な筋肉テスト以上のものと考えていることは明らかです。 カイロプラクターが行うMMTは、理学療法で適用される基準で行われ、解釈される徒手的筋力テストと、その実行と解釈において必ずしも異なるものではない。 どちらの施術者にとっても、弱った筋肉は、一次的な筋肉や神経の病理を示唆しているかもしれません。 しかし、AKテクニックでは、徒手筋力テストを、筋肉と神経供給の機能的完全性を評価するだけでなく、「構造的、化学的、精神的な機能不全を診断する」手段としても使用します。 AKテクニックの特徴的な診断方法としては、神経筋骨格系、器質系、代謝系の疾患に対する治療の必要性を見極めるために、MMTと併せて挑発的なテスト(AKチャレンジやセラピーローカリゼーションなど)を行うことが挙げられます。
MMTは、神経筋骨格系の身体検査の標準的な要素です。
MMTは神経筋骨格系の身体検査の標準的な要素であり、MMTが痛みや怪我、神経筋骨格系疾患に直接関与する筋肉の弱さを評価するのに有用であるという著者の意見に同意します。 しかし,MMTの特性をAK特有のアプリケーションに外挿することは,いくつかの理由から危険である。 特定の神経筋骨格系疾患に対するMMTの信頼性/妥当性は,器質的障害の同定など,他の用途には一般化できない可能性がある。 MMTは、単独での筋力評価には信頼性/正確性があるかもしれませんが、脊髄チャレンジ(椎骨関節に力を加える)や、特定のAK診断に使用される他の挑発的なテストと併用した場合には、信頼性/正確性はありません。 また、著者らは妥当性という言葉の2つの使い方を混同しています:テストの精度と診断上の妥当性です。 例えば、筋力をニュートン単位で評価するダイナモメトリック検査のように、ある検査が非常に正確であっても、特定の症状の診断に対する感度や特異性がない場合があります。 Cuthbert氏とGoodheart氏は、AKのエビデンスと標準的な整形外科用MMTの信頼性・有効性のエビデンスを混同しています。
検索方法と対象 基準
Cuthbert氏とGoodheart氏によるレビューは、綿密な検索方法を利用しなかった場合、重要な引用を見逃し、レビュー結果に影響を与えることを示しています。 著者らは、”manual muscle test “と “manual muscle testing “という検索語を用いて、PubMedとCINAHLのオンライン検索を行いました。 それ以上の詳細は記載されていないので、検索を正確に再現することはできません。 検索範囲に関するいくつかの問題点があり,それが関連論文の省略につながった可能性があります。 PubMedでの検索では,”muscle testing “という検索語を追加することで,見つかった論文数が639から13,802に増加した。 また,MEDLINEとCINAHLでも検索を行った。 その結果、”Muscle Testing “という検索語を追加することで、ヒット件数は454件から709件に、信頼性・妥当性に特化した論文の数は97件から136件に増加しました。 2つ目の問題は、CathbertとGoodheartがカイロプラクティックのデータベースであるMANTISを検索しなかったことです。 このデータベースの検索を含めると、筋力テストの論文数は709件から1297件に、信頼性・妥当性に関する論文数は136件から221件に増加しました。 また、ブーリアン戦略を用いた検索も行いました。 Applied Kinesiology AND (reliability or validity)で検索しました。 MANTISを含めることで、検索結果は15件から32件に増加しました。
著者は、関連性に基づいて研究を選択したと述べていますが、運用上の定義は含まれていませんでした。
著者は関連性に基づいて研究を選択したと述べていますが、運用上の定義は含まれていません。 信頼性・妥当性」と「MMT」がどのように選択されたのかは明らかではない。 ネガティブな研究は確実に除外された。 もし著者らが「muscle testing」という検索用語を使い、MANTISデータベースを含んでいたならば、MMTの結果に対するAK-challenge手順の寄与を評価するために特別にデザインされた無作為化試験を特定できなかっただろう。 いずれにしても、著者は1982年にInternational College of Applied Kinesiologyの支援を受けて実施され、Goodheart氏が編集者への手紙で批評したTriano氏の研究を知っているべきでした。 それは、信頼性または妥当性の評価において、カッパが0.5以上と報告された研究のみを対象としたことです(ただし、カッパは一般的に妥当性の指標ではありません)。 収録された研究の多くが信頼性を扱っておらず、したがってカッパ値を報告していないことから、この組み入れ基準が均一に適用されていないことは明らかです。 さらに重要なことは、この基準の使用は、Swinklesらの誤解に基づいていたことです。 これらの著者は、ある機器が優れた構成的妥当性を持っているかどうかを判断する基準を設定するためにこの基準を使用しました。彼らは、システマティックレビューの適格性を識別するために、カッパ≧0.5という閾値を使用しませんでした。 CuthbertとGoodheartがこのカッパ選択基準を使用した結果、中程度から優れた信頼性/妥当性を持つ研究以外はすべて除外されてしまいました。
質の評価とエビデンスの統合
研究の質の評価は、文献レビューの重要な側面であり、それを行うための多くの方法があります。 CuthbertとGoodheartは、品質評価を行ったことを方法の欄に書いています。 しかし、論文の最後になって、著者は内部および外部の妥当性が批判的に評価されていないことを認めています。 著者らは、MMT全般およびAKに特化した結論を得るために、文献を統合する正式な基準やアルゴリズムを持っていなかった。 質の高い評価がなされなければ、優れた研究は、深刻なデザイン上の欠陥や裏付けのない結論を持つ研究よりも重視されないのは避けられない。 特に、掲載された論文の著者の結論を額面通りに受け取ることはお勧めできません。 誤った解釈をしてしまう。
Evidence from treatment investigations
Cuthbert and Goodheartは、肯定的な治療結果を示した研究から、MMT診断の臨床的な関連性を推測しようとしています。 その一例として、著者らが表4で引用しているのが、Muncayoらによる観察研究である。 つまり、治療の必要性を確認するためにAKを使用し、患者に良好な結果が得られれば、AKが有用な診断ツールであるという証拠になるという論理です。 この推論の欠点は、診断手順を用いても患者が改善する可能性があることです。 このことは、一般的に使用されているカイロプラクティックの診断方法の有効性を評価する無作為化試験で実際に証明されています。
無作為化試験の根拠
著者は本文中で、MMTは無作為化試験で調査されていると何度も述べています。 この主張にはいくつかの明確な説明が必要である。 引用されているすべての無作為化試験において、患者は治療群と治療対照群に無作為化され、診断テスト群と診断テスト対照群には無作為化されなかった。 つまり、MMTの有効性ではなく、治療の有効性が検討されたということである。
診断テストや操作指標の有効性(患者の予後に対する貢献度)は、盲検化された無作為化試験で評価することができ、またそうすべきである。 したがって、MMTのAKへの応用を検証するためには、より多くの無作為化試験が必要であるという著者の主張に同意します。
盲検無作為化試験は、テストの有効性を評価するだけでなく、構成概念の妥当性や、MMTの結果に対する挑発的なテスト(例:Joint Challenge)の貢献度を調べるためにも使用できます。
信頼性
信頼性は、通常、診断テストの有用性を確立するために必要だが不十分な条件であると考えられています。 つまり、信頼性が低いと、一般的にテストの有用性は否定されますが (少なくとも、テストがどのように測定されるかという文脈において)、信頼性が高いからといって有用性が保証されるわけではありません。 前述したように,私たちは整形外科/神経科のMMTの信頼性に異議を唱えているわけではなく,MMTのAKならではのアプリケーションの信頼性にのみ関心があるのです。
Jacobsは、糖液の非盲検試験では良好な信頼性を示したが、経口投与された油液に対するMMTの反応の二重盲検試験では公正な信頼性しか示さなかった。 Haasらは、椎体チャレンジ(椎体棘突起に方向性のある圧力をかけて筋力を変化させる)のMMTの検査者間信頼性が低いことを明らかにした。 2つの小規模な二重盲検法による研究では、患者の手の中にあるボトル入りの物質に対するMMTの反応を調べました。 Ludtkeらは、スズメバチ毒と不活性物質の両方について、反応は推測と変わらないことを明らかにした。Garrowは、潜在的なアレルゲンを特定するためのMMTのテスト・リテストの再現性がないことを示した。 Pothmannらは、子供の食物不耐症を特定するための筋力検査について、検査者内の信頼性は高いが、検査者間の信頼性は低い(kappa = 0)としている。
レビューに含まれていないその他の信頼性研究については以下の通りです。
Petersonは情動喚起の研究で信頼性が低いことを発見しましたが、交絡変数を考慮すると信頼性は劇的に向上しました。 しかし、この研究では、負の交絡因子を特定し、半構造化インタビューを用いて事後的に排除したのに対し、正の交絡因子を求めなかったという点で、設計が不十分でした。 Kenneyらの研究では、11人の被験者を3人の訓練された筋力検査員が、4種類の栄養素(亜鉛、ビタミンC、チアミン、ビタミンA)の補給の必要性を調べた。
RybeckとSwensonは、機械的な筋力テストではなく、(広背筋を使った)手動の筋力テストで、舌の下に砂糖を置いた場合と置いていない場合を識別できることを発見しました。 被験者は盲検化されていないことに留意すべきである。 FriedmanとWeisbergは、特定のAKの手順をテストしようとしましたが、彼らの研究はデータを単にリストアップしただけで、統計的な分析がなされておらず、解釈が困難でした。
Leboeufらは、Sacro-Occipital Technique(SOT)で使用されるマニュアルの筋力テスト、いわゆるアームフォッサテストを調査しました。 彼らは、腕窩テスト(AK式筋力テストとそれに伴うチャレンジテスト)は、適切に処方されたブロック治療には反応するが、不適切な治療や無治療では反応しない(変化しない)というSOTの構成要素を評価した(N = 45)。 このテストが追跡調査で正常に戻ったのは、それぞれ73%、37.5%、14%であった。 この評価者盲検試験では、様々な結果が得られました。 構造を支持するものとして、適切に治療された被験者は、治療されていない被験者よりも追跡調査で正常になる可能性が高かった。 予測に反して、post hocテストでは、適切に処置された群と不適切に処置された群、不適切に処置された群と未処置の群の間に差はなかった(P > 0.025)。 適切に処理されたグループのみが、単なる推測とは異なるフォローアップテストの結果を示しました。
重要な否定的証拠がレビューに含まれていませんでした:Jacobsら、Triano、およびHaasらの研究です。
Jacobsは、二重盲検実験において、経口溶液に対するMMTの反応が、AKの理論的期待値と一致しないことを発見しました。
Trianoは、「弱い広背筋は、膵臓の栄養補給の必要性と関連する」というAKの構成要素を評価するために、2つの二重盲検実験(クロスオーバー無作為化試験デザインを使用)を行いました。 具体的には,膵臓組織エキスを舌下または皮下に投与することで,広背筋のMMTを正常に戻すことができるという2つの理論的構成を検討した。 対照となるチャレンジは,AKの実践者がMMTに影響を与える可能性が低いと判断した心臓,胸腺,精巣の抽出物であった。 チャレンジ後の陽性反応率は抽出物によって差がなく、膵臓抽出物のチャレンジが広背筋の強さに関係しないことを示していた。
Haasらは、二重盲検無作為化試験を実施し、腰痛のある人とない人が混在している状態で、挑発的な椎骨チャレンジと脊椎マニピュレーションに対するMMT反応の関係を評価した。 彼らは、脊椎に負荷をかけながらMMTを行うことで、脊椎操作に対する反応をモニターすることができるというAK構成を検討した。 この研究の第1段階では、クロスオーバーデザインを用いて、椎骨チャレンジとシャムチャレンジに対する梨状筋のMMT反応を比較した。 第2段階では、パラレルグループデザインを用いて、脊椎マニピュレーションを受けた被験者と受けていない被験者の、脊椎チャレンジに対するMMTの反応を比較した。 興味深いことに、施術前のMMT陽性率は椎体区分を問わず一貫しており(平均=5.6%)、施術後は施術群、対照群ともに、施術前にMMTが陽性であった椎体レベルと、施術前にMMTが陰性であった椎体レベルで、施術後のMMTが一貫していた(8~10%)。 著者らは次のように結論づけている。「研究対象となった集団では、筋肉の反応は、マニピュレーション可能なサブラクセーションとは無関係のランダムな現象のように見えた。
これらの試験には、繰り返し出てくるテーマがあります。 盲検化されたMMTは、挑発的なテスト(例:脊髄チャレンジ)の有無や種類に関わらず、一様に陽性率を示している。 これは、特定の筋肉に固有の陽性率があるのではないかという仮説を立てることができる。 おそらく、この率は患者の健康状態に依存していると思われる。 興味深いことに、これらの陽性率はかなり低いため、挑発的なテストを行っても行わなくても、フォローアップテストは高い確率で陰性となる。 そのため、臨床医は、フォローアップ検査の結果が介入とは無関係である可能性があるにもかかわらず、どうしても最初の検査で特定された状態の治療に成功したと考えてしまう。
基準妥当性
Cuthbert と Goodheart は、同じ筋肉の神経筋骨格系の状態とは無関係の状態 (神経筋骨格系またはその他の状態) に関連するとされる MMT について、基準妥当性を確立しませんでした。
著者らは、Pollardらによる治療局在化テストの研究を引用しています。この研究では、腰痛患者を特定するために、三角筋のMMTと一緒に「回盲弁点」に患者の手を接触させることを利用しています(ゴールドスタンダード)。 この研究では、このテストの高い感度と特異性が示されました。 しかし、治療法の定位と三角筋を用いた異なる集団のMMTに関連する固有の効果が混同され、どちらの要素の効果も評価されなかった。 例えば、今回観察された有効性は、腰痛のある人とない人でベースとなる陽性反応率が異なることによるもので、治療局在化テストとは無関係である可能性があります。 また、陽性率の違いは、腰痛による気の散りや不快感と些細な関係があり、どの筋肉でも同じ結果が得られる可能性があります。 参加者が研究の目的に関してナイーブであることは保証されていない。 これらの問題は、上述したように無作為化試験を用いて解決することができた。 最後に、この特定の研究における高い感度と特異性は、2つの理由から臨床的には説得力がない。
著者らはJacobsらによる初期の研究を紹介していますが、これは甲状腺機能のAKテストバッテリーと、臨床症状や臨床検査を用いた独立した評価との相関関係を調べたものです。 患者は、疑う余地のない甲状腺機能低下症から疑う余地のない甲状腺機能亢進症までの7段階で評価された。 検査結果からスケール評価を決定するためのプロトコルは記述されていない。 AKレジメンと他のテストバッテリーとの相関関係はr=0.32〜0.36であり、中程度の精度を示していた。
Pothmannらは、AK MMTと小児の栄養学的不耐性を特定するための臨床検査との間に有意な関係がないことを明らかにしましたが、決定的なゴールドスタンダードがないことや、おそらく検査の解釈方法が標準化されていないことでも説明できます。 RAST(radioallergosorbent test)とCytolisa(感度73.6%、特異度45.2%)、乳糖呼気水素検査(感度77.1%、特異度43.2%)です。
レビューと批評
著者らは、AKの過去のレビューと批評を認めていません。 Teuber氏とPorch-Curren氏は、食物アレルギーの診断におけるAKを否定するいくつかの研究に注目し、結論を出しています。 “これまでの証拠の重みは、この診断方法が精査されても有効でないことを示唆している」と結論づけている。 TschernitschekとFinkは、歯科で使用されるものを含むAKの手順を検討しました。 彼らは、AKの有効性、信頼性、妥当性についての証拠はないと結論づけた。 Haasは、1991年以前のMMTの信頼性は、発表された研究の方法論的および統計的限界のために立証できないとした。 KlinkoskiとLeBoeufは、1981年から1987年の間にInternational College of Applied Kinesiologyが発表した科学論文をレビューした。 著者らは、サンプルサイズ、組み入れ基準、盲目の被験者と素朴な被験者、信頼できるテスト方法、盲目の評価者、統計分析などを明確にした上で、方法論的な質が不十分であるため、結論を出すことができないと結論づけた。 MotykaとYanuckは、AKの研究は曖昧で、信頼性と有効性を確認できる場合もあれば、確認できない場合もあり、また、様々なデザイン上の欠陥により、単に無意味な場合も多いとしています。
前臨床および潜在的な病気の診断
AKの支持者は、前臨床および潜在的な状態を診断できると主張しています。 このような状態に対するMMTの有効性を証明するには、病気の予測に強い有効性を持つ基準との比較や、AK MMTの結果に基づいた予防的なケアが、未治療の対照群と比較して病気の発症を防止または減少させることを証明する必要があります。 そのような研究は見当たりませんでした。