SIS_2
今回も脳卒中後の患者さんを対象としたQOL評価、SISについて、解説いただきたいと思います。
今回は、SISの信頼性や妥当性といった側面について解説いただきます。今回も、大阪公立大学の竹林先生にコラムをお願いしています。
それでは一緒に勉強していきましょう。
Stroke Impact Scaleの信頼性と妥当性について
1. 信頼性について
まず、信頼性について解説していきます。SISは開発当初から信頼性の高い尺度として報告されています。原著版SIS 2.0では8領域の大半でCronbachのα係数が0.83~0.90と「優れている」と評価されており、項目内的一貫性が確保されていました[1]。一「感情」領域のみα=0.57と低めで、この領域は項目間のばらつきが大きいことが示唆されました。
テスト-再テストの再現性についても、1週間間隔での再評価でICC(クラス内相関係数)がほとんどの領域で0.70~0.92と良好であり、Emotion領域のみ0.57と低かったものの、全体として安定した測定が可能でした[1]。その後の各国での検証研究でも、日本語版SIS 3.0では慢性期患者32例において領域別α係数が概ね0.7以上、再検査ICCが0.86~0.96と非常に高い再現性を示しています[2]。ブラジル・ポルトガル語版SIS 3.0でも7領域でα=0.81~0.94・ICC=0.79~0.94と報告されており、感情領域を除き各版で一貫して高い信頼性が確認されています[3]。
一方で感情領域に関しては韓国語版でα=0.719 [4]、ブラジル版でα=0.49 [3] と言及されるように、文化圏やサンプルによって内部一致性が低めに出るケースが散見されます。これは感情項目への回答が日によって変動しやすいことや、質問数が他領域に比べ少ない(わずか5項目)ため信頼性指標が影響を受けやすいことが一因と考えられています。
それでも、評価全体を総合的に見れば、SISは各国語版を通じて高い内部一貫性と再テスト信頼性を有する尺度であり、測定誤差(標準誤差)は概ね±7~10点程度と報告されており、臨床的にも使用できる評価と考えられています。
2. 妥当性について
次に、妥当性について解説していきます。SISの妥当性は、他の指標との関連や既知グループ差によって支持されています。Duncanら[1]の原著研究では、SIS各領域得点は既存の機能評価(Barthel IndexやFIMなど)やQOL尺度(SF-36など)と中程度から強い相関関係を示しました(相関係数0.44~0.84)。これらの結果の中でも、例えば社会参加領域はSF-36の社会役割機能と最も強く関連し、SISの測定内容が他のQOL指標と整合していることが示されています。
日本語版でも、身体機能総合スコアが片麻痺の運動機能指標であるブルンストロームステージと相関係数r=0.5の有意な関連を示し、さらに健康関連QOL指標SF-8の身体面得点とはr=0.82と非常に強い相関を示しました。これはSISが身体能力から主観的QOLまで幅広くカバーし、他法と収束的妥当性が高いことを意味します[2]。またブラジル版の検証では、SISの身体機能複合得点が神経学的重症度(NIHSS, r=-0.69)、障害度(mRS, r=-0.81)、ADL自立度(Barthel Index, r=0.87)、手段的ADL(Lawton IADL, r=0.76)などと有意に相関し、SISが機能面の客観指標ともよく対応していることが示されました。特にBarthel Indexとの相関が0.87と非常に高い一方で、Barthelでは評価できない記憶や感情といった側面もSISは含むため、SISは機能評価とQOL評価の橋渡し的な役割を果たす有用な指標といえます[3]。
さらに韓国版の研究では、SISの各領域得点が抑うつ・不安の指標(HADS)とも有意に相関することが報告されており(例:手の機能ρ=0.556、感情ρ=0.370がHADSうつ尺度と相関身体機能のみならず心理社会的側面も反映している点で、他のPROM(Patient-Reported Outcome Measures)にはない包括的妥当性を備えているとされています[4]。
3. 反応性について
最後に、SISが対象者の変化をどの程度捉えることができるのかについて解説します。臨床介入や時間経過に対するSISの変化感度も検証されています。原著研究では、発症後1~6か月の追跡でSIS各ドメインが有意に向上し、回復に伴うスコア変化を捉えられることが示されました。特にADLやモビリティといった身体領域は経時的改善を反映しやすく、SISはリハビリ効果のアウトカムとして有用とされています[1]。
一方、感受性は発症時期や重症度によって影響を受け、重度の患者や慢性期では変化量が小さく検出困難になる可能性が指摘されています[1]。例えばSISの改善度は発症直後~亜急性期に大きく、慢性期には天井効果に近づく領域もあります。実際、ブラジル版の解析ではコミュニケーション領域で17.3%の患者が最高点(100点)を示し一定の天井効果が見られたのに対し、手の機能領域では45.9%の患者が0点となり床効果が顕著と報告されています[3]。
まとめ
今回は、SISの信頼性と妥当性、さらには反応性について解説しました。この辺りの特徴を理解しつつ、臨床で使用することで、特徴と限界を活かしたSISの運用が可能になります。次回は、様々な臨床場面における利用方法について解説していきます。
参照文献
1. Duncan, Pamela W., et al. "The stroke impact scale version 2.0: evaluation of reliability, validity, and sensitivity to change." Stroke30.10 (1999): 2131-2140.
2. 越智光宏ら. "Stroke Impact Scale version 3.0 の日本語版の作成および信頼性と妥当性の検討." Journal of UOEH 39.3 (2017): 215-221.
3. Carod-Artal, Francisco Javier, et al. "The stroke impact scale 3.0: evaluation of acceptability, reliability, and validity of the Brazilian version." Stroke 39.9 (2008): 2477-2484.
4. Choi, Seong Uk, et al. "Stroke impact scale 3.0: reliability and validity evaluation of the Korean version." Annals of rehabilitation medicine 41.3 (2017): 387-393.
SIS_1