7 横断研究
Saturday Morning RStudio 勉強会
毎週土曜朝6:30-9:00
7.1 キーワード
コホート研究 (cohort study) には、いくつかの種類があります。
まず、ある1時点での調査を行うことを横断研究 (cross-sectional study)、複数の時点で調査を行うことを縦断研究 (longitudinal study) と言います。
横断研究では、通常、ある疾患 (ここではフレイル) の有病率や、さまざまな属性との関連を調べます。この属性を、RCT での介入に対して、コホート研究では暴露 (exposure) と言うこともあります。
横断研究では、統計手法としては、ロジスティック回帰 (logistic regression) がよく用いられます。これは、単一のアウトカムに対して、複数の属性を共変量 (covariate) として解析し、関連 (association) があるかどうかを調査します。最終的には、共変量ごとにオッズ比が得られます。
ロジスティック回帰を理解するためには、まずオッズ比とリスク比を理解する必要があります。
まず、以下のオッズ比とリスク比を計算してみましょう。
疾患あり | 疾患なし | 合計 | |
---|---|---|---|
暴露あり | 20人 | 80人 | 100人 |
暴露なし | 10人 | 90人 | 100人 |
合計 | 30人 | 170人 | 200人 |
リスク比 = \(\dfrac{ \dfrac{20}{100} }{ \dfrac{10}{100} }\) = 2.00
リスク比は簡単に理解できます。暴露ありのほうが、暴露なしよりも 2.00 倍疾患リスクがあります。
全体の有病率 = \(\dfrac{30}{200}\) = 0.15 (15%)
オッズ比 = \(\dfrac{ \dfrac{20}{80} }{ \dfrac{10}{90} }\) = 2.25
このように、オッズ比はリスク比に近いけれども、ちょっと大袈裟にでる傾向があります。
このため、オッズ比 2.25 は、「2.25 倍、疾患リスクがある」ということはできません。
なお、全体の有病率が低くなるほどオッズ比はリスク比に近づき、10% 以下ではほぼリスク比に近似できます。
疾患あり | 疾患なし | 合計 | |
---|---|---|---|
暴露あり | 2人 | 98人 | 100人 |
暴露なし | 1人 | 99人 | 100人 |
合計 | 3人 | 197人 | 200人 |
リスク比は 2.00 のままですが、オッズ比は 2.02 になります。
上の表では、要因が一つ (暴露) だけでした。これを、複数に拡張したものがロジスティック回帰になります。また、2値変数だけではなく数値も使用することができます。
横断研究では、統計はロジスティック回帰を行うことが多いですが、その中でもいくつかの種類に分けられます。
- リスク因子のオッズ比を調査する
- リスク因子を探索する
- リスクスコアを開発する
これで全てではありません。例えば、Chapter 2 でみた Fried LP (2001) もコホート研究の一種です。
コホート研究の論文のガイドラインは、STROBE 宣言です。
7.1.1 リスク因子のオッズ比を調査
リスク因子のオッズ比を調査するためには、多変量ロジスティック回帰を行います。
説明変数は、仮説や先行研究から決定することが多いようです。
Liu W, Puts M, Jian F et al. (2020) Physical frailty and its associated factors among elderly nursing home residents in China. BMC geriatrics, 20(1), 1-9.
7.1.2 リスク因子を探索
リスク因子を探索するためには、概ね以下のような方法を取ります。
- リスク因子の候補を列挙する
- それぞれのリスク因子を単変量解析し、候補を絞る
- 多変量解析で候補をさらに絞る
単変量ロジスティック回帰は、通常のオッズ比の計算と似たようなものになりますが、95% 信頼区間 (および p 値) も得ることができます。このうち p < 0.10 のものを候補として残し、多変量解析します。
多変量解析で最終的に候補の中から説明変数を決定します。この際に、以下のような方法があります。
- 変数減少法
- 変数増加法
- 変数増減法 (forward-backward stepwise selection method): Efroymson(1960)によって提唱されました。
- 変数減増法
この方法の弱点として、理論的におかしな説明変数が残ることがあります。このため、結果を慎重に議論する必要があります。
Liu CK, Lyass A, Larson MG et al. (2016) Biomarkers of oxidative stress are associated with frailty: the Framingham Offspring Study. Age, 38(1), 1.
7.1.3 リスクスコアを開発
ロジスティック回帰を行うと、オッズ比だけでなく予測モデルが得られます。これまでの方法ではオッズ比のみを用い、予測モデルを使っていませんでした。
予測モデルをもとに、疾患などの予測ができるリスクスコアなどを開発することもできます。
- サンプルの一部をロジスティック回帰
- 予測モデルからリスクスコア式を決定
- 予測サンプルと予測に使用しなかったサンプルで妥当性を検証
妥当性の検証については、ROC 曲線(Receiver Operatorating Characteristic curve、受信者動作特性曲線) を作図し、 AUC (Area Under Curve) を計算します。AUC は 0.5 から 1.0 までの値を取り、大きいほど予測性能が優れています。AUC は、c static と呼ばれることもあります。
Gilbert T, Neuburger J, Kraindler J et al. (2018) Development and validation of a Hospital Frailty Risk Score focusing on older people in acute care settings using electronic hospital records: an observational study. The Lancet, 391(10132), 1775-1782.