<style> @media print{ body, html, .remark-slides-area, .remark-notes-area { height: 100% !important; width: 100% !important; overflow: visible; display: inline-block; } p1{ color: red; top: 15cm !important; position: relative !important; left: 1cm !important; } } </style> <div style="position:absolute;top=50px;width:80%;text-align:right;"> <img src="logo_kyorin.png" /> </div> .center[ <div style="position:absolute;top:300px;font-size:4em;font:serif;">ロジスティック回帰</div> ] --- # 回帰って? .left-column[ 身長の高い父親からは、身長の高い息子が生まれる。 (Father and Son Analysis) ] .right-column[ ![](Stat-LogisticReg2_files/figure-html/unnamed-chunk-1-1.png)<!-- --> ] --- ## これを式にすると .pull-left[ `\(y = a x + b\)` association/correlation: 相関 ] .pull-right[ `\(y\)`: 息子の身長 `\(x\)`: 父親の身長 `\(a\)`: 傾き (slope) `\(b\)`: 切片 (intercept) `\(a\)` と `\(b\)` は、深い意味はない。 ] --- ## これを多変量にすると .pull-left[ `\(y = a_0 + a_1 x_1 + a_2 x_2 + \cdots\)` ] .pull-right[ `\(y\)`: 息子の身長 `\(a_0\)`: 切片 (intercept) `\(x_1\)`: 要因1 `\(x_2\)`: 要因2 ] --- ## y を「生」と「死」にすると .pull-left[ `\(y = b_0 + b_1 x_1 + b_2 x_2 + \cdots\)` ] .pull-right[ `\(y\)`: 2値変数(「生」または「死」) `\(a_0\)`: 切片 (intercept) `\(b_1\)`: 要因1のオッズ比の対数 `\(x_1\)`: 要因1 `\(b_2\)`: 要因2のオッズ比の対数 `\(x_2\)`: 要因2 ] 稀に、対数のまま報告している論文がある。 --- # オッズ比って? 医師国家試験 114F-75 調査開始時に肺がんに罹患していなかった10万人をその時点の喫煙状況で2つのグループに分けた。調査開始後5年間の肺癌罹患の有無を調べた結果を以下に示す。 喫煙による肺癌罹患のリスクを求めよ。 | 調査開始時点の喫煙状況 | 調査開始時点の人数 | 調査期間中に肺癌に罹患した人数 | | -- | --: | --: | | 喫煙者 | 40,000 | 408 | | 非喫煙者 | 60,000 | 72 | | 計 | 100,000 | 480 | -- リスク比 = (408/40,000)/(72/60,000) = 8.5 正解 -- オッズ比 = (408/(40000-408))/(72/(60000-72)) = 8.577288 --- # で、オッズ比って? リスク比 = `\(\dfrac{(408/40,000)}{(72/60,000)}\)` = 8.5 オッズ比 = `\(\dfrac{408/(40000-408)}{72/(60000-72)}\)` = 8.577288 -- <div style="font-size:2em;">リスク比 ≒ オッズ比 (オッズ比の方が大袈裟に出る)</div> -- <div style="font-size:3em;">ただし、有病率が低い時 (<10%)</div> --- ## 不都合な真実 Tajeu GS, Sen B, Allison DB, & Menachemi N (2012). Misuse of odds ratios in obesity literature: an empirical analysis of published studies. Obesity, 20(8), 1726-1731. 肥満に関する二つのジャーナルの全ての記事を調査 (855件) -- 7.3% (62件) がオッズ比を報告 全てがロジスティック回帰 (2x2表を使っている人はいない?) -- 23.2% はオッズ比を誤って報告 (参考: 産婦人科学では26%) --- | Characteristics | Frailty No. (%) | OR | P | AOR | P | | --- | --: | --: | --: | --: | --: | | Gender | | | | | | | Male. | 10 (18.9) | 1 | 0.02 | 1 | 0.11 | | Female | 54 (48.2) | 4.3 | | 4.4 | | | Increasing age | | 2.07 | 0.01 | 1.07 | 0.076 | | Caste | | | | | | | General caste | 50 (42.7) | 1 | 0.81 | | | | Others | 34 (70.8) | 1.8 | | | | | Marital status | | | | | | | Married | 33 (30) | 1 | 0.02 | 1 | 0.58 | | Widow | 31 (56.4) | 3.1 | | 1.4 | | | Dasgupta A, Bandyopadhyay S, Bandyopadhyay L et al. (2019) How frail are our elderly? An assessment with Tilburg frailty indicator (TFI) in a rural elderly population of West Bengal. Journal of family medicine and primary care, 8(7), 2242. --- # 発展 --- ## データが欠けている 多重代入法で補完してしまえ! -- @abe2020social は、オープンアクセスの PLoS One に掲載されている論文で、島根県におけるフレイルと説明因子のロジスティック回帰を行う際に、データの欠損値を10回代入する多重代入を行いました。そのデータも論文のページからダウンロードすることができます。 多重代入法を実行する際には、何回代入するべきか?という問題があります。これについては @graham2007many は、$r$ 値に応じて、20回から100回以上を提唱しています。 --- ## RCT よりエビデンスレベルが低い 傾向スコアでマッチング --- ## 2値じゃなくて3値にしたい 注意: `\(y\)` の方です -- 多項 (multinomial) ロジスティック回帰 -- 医療介護福祉分野では、フレイルという概念がありますが、これは「頑健」「プレフレイル」「フレイル」の3つ時の状態があります。頑健はフレイルのない健康な状態で、フレイルは要介護の前段階、プレフレイルはその中間の状態と捉えられています。このような3状態を応答変数とするのが多項ロジスティック回帰の例となります。実際には、3状態のうち一つを「参照」として固定し、その他二つと二回、二項ロジスティック回帰を行っています。@liu2020physical は、実際の例で、「頑健」を参照群としています。 --- ## マルチレベルって? マルチレベル (multilevel) ロジスティック回帰 -- 階層構造 * 学校 - クラス - 個人 * 市町村 - 個人 --- ## ロジスティック回帰を R で実践する勉強会 https://saturdaymorning.connpass.com/ 土曜日: 7:30 - 9:00 Zoom: 840 1172 5895 Passcode: 「朝」を意味する英語