観察研究と呼ばれる、研究に意図した介入を伴わないデータからある曝露の効果を求める方法の研究。このような研究では、曝露有無で結果に変化が生じるのかの比較を行うが、交絡と呼ばれる現象が起こっているため正しい比較が行えていない。この交絡を取り除くために傾向スコアが存在している。傾向スコアとは交絡を生じさせている変数(交絡変数)で条件付けさせた曝露割合のことで、この傾向スコアを用いた解析(層別解析、マッチング、重み付け)を行えば交絡が取り除くことが可能である。この傾向スコアを用いた解析方法の一つである傾向スコアを用いた重み付けのmatching weightと呼ばれる手法で、特にmatching weightを拡張させた1:k matching weight推定量の統計的性質をシミュレーションから検討することをテーマに研究を行った。
卒業論文の時に使用したデータ(1:1 matching weightと傾向スコアマッチング)を一部使用 全てR用いて解析を行った。
- PSmatch_MW.R: シミュレーションのシナリオ設定、解析の大元の部分。傾向スコアマッチング推定量(パッケージのMatchingを使用)とmatching weight推定量を算出している。信頼区間を算出する際に、ブートストラップ法を用いて正規近似法を用いた(別コードにて関数で呼び出している)。
- boot.R: ブートストラップ標準偏差を算出。
- CI.R: ブートストラップ標準偏差で正規近似法を用いた信頼区間のCoverageを算出。
画像データでbiasなどの結果を載せる予定。