gtsummaryで対象者特性の表を作る！

gtsummaryパッケージというとても便利なパッケージをみつけたので、まとめておきます。
色々とできることはあるのですが、ひとまず最も基本的な（？）対象者特性の表を作ってみようと思います。

gtsummaryパッケージとは？

一言でいえば、簡単にデータを要約した表が作れるパッケージ。

対象者特性のような、論文にはかかせない基本的な表だけではなく、
回帰分析の結果などの表も簡単に作成できてしまう。

簡単

データセットの中には、通常、さまざまな種類（連続変数やカテゴリー変数など）の変数が含まれている。そして、変数の種類によって、表に示したい代表値（平均値、標準偏差、中央値、ｎ、割合など）は異なる。
このパッケージはそれらの変数を自動的に識別し、適切な計算してくれる。

このデータセットには、タイタニック号の乗客や搭乗員の年齢、性別、座席のクラス、生存したかといったデータが含まれている。

#データセットの読み込み
df <- data.frame(Titanic)

#データの要約
df %>% tbl_summary()

一瞬で表が完成した。

Class（座席のクラス）や、Sex（性別）、Age（大人か子どもか）、Survived（生存）は、カテゴリー変数として認識し、ｎ（％）を計算してくれた。

Freqは、連続変数として認識され、中央値（四分位数：第一四分位数と第三四分位数）が計算された。

平均（標準偏差）を計算する方法もあるようだけど、後日確認。

確認したい点

返信を残す返信をキャンセル