Pseudocount(疑似カウント)

Pseudocountが、用いられる一つの例として。

腸内細菌のデータは個人差が大きく、ヒトによってある種や属は存在せず、しばしばその存在量または比率は0の値をとる。腸内細菌のデータが、正規分布とは程遠い分布だったので、対数変換によって正規分布に近づけようと試みた。

しかし、データに0が含まれていると、対数変換を行うことができない。
(実際にエクセルで=LN(0)を入力してみると、エラーとなる。)

そこで、ある定数(例えば、+1)を加えてから対数変換を行ったりする。
これをPseudocountという。

Pseudocountとして、1が良く用いられているが、これに関しては問題が指摘されており、むやみにこの数字を用いることは推奨されないようだ。

コメントを残す

メールアドレスが公開されることはありません。