サンプルから数千個の細胞を取り出して、その中に含まれる1万程度のRNAの発現量をみる。
それを2つのグループでどのRNAに差があるのかを比べたい。
とすると、これは1万程度多重比較を行うことになる。
p値0.05なんて使っていたら、エラーだらけの結果になってしまうので、
そもそも遺伝子解析におけるp値は005ではだめ。
間違う確率 = 1 - (1-0.05)^n (n=多重検定の回数)
なので、多重検定の回数が増えるほど、間違う確率は増えていく。
FDR false discovery rate 間違う確率の期待値
これを補正する方法として、
Benjamini-Hochberg adjustment
という方法がある。一番使われているのかも。
https://stats.biopapyrus.jp/stats/fdr-bh.html
他にも
Q-value
local FDR法
というのもある。
とりあえず、あるということを把握しておく。