リアルタイムPCRで発現解析時の統計手法
遺伝子Aの発現量が条件αと条件βで変わらないかどうか、リアルタイムPCRで調べたい。そんなときの話です。
複数のハウスキーピング遺伝子のCt値(あるいはCp値)と遺伝子AのCt値との差(=ΔCt)を条件α・βごとに求めて、さらに各条件でのΔCtの差(=ΔΔCt)を求める。ΔΔCtが0なら条件間での発現量に差はない。ざっくり書くとこんな感じが一般的な方法でしょう(Livak法あるいはPfaffl法)。
しかし「ΔΔCtが0である」ことが統計的に有意かどうか、どのように判断するのがベストなのでしょう?
ネットで見つけた回答
似たようなことはやはり皆考えてるようで、researh gateで同じような質問が複数見つかりました。
1. Which_statistical_analysis_significance_tests_must_to_be_perform_for_relative_RT-qPCR_experiments
1では「ΔCtは正規分布するので、ΔCtに対してt検定をしろ」と言うのがpopular answerになっています。さらにBioconductorのLimmaパッケージによるmoderated t-testを薦めてます。ちなみにGoni et al. (2009) もlimmaをお薦めしてます。
2では「t検定の仮定(正規性・等分散性)を満たせばt検定を使い、仮定を満たさなければWilcoxonの順位和検定を使うか、対数変換などによって仮定を満たすようデータをいじってからt検定をするかだ」との回答がpopular answerです。
この2のやり方は、2段階の検定の問題がありそうです(参考:井口研究室ブログ: 正規性検定をノンパラメトリック検定の選択基準にするな)*1。なので、1のようにΔCtがどのような分布をとるのか予め理屈から考えておき、それに基づき統計手法を選択するというスタンスが好ましいでしょう。
また、N<5の少数サンプルの場合には、正規性の検定をすること自体が正直ナンセンスな気がします。直感で書いているので、特に根拠はないですが…。
どのような確率分布を仮定すべきか
では、1の言う「ΔCtは正規分布に従う」説は正しいのか。
自信はないですが、それなりに妥当だと思います。遺伝子の発現量はたぶん対数正規分布に従い、またcDNA濃度の対数とCt値は線形関係です。なので、Ct値は正規分布でしょう。正規分布の差は正規分布なので、ΔCtも正規分布に従うはずです。
ただ、サンプルや対象遺伝子の性質によっては正規分布の仮定を置くのが妥当ではないかもしれません。Tichopad et al. (2009, Clinical Chem, 55:10) がDiscussionで同様のことを述べてます。いわく"Cq values obtained with samples of solid tissues are commonly assumed to be normally distributed, but to our knowledge, the validity of this assumption has yet to be demonstrated"とのこと。もっとも最新の知見では、より明確なことが分かってるかも。
正規分布に従うと仮定できるなら、ΔCtの差をt検定やANOVAで調べるのも妥当ですね。ただどういう場合にその仮定が妥当なのか、それが良く分からない。繰り返しますが、別に自信を持って書いているわけではないです…。詳しい人が見てましたら、ぜひ教えてください…。
(追記 2018.10.22)
読み返してみて気付きましたが、ΔCtに対するt検定は増幅効率の異なるPCR産物には適用できませんね。この場合、Pfaffl法で相対発現量に変換してから検定をおこなうのが妥当でしょうか。
実験操作のばらつきを考慮したモデルで解析できないか?
ここからは、考えがまとまっていないつぶやき。
もう一歩進んで、抽出・逆転写・PCRなど実験操作による誤差も考慮したうえで有意差の検定をできないものでしょうか。下の論文での線形回帰モデルは、それに近いんですが、ΔΔCt法と絡める方法はちょっと思いつかない。特に複数のreference genesのΔCtをもとに標準化する場合。
Tichopad A., Kitchen R., Riedmaier I., Becker C., Ståhlberg A., and Kubista M., 2009, Design and optimization of reverse-transcription quantitative PCR experiments, Clinical Chem., 55 (10), 1816-1823.
*1:もっと言うと、「少数サンプルの時はWilcoxonを使うと良い」との記述は良く分からない。少数サンプルでノンパラ検定をおこなうと検出力がかなり低くなるはず。少数サンプルはそういうもんだという意味なのか…? また等分散の仮定はWelchのt検定なら不要?