a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

最近読んだ論文のメモ: 環境要因と群集構造の比較法 (CCA, RDAなど)

前回に引き続き、類似度データ解析法の勉強中。

しかしいろんな多変量解析手法がありすぎて、ちょっとパンクしそうです。たくさんの手法をざざっと見る段階は終えて、そろそろ一つ・二つの手法を深く理解しなければ…。

 

下の総説3つを読んで、基礎理解。

長谷川元洋, 2006, 土壌動物群集の研究における座標付け手法の活用, Edaphologia, (80), 35-64.

この論文では、統計ソフトCANOCOを使ってます。RでDCA (Detrended Correspondence Analysis) をおこなう場合は、veganパッケージのdecorana関数を用いる。RDA (Redundancy Analysis) は同じくveganのrda関数。

DCAの第一軸のgradient length (Rの結果ではDCA1のAxis length; 主軸でのSD値?) が4以上か4未満かで、データの分布が線形か山型かを検討するそうな。線形ならPCAやRDA、山形ならCAやCCA。

 

鈴木千夏, 竹中眞, 2009, 土壌微生物生態研究における正準対応分析 (Canonical Correspondence Analysis: CCA) の利用法, 土と微生物, 63(1), 32-38. 

CCAはざっくり言うと重回帰分析なので、多重共線性に気を付ける。説明変数は多くても4つ程度。

しかし説明変数の選択はどうしよう? VIF?AIC? 

(追記 2015.11.20)

この鈴木, 竹中 (2009) では有意性検定のために ade4パッケージを使用してますが、veganパッケージでも可能では?こちらこちら(veganパッケージの解説)参照。

(さらに追記 2015.11.22)

 説明変数の選択についての考え方はここのサイトが非常に参考になりました。重回帰分析の各変数に対しておこなう仮説検定は、「係数=0」という帰無仮説に対する検定であって、「係数=(最尤法や最小二乗法による)推定値」であるかどうかとは無関係であるとのこと。

(追記おわり) 

 

Ramette A., 2007, Multivariate analyses in microbial ecology, FEMS Microbiol. Ecol., 62(2), 142-160.

 この総説は分かりやすいです! Fig.4は、良くまとまってます。和訳して改変した図を下に載せます。Fig.1もユニーク。既往研究における座標付け手法の使われ方の傾向を対応分析で示すという。

「線形ならPCAやRDA、山形ならCAやCCA」と上に書いたけれど、そもそもデータの型に注意しようと述べられてます。種構成データが、個体数などの数値データならPCAやRDAで、0/1データや相対値データならCCAやCAを使うべきだと。0が多いデータに線形仮定を置くのはおかしいという話。この説明の方が、gradient length云々よりもしっくりくる。

 

f:id:Kyoshiro1225:20150918151005j:plain

 

(追記2015.10.06) 

 CCAやDCAなどに関する日本語の解説論文は、下の2つも分かりやすかったです。

山中武彦, 浜崎健児, 嶺田拓也, 2005, 生物・社会調査のための統計解析入門: 調査・研究の現場から (その 9), 農業土木学会誌, 73(4), 319-324. 
加藤和弘, 1995, 生物群集分析のための序列化手法の比較研究, 環境科学会誌, 8(4), 339-352. 

下の論文は20年も前の論文ですが、丁寧に書かれているし分かりやすい。乱数を用いたシミュレーションもおこなっています。

 (追記終わり)

 

(さらに追記2015.11.19) 

 CCAは、結局元論文が分かりやすいかも。事例も豊富。結果の解釈の仕方も丁寧に解説されてます(全体を詳しく読んだわけではないですが)。

Ter Braak C.J., 1986, Canonical correspondence analysis: a new eigenvector technique for multivariate direct gradient analysis, Ecol., 67(5), 1167-1179.

 

あと、RでのCCA分析の解釈例はここなどが分かりやすかったです。

 (追記終わり) 

 

 

「長期の塩分変動が微生物叢に与える影響の生物地理学的解析」

Logares R. et al., 2013, Biogeography of bacterial communities exposed to progressive long-term environmental change, ISME J, 7(5), 937-948.

 複数の湖とその近郊の海から微生物叢を採取し、16Sシーケンス。地点ごとの群集構造の違いと環境要因(塩分・栄養塩濃度)の関連性を、PERMANOVAとRDA (Redundancy Analysis; 冗長性分析) で検定。関連の高い要因を選び出し、その要因と群集構造の違いとの相関をMantel testで検定。

PERMANOVAってこういう使い方もできるのか。量的データの塩分などをPERMANOVAの要因として、どうやって組み込んでいるんでしょう(質的データに変換?)。

 

 

「湿原における銅のレメディエーションに関連した細菌構造の経時変化」

Diaby N., Dold B., Rohrbach E., Holliger C. and Rossi P., 2015, Temporal evolution of bacterial communities associated with the in situ wetland-based remediation of a marine shore porphyry copper deposit, Sci. Total Environ., 533, 110-121.

 多因子分析(MFA)を用いて、細菌構造と環境要因の関係を解析してる。