最近読んだ論文のメモ： cDNA-AFLPの注意点・類似度の算出・泳動のずれ補正

「生態リスク評価において何を守るべきか、常に問い続ける必要」

Iwasaki Y. and Clements W.H., 2015, A Continuous Need To Determine What We Should Protect In Ecological Risk Assessments, Environ. Sci. Technol., in press.

割とタイトル通りのviewpoint。生態系のリスクに関しては、そもそも何がベネフィットでリスクか分かりにくいし、さらに誰がベネフィットを受けてどこにリスクが生じるか、曖昧になりがちですよね。でもそこをぼかしたままだと評価、対策ができない。

「cDNA-AFLPを用いたきゅうりの転写産物プロファイリング」

Bae K.M., Kwon Y.S., Cho I.H. and Yi S.I., 2006, Use of cDNA‐AFLP for transcript profiling in narrow genetic pools; for example, cucumber (Cucumis sativus L.), Plant Breeding, 125(5), 488-492.

原理から考えると当然かもしれないけど、気づかなかったこと。cDNA-AFLPによって検出された多型（って言っていいのかな？）は、「配列の違い」と「発現の違い」の両方に由来するという話。だから「発現の違い」だけを見たければ、「narrow genetic pool」に適用するしかない。

「類似度の算出方法」

土居秀幸, 岡村寛, 2011, 生物群集解析のための類似度とその応用: R を使った類似度の算出, グラフ化, 検定, 日本生態学会誌, 61(1), 3-20.

先日、AFLPの統計解析手法の総説を読みました。その中では類似度の算出法としてJaccard指数、Dice指数、Simple-Macthing coefficientが提示されてました。これらはバイナリデータに対応してます。

上の論文では0/1のバイナリデータではない、量的なデータに使用できる類似度として、Morisita指数やChao指数なんていうのも紹介されてます。Chao指数はシミュレーションをおこなってサンプリングによる見落としを補正する指数だとか。ただ、1回のサンプリングデータには適していなそうだから自分の対象ではないかな。

多次元尺度法（Multidimentional scaling; MDS）についても勉強になった。

「泳動のピークのずれを認識する方法」

Ishii S., Kadota K. and Senoo K., 2009, Application of a clustering-based peak alignment algorithm to analyze various DNA fingerprinting data, J. Microbiol. Methods, 78(3), 344-350.

ゲルが変わると、同じサンプルでもピーク位置がずれてしまうことがあります。そのずれを補正し、正しいピークマッチングをする手法の論文です。Rのコードもついていて非常に親切。クラスタリングを利用した類似の手法は門田先生のHPに詳しい解説があります。

(追記)

似たような手法の論文(Arrigo et al., 2009) を見つけました。詳しくは読んでませんが。

（さらに追記）

上のIshii et al (2009) は、アイデアがシンプルで面白いと思います。しかし実際に使ってみると、ピークの大きさや、塩基長が大きいほど「ずれ」も大きくなるという事実を考慮していないので、その補正は完全ではないようです…。　

備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。特に環境科学・生態毒性に関して。

最近読んだ論文のメモ： cDNA-AFLPの注意点・類似度の算出・泳動のずれ補正