備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

R言語

オルソログを教えてくれるRパッケージorthogene

異なる生物種間のオルソログを検索して紐づけてくれるRパッケージです。GitHubページはここ。 使いやすくて非常に助かりました。1.5年前からBioconductorにあるみたいですが、5年くらい前にあればめちゃめちゃ使ってましたね…、 マニュアルに大抵のことは書…

論文のメモ: ToxCastデータを用いた高リスク化学物質の優先順位付け

米国のToxCast and Tox21プログラムで多数の化学物質に対するin vitro assayデータが生み出されています。それらのデータを、環境中の化学物質モニタリングデータと組み合わせて、リスクの高い化学物質をスクリーニングしようと試みた論文。方向性はここで書…

STRINGdbを用いたPPIネットワーク解析 その2: DEG解析など

前回の続き。今回は、STRINGdbから得たPPI networkの情報を、DEG解析(Differentially Expressed Genes)の結果と絡める方法について書きます。 前回までの話 ゼブラフィッシュのPPI networkをSTRINGdbから取得します。例えばこんな感じのデータ。 > full.gr…

STRINGdbを用いたPPIネットワーク解析

タンパク質間相互作用 (protein-protein interaction; PPI) のデータベースであるSTRING (Search Tool for the Retrieval of Interacting Genes/Proteins)。以下は、そのデータを使ってRでネットワーク解析してみた個人的な備忘録です。大部分は"STRINGdb Pa…

階層ベイズモデルを用いてバトルMCの強さランキングを作成する

誰が最強のMCなのか。MCバトル好きの間では常に議論になることです。 MCバトルの勝敗は、各MCの実力だけでなく、MCのコンディションやMC同士の相性、バトルの審査方法、会場の空気など様々な要因によって決まります。実力あるMCであっても意外な人物に惨敗し…

相互情報量ベースのネットワーク分析 using R minet

先日WGCNA(Weighted Gene Coexpression Network Analysis)を試しに使ってみました(この記事 → 論文のメモ: 生態毒性研究へのWGCNAの適用)。しかし、遺伝子発現のデータは別に直線関係ばかりではないので(最近読んだ論文のメモ: omicsデータの用量応答…

論文のメモ: 生態毒性研究へのWGCNAの適用

重み付き遺伝子共発現ネットワーク解析(WGCNA; weighted gene co-expression network analysis)のはなし。 「遺伝子共発現ネットワークによるDaphniaの繁殖影響予測」 Asselman J, Pfrender ME, Lopez JA, Shaw JR, De Schamphelaere KAC, 2017, Gene co-e…

非モデル生物のGO enrichment analysisをGOseqでおこなう

RパッケージのGOseq。日本語でも、GOseqの使い方の説明はネット上に散見されます。ただ、多くはヒトなどゲノム情報が手に入る生物種を対象にしていて、いわゆる非モデル生物の場合の説明は見かけません。マニュアルを見ても、コードの例までは書いてません。…

決定係数R2について

今さら何をと言われるかもですが、決定係数の話。 最小二乗法での線形回帰をおこない、決められた目的変数に対してどの説明変数が最も当てはまりが良いかを選ぶという解析をしてます。 その当てはまりの良さの指標としてとりあえず、相関係数・決定係数・AIC…

最近読んだ論文のメモ: 環境要因と群集構造の比較法 (CCA, RDAなど)

前回に引き続き、類似度データ解析法の勉強中。 しかしいろんな多変量解析手法がありすぎて、ちょっとパンクしそうです。たくさんの手法をざざっと見る段階は終えて、そろそろ一つ・二つの手法を深く理解しなければ…。 下の総説3つを読んで、基礎理解。 長谷…

最近読んだ論文のメモ: 遺伝子発現レベルでのSSD・類似度検定PERMANOVA

「遺伝子発現レベルでの種感受性分布 SSD」 Yan Z., Yang N., Wang X., Wang W., Meng S. and Liu Z., 2012, Preliminary analysis of species sensitivity distribution based on gene expression effect, Sci. China Earth Sci., 55(6), 907-913. Cd, Cu, …

最近読んだ論文のメモ: AFLPのデータ処理関連(特に閾値の決め方について)

「AFLPのスコアニング方法」 Whitlock R., Hipperson H., Mannarelli M., Butlin R.K. and Burke T., 2008, An objective, rapid and reproducible method for scoring AFLP peak‐height data that minimizes genotyping error, Mol. Ecol. Res., 8(4), 725-…

WelchのANOVAは「分散=0」のデータには使えない

盲目的にWelchの検定をやってしまっていました(参考:こちら)。 WelchのANOVAでは、各群の分散を用いてF値と自由度を求めるから、「分散=0」つまり測定値が全部同じデータには使えないんですね。式で表すと下のようになります。VwがF値。自由度はJ-1とΔで…

Rでの分布作成と自作分布に従う乱数生成

ピークが2つ以上ある分布をRで作成してみた。関数の合成です。そしてその自作分布に従う乱数を発生させました。 まず下のような正規分布の関数fxとgxを設定します。平均と分散はそれぞれ異なる値とします。 fx <- function(x) dnorm(x, mean=1, sd = 1)gx <-…

Rを用いた絶滅確率のモンテカルロシミュレーション:その2

Rで遊ぶのがすっかり楽しくなってきました。 その1に続いて、ファットヘッドミノーの生命表を使います(Miller and Ankley, 2004)。今度は初期個体数による絶滅確率の違いを検討してみます。その1ではw(9,2,0)の初期個体数11匹で計算していましたが、その…

Rを用いた個体群増加率の感度解析

行列モデルを用いた個体群レベルの生態毒性評価について(参考:こちら)。 個体群の増加率(population growth rate)に対する各生活史変量aij(vital rates)の感度(sensitivity)は下の式で求められます。 ここでw,vはそれぞれ射影行列の右側固有ベクト…

Rを用いた絶滅確率のモンテカルロシミュレーション

メモ。統計ソフトRを使って、個体群の絶滅確率を計算する関数を考え中。 n回繰り返しを行って、そのうち絶滅した回数を数えればよい。 f <- function (n) { count <- 0 for (i in 1:n) { # 1~nの値をとりながら{}内を繰り返す if (絶滅する条件) count <- co…