R言語
異なる生物種間のオルソログを検索して紐づけてくれるRパッケージです。GitHubページはここ。 使いやすくて非常に助かりました。1.5年前からBioconductorにあるみたいですが、5年くらい前にあればめちゃめちゃ使ってましたね…、 マニュアルに大抵のことは書…
米国のToxCast and Tox21プログラムで多数の化学物質に対するin vitro assayデータが生み出されています。それらのデータを、環境中の化学物質モニタリングデータと組み合わせて、リスクの高い化学物質をスクリーニングしようと試みた論文。方向性はここで書…
前回の続き。今回は、STRINGdbから得たPPI networkの情報を、DEG解析(Differentially Expressed Genes)の結果と絡める方法について書きます。 前回までの話 ゼブラフィッシュのPPI networkをSTRINGdbから取得します。例えばこんな感じのデータ。 > full.gr…
タンパク質間相互作用 (protein-protein interaction; PPI) のデータベースであるSTRING (Search Tool for the Retrieval of Interacting Genes/Proteins)。以下は、そのデータを使ってRでネットワーク解析してみた個人的な備忘録です。大部分は"STRINGdb Pa…
誰が最強のMCなのか。MCバトル好きの間では常に議論になることです。 MCバトルの勝敗は、各MCの実力だけでなく、MCのコンディションやMC同士の相性、バトルの審査方法、会場の空気など様々な要因によって決まります。実力あるMCであっても意外な人物に惨敗し…
先日WGCNA(Weighted Gene Coexpression Network Analysis)を試しに使ってみました(この記事 → 論文のメモ: 生態毒性研究へのWGCNAの適用)。しかし、遺伝子発現のデータは別に直線関係ばかりではないので(最近読んだ論文のメモ: omicsデータの用量応答…
重み付き遺伝子共発現ネットワーク解析(WGCNA; weighted gene co-expression network analysis)のはなし。 「遺伝子共発現ネットワークによるDaphniaの繁殖影響予測」 Asselman J, Pfrender ME, Lopez JA, Shaw JR, De Schamphelaere KAC, 2017, Gene co-e…
RパッケージのGOseq。日本語でも、GOseqの使い方の説明はネット上に散見されます。ただ、多くはヒトなどゲノム情報が手に入る生物種を対象にしていて、いわゆる非モデル生物の場合の説明は見かけません。マニュアルを見ても、コードの例までは書いてません。…
今さら何をと言われるかもですが、決定係数の話。 最小二乗法での線形回帰をおこない、決められた目的変数に対してどの説明変数が最も当てはまりが良いかを選ぶという解析をしてます。 その当てはまりの良さの指標としてとりあえず、相関係数・決定係数・AIC…
前回に引き続き、類似度データ解析法の勉強中。 しかしいろんな多変量解析手法がありすぎて、ちょっとパンクしそうです。たくさんの手法をざざっと見る段階は終えて、そろそろ一つ・二つの手法を深く理解しなければ…。 下の総説3つを読んで、基礎理解。 長谷…
「遺伝子発現レベルでの種感受性分布 SSD」 Yan Z., Yang N., Wang X., Wang W., Meng S. and Liu Z., 2012, Preliminary analysis of species sensitivity distribution based on gene expression effect, Sci. China Earth Sci., 55(6), 907-913. Cd, Cu, …
「AFLPのスコアニング方法」 Whitlock R., Hipperson H., Mannarelli M., Butlin R.K. and Burke T., 2008, An objective, rapid and reproducible method for scoring AFLP peak‐height data that minimizes genotyping error, Mol. Ecol. Res., 8(4), 725-…
盲目的にWelchの検定をやってしまっていました(参考:こちら)。 WelchのANOVAでは、各群の分散を用いてF値と自由度を求めるから、「分散=0」つまり測定値が全部同じデータには使えないんですね。式で表すと下のようになります。VwがF値。自由度はJ-1とΔで…
ピークが2つ以上ある分布をRで作成してみた。関数の合成です。そしてその自作分布に従う乱数を発生させました。 まず下のような正規分布の関数fxとgxを設定します。平均と分散はそれぞれ異なる値とします。 fx <- function(x) dnorm(x, mean=1, sd = 1)gx <-…
Rで遊ぶのがすっかり楽しくなってきました。 その1に続いて、ファットヘッドミノーの生命表を使います(Miller and Ankley, 2004)。今度は初期個体数による絶滅確率の違いを検討してみます。その1ではw(9,2,0)の初期個体数11匹で計算していましたが、その…
行列モデルを用いた個体群レベルの生態毒性評価について(参考:こちら)。 個体群の増加率(population growth rate)に対する各生活史変量aij(vital rates)の感度(sensitivity)は下の式で求められます。 ここでw,vはそれぞれ射影行列の右側固有ベクト…
メモ。統計ソフトRを使って、個体群の絶滅確率を計算する関数を考え中。 n回繰り返しを行って、そのうち絶滅した回数を数えればよい。 f <- function (n) { count <- 0 for (i in 1:n) { # 1~nの値をとりながら{}内を繰り返す if (絶滅する条件) count <- co…