備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

海外ポスドク目指しての就活 ~公募アプライ編~

この時の続き。


この秋Marie-Curie FellowshipとCanon European Fellowshipに応募しましたが、12月中旬にCanonからはお祈り通知が来ました。Marie-Curieもおそらくダメだろう、ということで12月末から公募を探し始めました(遅い)。で、実際Mari-Curieはダメでした

(→Marie-Curie fellowshipの結果が返ってきたよ)。

 

出した公募10個ほども全部ダメで、4月から国内の某ポスドク職として採用していただけることになりました。採用されるまでには本当に多くの方のお世話になり、ご迷惑をおかけしました。感謝しても感謝しきれません。

 

結局国内に就職するので、失敗の記録ではありますが、どこかの誰かの参考になるかもしれないので、海外ポスドク目指しての就活をここに記録しておきます。ただ就活の過程で、海外のポスドクになるには(海外学振などお金をこちらが持って行く場合を除けば)受け入れ先とコネクションがないと厳しいとか、日本で確固たる地位を確立してから海外へ出る方が帰国時の就職先の心配をしなくても良いのではないか、というお話を複数の方々から受けたので、そのことも念頭に置いて読んでもらえればと思います。

 

 

公募探しに利用した主なポータルサイトは以下。

・Research gate

・Nature jobs

・EuroScienceJobs

・jobs.ac.uk

 

個人的に良さげな公募が多く見つかったのは、Research gateとNature jobsでした。Research gateは自分の"スキル"に適した公募を勧めてくれるのが良いけど検索しにくい。Nature jobsは絶対数が多くて更新も頻繁っぽい。

生態毒性というニッチな分野でのポスドク情報は、ドイツのThe University of Koblenz Landauの研究室が運営しているEcotox blogというページがとても参考になりました。自分は利用しなかったけど、水関係の公募はJosh's Water Jobsというサイトに出てました(後輩のYさんに教えてもらった)。

 

 

大してコネクションの無いまま出した公募ですが、数件はSkype面接まで進みました。例えばこんなスケジュールでした。

・2018.01.04 公募締切

・2018.01.31 面接への招待メール

・2018.02.07 面接の際に使用するプレゼンスライドを送ってくれとのメール

・2018.02.09 面接本番

2/7のメールがなぜか迷惑メールに振り分けられていて、面接にスライドが必要なことを面接の10分前に知らされるという最悪のアクシデントが起きたこともあり、この面接は散々なことに…。それまでのメールは普通に受け取れていたのに、なぜ!? ありあわせの資料を急遽つなぎ合わせて送信し、「だいぶシンプルな資料だね」みたいな感想を言われ、それでも45分くらいの面接を最後までしてもらえましたが…。

 

この面接で知ったのは、実験手法のかなり細かい部分まで聞かれるということです。もちろん「このポストでどういうことがやりたいか?」とか「何が求められていると思いますか?」みたいな良くある質問もありましたが、中には「YYYの正式名称は何?」とか「XXXをしたいときに用いる統計手法は?」とかクイズみたいな問いまで。

なぜそこまで詳しく聞くのか当時は分かりませんでしたが、おそらく海外ではテクニシャンがいたり分業が盛んだったりで、学生やポスドクが全ての作業を担うことは少ないのでしょう。だからカバーレターに「XXXができます!」と書いてても、実際は全くできないというケースが多いみたいですね。もしくは、自分の受け答えがあまりにお粗末だったために初歩的な質問が出されたのかも…。

 

 

Marie-Curie fellowshipの結果が返ってきたよ

結果は惨敗。サクラ散る。

 

Marie-Curie Individual fellowshipはEUがお金を出しているフェローシップです。獲得すると、日本の大学教授並みの給料がもらえ、プラス旅費と家族手当、研究費が手に入り、同業者から一目置かれる(であろう)高ステータスなフェローシップです。平たく言うと学振のEU版ですね。

 

去年の夏から申請書の準備をし、9月中旬に応募して、1月29日に結果が来ました。Marie-Curieの申請書はExcellence (weight 50%)・Impact (weight 30%)・Implementation (weight 20%) の3つのパートで構成されてますが、それぞれのパートの点数と長所・短所が記述形式で返ってきました。下のような感じです。

Excellence Score: 3.60 (Threshold: 0/5.00 , Weight: 50.00%)

Strengths:
- The state-of–the–art in the project field is comprehensively presented and major gaps in the existing knowledge are specifically identified.
- The research objectives are clearly and logically presented.

(略)

Weaknesses:
- The appropriateness of the research approach is not convincingly demonstrated. The proposed methodology, especially in its experimental
part, is not presented in sufficient detail.

- The proposal does not comprehensively describe what specific measures will be taken to integrate the researcher within the host’s research
team.

科研費でも不採択の場合に審査員からの評価を教えてもらえますが、Marie-Curieは記述式の評価がもらえる分、より具体的に改善ポイントのわかる点が良いですね。申請書作りにも審査にも多大な時間が使われているのだから、科研費でもこれくらいのフィードバックがぜひ欲しいところです。

 

総合点は、100%中68%でした。70%が足切りなので惜しいところだったのかと思いきや、実際にpassするには85~90%は必要みたいです。なので全然惜しくない…。

評価を見てみると、アウトリーチやスケジュールの緻密さに重きを置いているのが分かります。一応簡単なアウトリーチの予定は書いてたのですが、"The quality of communication of the project results to different target audiences is not sufficiently demonstrated."とのこと。小中高への課外授業とかマジで書かないとプラスにならなさそう…。

 

気持ちを切り替えて、今は雇われポスドクへの道を模索中です。

相互情報量ベースのネットワーク分析 using R minet

先日WGCNA(Weighted Gene Coexpression Network Analysis)を試しに使ってみました(この記事 → 論文のメモ: 生態毒性研究へのWGCNAの適用)。しかし、遺伝子発現のデータは別に直線関係ばかりではないので(最近読んだ論文のメモ: omicsデータの用量応答モデル)、ピアソンの相関係数に基づいて計算することに違和感を覚えました。

そこで、非線形の関係も扱える相互情報量(mutual information)に基づくネットワーク分析を勉強してみました。

 

 

 

参考にした情報は以下の論文+Wikipediaの"相互情報量"と"情報量"。

ARACNEをRで実装した論文。

Meyer PE, Lafitte F, Bontempi G, 2008, minet: AR/Bioconductor package for inferring large transcriptional networks using mutual information, BMC Bioinfor 9(1): 461.

相互情報量とピアソン相関係数のどちらが適切かは時と場合によるという話。

法隆大輔, 林武司, 2013, 遺伝子発現プロファイル類似度としてのピアソン相関係数相互情報量の比較, 計量生物学 33(2):125-143.

 

 

まず相互情報量を求める

相互情報量の定義はwiki参照。数式で書くとこんな感じらしい。

I(X;Y)=\sum _{{y\in Y}}\sum _{{x\in X}}p(x,y)\log {\frac  {p(x,y)}{p(x)\,p(y)}},\!(wikiより)

連続値の場合の周辺確率と同時確率の求め方は、色々提案されているようですが(たぶん)、一番分かりやすいのはデータを分割して離散化する方法でしょう。

下のデータで遊んでみる。G1とG2が遺伝子発現量を、Sが試料番号を示してます。

> data

     S1 S2  S3 S4 S5   S6 S7  S8 S9
G1   62 41     5 30 15    52 45    1   39
G2 167 42 136 50 98  114 90 167  38

f:id:Kyoshiro1225:20180126222931p:plain

 

ピアソンの相関係数は-0.20です。

f:id:Kyoshiro1225:20180126224258p:plain

一方、相互情報量の場合。

まずデータを分割して離散化します。区切り方は、区切りの幅を同一にする"equalwidth"か区切り内のデータ数を同一にする"equalfreq"か、など選択します。

> d <- discretize ( t(data) , nbins=3 ) #デフォルトだとnbinsはサンプルサイズの平方根

> d

  G1 G2
1  3   3
2  2   1
3  1   3
4  2   1
5  1   2
6  3   2
7  3   2
8  1   3
9  2   1

f:id:Kyoshiro1225:20180126232725p:plain

## こういう感じに分割される

# このデータの場合equalfreqもequalwidthも同じ

次に相互情報量を下記の式から求めます。Hはエントロピー

H(P)=-\sum _{A\in \Omega }P(A)\log P(A)

I(X,Y)=H(X)+H(Y)-H(X,Y)(wikiより)

上の図をもとに集計表を作成し、X(=G1)とY(=G2)のエントロピーを求めます。

  • H(X) = -  { 1/3*log(1/3) + 1/3*log(1/3) + 1/3*log(1/3) }  = 1.584963
  • H(Y) = -  { 1/3*log(1/3) + 1/3*log(1/3) + 1/3*log(1/3) }  = 1.584963
  • H(X,Y) = - { 1/3*log(1/3) + 2*1/9*log(1/9) + 2*2/9*log(2/9) } = 2.19716
  • I (X; Y) = 1.584963 + 1.584963  - 2.19716  =  0.972766 

 

一応、Rのinfotheoライブラリーのmutinformation関数で検算しておきます。求め方は"empirical (=maximum likelihood)" か"shrink entropy"か、"schurmann-grassberger"など選べます。

empirical methodで求めた相互情報量は0.973で、上記の手計算と一致していますね。

> mutinformation(d, method="emp") ## 底はe

          G1      G2
G1 1.099 0.674
G2 0.674 1.099

> natstobits ( mutinformation(d, method="emp") )  ## 底2のビットに変換

                  G1             G2
G1 1.5849625 0.9727653
G2 0.9727653 1.5849625

 

ちなみにRのminetパッケージ(infotheoを利用している)だとbuild.mim関数で一気に求められます。

> build.mim( t(data), estimator="mi.empirical", disc="equalfreq")
                   G1             G2
G1 0.0000000 0.6742695
G2 0.6742695 0.0000000

 

 

相互情報量をもとにネットワーク分析をしてみる

ぶっちゃけRのminetライブラリにぶち込むだけですが、とりあえずやってみます。

次はデータを拡張して、下のものを使用します。G1~G10が遺伝子で、各サンプルS1~S6における発現量のデータです。サンプル6個で相互情報量を求めるのは厳しいかも…。

f:id:Kyoshiro1225:20180127153823p:plain

 

ピアソン相関係数の行列はこんな感じ。

f:id:Kyoshiro1225:20180127154215p:plain

相互情報量を、build.mim関数で求めたのが下。

> mim.eqwi <- build.mim( t(data) , estimator ="mi.empirical", disc="equalwidth")

f:id:Kyoshiro1225:20180127154341p:plain

 

このように類似度行列が得られたら、次は図示するための準備。WGCNAの場合と同様に閾値で区切って0/1データに変換するなどの処理を行います。とりあえずminetライブラリに実装されているARACNEを用います。

> net.eqwi <- aracne(mim.eqwi)

f:id:Kyoshiro1225:20180127161839p:plain

#赤字の場所がARACNEによってカットされた部分。indirectな関係を除外できるということですが…?

 

最後に、相互情報量相関係数の結果を比較。snaライブラリーで図示。

>  mim.cor <- build.mim( t(data) , estimator ="pearson")  # 相関係数使用, 離散化はされない

> net.cor <- aracne(mim.cor)

 

> library( sna ) 

> par (mfrow=c(2,1) )

> gplot(net.eqwi, usearrows=FALSE, displaylabels=TRUE)

> gplot(net.cor, usearrows=FALSE, displaylabels=TRUE)

f:id:Kyoshiro1225:20180127160810p:plain

#左が相互情報量ベースで右がPearson相関係数ベース

 

 

論文のメモ: omics technologyとAOP

AOP(Adverse Outcome Pathways)の構築に、網羅的な生物応答の解析技術(omics)を用いて何ができるかというお話し。omicsの中でも特にtranscriptomicsについて。

 

「化学物質リスク評価へAOPを適用するうえでomicsの果たす役割

Brockmeier EK, Hodges G, Hutchinson TH, Butler E, Hecker M, Tollefsen KE, Garcia-Reyero N, Kille P, Becker D, Chipman K, Colbourne J, Collette TW, Cossins A, Cronin M, Graystock P, Gutsell S, Knapen D, Katsiadaki I, Lange A, Marshall S, Owen SF, Perkins EJ, Plaistow S, Schroeder A, Taylor D, Viant M, Ankley G, Falciani F, 2017, The role of omics in the application of adverse outcome pathways for chemical risk assessment, Toxicol Sci 158: 252-262.

2014年リバプール大学でのワークショップをもとに書かれた総説。

現状ではomicsは生態リスクの評価をおこなうに十分な証拠を提供できていない("omics datasets cannot provide sufficient evidence to characterize risk within ERA")とか、omicsが既存の手法を完全い代替することはない(we ... do not fee that they will completely replace all approaches used in traditional risk assessments)とか、omicsの限界点に触れていて好感触。他に挙げられているomicsの課題は、標準法がないこととインフォマティクスの手法が確立してないこと。この辺りはいつもの議論。

omicsを使うことによって 、既知のパスウェイを確認するだけではなく、新規パスウェイを発見することもできる例としてAntczakら(2015)が引用されてます。

   

 

「トランスクリプトーム解析によるエマメクチン安息香酸塩の急性毒性メカニズム洞察

Song Y, Rundberget JT, Evenseth LM, Xie L, Gomes T, Høgåsen T, Iguchi T, Tollefsen KE, 2016, Whole-organism transcriptomic analysis provides mechanistic insight into the acute toxicity of emamectin benzoate in Daphnia magna, Environ Sci Technol 50(21):11994-12003.

AOP構築に至るまでにomics解析をどう活用できるかの事例として読みました。この論文で提唱されたメカニズムはAOP wikiにも仮登録されてます。

既往文献から導き出せるAOP仮説をマイクロアレイ解析で検証してみたという印象。あくまでomicsは確認作業っぽい。

エクジステロイド受容体(EcR)に関するin vitro試験の結果が、単純なomicsだけではAOP構築できないことを示している気がします。エマメクチン安息香酸(EMB)に曝露させるとDaphniaのEcR遺伝子は活性化されるが、in vitro試験ではそのような反応は見られない。これは、EcRシグナル経路がEMB曝露に対する応答の下流にあるから。

因果関係を踏まえてAOPを構築するためには、key event間の関係をこういう風に一つ一つ検証していかないとダメなんですね。当たり前のことでしょうが…。自分にはin vitro試験の必要性を感じさせる事例論文として面白かったです。レポーターアッセイなどin vitroでなくともノックアウト生物を簡単に作れれば良いのかもしれない。

 

 

「生理学を理解するツールとしての機能ゲノミクスの多層式データ統合

Davidsen PK, Turan N, Egginton S, Falciani F, 2015, Multilevel functional genomics data integration as a tool for understanding physiology: a network biology perspective, J Applied Physiol 120(3):297-309.

ネットワーク分析に関して上のBrockmeierら (2017) で引用されていた総説。FF氏が文章を書いたところはなんとなく分かってしまう。

前半の総説部分は、データからネットワークを推定しようという話。非線形のデータにも使える相互情報量に基づいたARACNEでの推定が良いよ、という話など。ネットワーク推定に生物replicatesは>50~100必要とのこと。

 

 

「ゼブラフィッシュ胚を用いた環境毒性評価のための縮小トランスクリプトーム

Wang P, Xia P, Yang J, Wang Z, Peng Y, Shi W, Zhang X, 2017, A reduced transcriptome approach to assess environmental toxicants using zebrafish embryo test, Environ Sci Technol 52: 821-830.

ちゃんと読んでないしAOPともそれほど関係ありませんが、ampliseqを生態毒性の研究に用いた例としてメモ。omicsは標準試験法がないとのことでしたが、マイクロアレイに代わってampliseqが標準法になるかも。遺伝子ごとに用量応答反応のモデル(直線・シグモイド・U字型)を当てはめ、どの濃度範囲で応答するかを調べて、そのEffect Concentrationと生物学的機能とを絡めて議論しているのが面白いです。このETCの論文が引用されてます。k-meansクラスター法で同様の議論をしている論文は多いですが、この論文のアプローチはなんとなく新鮮でした。

 

(追記 2018.03.23)

Leung KM, 2017, Joining the dots between omics and environmental management, Integr Environ Assess Manag 14: 169-173.

IEAMのBrief Communication。あんまり真新しい話はない。

論文のメモ: トンネル洗浄水による遺伝子発現変動

 

「交通関係の汚染に曝露されたブラウントラウトの肝臓の遺伝子発現プロファイル

Meland S, Farmen E, Heier LS, Rosseland BO, Salbu B, Song Y, Tollefsen KE, 2011, Hepatic gene expression profile in brown trout (Salmo trutta) exposed to traffic related contaminants, Sci Total Environ, 409(8), 1430-1443.

久しぶりに路面排水関係の論文。

トンネルの洗浄水に曝露させたブラウントラウトの肝臓の遺伝子発現をマイクロアレイで調べた論文。何が分かったかとなると微妙…。化学分析の結果、というか実験を始めるまでの想定で大体のことは分かってる気がする。一応adverse outcomeにつながるまでの想定pathwayを描いてます。

論文のメモ: 生態毒性研究へのWGCNAの適用

重み付き遺伝子共発現ネットワーク解析(WGCNA; weighted gene co-expression network analysis)のはなし。

 

   

「遺伝子共発現ネットワークによるDaphniaの繁殖影響予測

Asselman J, Pfrender ME, Lopez JA, Shaw JR, De Schamphelaere KAC, 2017, Gene co-expression networks drive and predict reproductive effects in Daphnia in response to environmental disturbances, Environmental Sci Technol, in press.

殺虫剤とシアノバクテリアのbinary mixtures (全144サンプル) に曝露させたミジンコのマイクロアレイデータと産仔数データを、WGCNAで統合して分析してます。目的は、遺伝子発現データからmixture exposureの産仔数を予測したい、というもの。産仔数と相関のない遺伝子モジュールを省いていき、予測精度を上げていく流れ。最終的には一般化加法モデル (GAM) で予測。

Mixureだと産仔数の予測精度が低下するなど結果自体の新鮮さはあまりないかもですが、モデルの交互作用項で遺伝子発現レベルの複合影響を考慮するという手法など面白い。

 

「オオミジンコの初期転写反応は甲殻類特異的な遺伝子ネットワークに位置する

Orsini L, Brown JB, Shams Solari O, Li D, He S, Podicheti R, Stoiber MH, Spanier KI, Gilbert D, Jansen M, Rusch D, Pfrender ME, Colbourne JK, Frilander MJ, Kvist J, Decaestecker E, De Schamphelaere KAC, Meester LD, 2017, Early transcriptional response pathways in Daphnia magna are coordinated in networks of crustacean specific genes, Mol Ecol, in press.

オオミジンコDaphnia magnaを12種のストレス(シアノバクテリア, 金属, 殺虫剤, 低pHなど)にそれぞれ曝露させ、RNA-seqした論文。オオミジンコは3つのgentotypeを使用してます。

この論文の結果の一つは、2011年ScienceのD. pulexゲノム論文の確認。 すなわち、環境ストレスによって発現変動した遺伝子は甲殻類特異的だということ。さらにgenotypeにも特異的だそうです。この論文では甲殻類crustaceansと言っているけど実際はD. pulexD. magnaしか相同性検索に使用してないので、環境ストレス応答遺伝子が系統によって異なるのはDaphniaに限った話じゃないかと思ったのですが、C. elegansでも報告されている話らしい(Zhou et al., 2015, Genomics)。

ストレス曝露によって発現変動した遺伝子の解析(DEG解析)では、キチン・表皮の考察話が多い。これは正直知見が多くて、議論しやすいから議論されてるだけな気もしますが。Zebrafishのメタ解析の論文と同じく、DEG解析ではあまり多くのストレス応答遺伝子を見つけられなかったので(全処理で変動したのは1,396genes; およそ全3万遺伝子中)、追加でWGCNA解析をしてます。WGCNAでモジュールを調べることで、アノテーションのない遺伝子の機能を推測できるかも、という話ですが、いまいち結論が見えにくい…。データが膨大過ぎて解析が追いついていない感。

 

 

以下、WGCNAの勉強。

超絶初心者の自分用メモです。ご容赦ください。

共起発現ネットワークについては、英語版wikiが分かりやすい。発現量の相関係数sijを計算し、その相関係数がある閾値を超えたら1、閾値以下なら0というルールに従って隣接行列に変換する。

ただWGCNAでは、隣接行列は2値(0 or 1)ではなく、連続値(相関係数sijの累乗sij^a)を用いるそうです。ここが"weighted"たる所以だそうな。どうやって指数aを求めるかは元論文のZhang and Horvath (2005) を見ましょう(適当)。RのWGCNAパッケージだとpickSoftThreshold関数で求められるっぽい。

モジュール(=関連のある遺伝子の集まり)の決め方は普通の階層的クラスタリングでもOK。課題は、どこでクラスターを切るか。

 

 

 

以下、RのWGCNAパッケージを使った解析の練習。下のパッケージ開発の論文とその詳しいチュートリアルここ)とを見ながらやってみました。

Langfelder P, Horvath S, 2008, WGCNA: an R package for weighted correlation network analysis, BMC Bioinformatics 9(1): 559.

チュートリアルのデータは複雑なので、まずもっと簡単なデータとして先ほどの遺伝子共起発現ネットワークのwikiページのものを使います。

data <- matrix( c(43.26, 166.6, 12.53, 28.77, 114.7, 119.1, 118.9, 3.76, 32.73, 17.46, 40.89, 41.87, 39.55, 191.92, 79.7, 80.57, 156.69, 2.48, 11.99, 56.11, 5.05, 136.65, 42.09, 236.56, 99.76, 114.59, 186.59, 136.78, 118.8, 21.41), nrow=10, ncol=3)
rownames(data)<- c("G1","G2","G3","G4","G5","G6","G7","G8","G9","G10")

 

adj <- abs( cor(t(data) , method="pearson") )

隣接行列adjは次のようになる。

G1 G2 G3 G4 G5 G6 G7 G8 G9 G10
G1 1.000 0.234 0.610 0.706 0.029 0.353 0.860 0.998 0.971 0.366
G2 0.234 1.000 0.627 0.523 0.979 0.992 0.295 0.295 0.458 0.990
G3 0.610 0.627 1.000 0.992 0.774 0.525 0.929 0.559 0.405 0.513
G4 0.706 0.523 0.992 1.000 0.687 0.413 0.969 0.660 0.518 0.400
G5 0.029 0.979 0.774 0.687 1.000 0.945 0.485 0.092 0.265 0.941
G6 0.353 0.992 0.525 0.413 0.945 1.000 0.174 0.412 0.565 1.000
G7 0.860 0.295 0.929 0.969 0.485 0.174 1.000 0.826 0.714 0.160
G8 0.998 0.295 0.559 0.660 0.092 0.412 0.826 1.000 0.985 0.425
G9 0.971 0.458 0.405 0.518 0.265 0.565 0.714 0.985 1.000 0.577
G10 0.366 0.990 0.513 0.400 0.941 1.000 0.160 0.425 0.577 1.000

 

pairs(t(data),cex=3,cex.axis=2,pch=21,bg="grey")

f:id:Kyoshiro1225:20180105153618p:plain

始めは、重みづけなしの共起発現ネットワークで処理する。0.8を閾値とします。

# wiki通り0.8を閾値とする

adj2<- ifelse ( adj > 0.8, 1,0)

 

# sna packageで描画

library(sna)

gplot(adj2,usearrows=FALSE, displaylabels=TRUE)

 

f:id:Kyoshiro1225:20180104224648j:plain

試しに閾値の取り方を変えてみると、ネットワークのつながり方も大きく変化します。 

 

 

次にWGCNAパッケージを使用。

sft = pickSoftThreshold(data, dataIsExpr = TRUE)

 

# Sclale-free topology fit indexを描画

plot(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
xlab="Soft Threshold (power)",ylab="Scale Free Topology Model Fit,signed R^2",type="n",
main = paste("Scale independence"))
text(sft$fitIndices[,1], -sign(sft$fitIndices[,3])*sft$fitIndices[,2],
labels=powers,col="red")

f:id:Kyoshiro1225:20180105133730j:plain

20乗(power=20)してもScale-free topology fit indexが0.4程度と低いまま。FAQにその対処法が書かれてますが、今回は相関係数の絶対値を取っているunsigned networkなので、FAQに従いpowerを9とします。

このあたりから、かなり手探り状態…。

adj_w <- adjacency ( t(data),power=9 )

 

# snaで描画してみる, 辺の太さは隣接行列の大きさに従う

gplot(adj_w, usearrows=FALSE, displaylabels=TRUE, edge.lwd=adj_w*2)f:id:Kyoshiro1225:20180105145735p:plain

太い辺edgeに注目したら、上のunweightedの場合のネットワークとほぼ同じですね。

 

次にクラスタリング

TOM = TOMsimilarity(adj_w)
dissTOM = 1-TOM

geneTree = hclust(as.dist(dissTOM), method = "average")
sizeGrWindow(12,9)
plot(geneTree, xlab="", sub="", main = "Gene clustering on TOM-based dissimilarity",hang =-1)

f:id:Kyoshiro1225:20180105150602p:plain

# 枝の剪定

dynamicMods = cutreeDynamic(dendro = geneTree, distM = dissTOM, deepSplit = 2, pamRespectsDendro = FALSE, minClusterSize=2)
dynamicColors = labels2colors(dynamicMods)

dynamicColors
[1] "blue" "turquoise" "brown" "brown" "turquoise" "turquoise" "brown" "blue"
[9] "blue" "turquoise"

 

最後にeigengene。Eigengeneとは、各モジュールにおける第一主成分のことらしいです。モジュールを代表するような発現だと考えて良いみたい。

MEList = moduleEigengenes( t(data), colors = dynamicColors)
MEs = MEList$eigengenes
MEDiss = 1-cor(MEs)
METree = hclust(as.dist(MEDiss), method = "average")

plot(METree, main = "Clustering of module eigengenes", hang=-1)

f:id:Kyoshiro1225:20180105152406p:plain

#blueはGene1,8,9で、brownはGene3,4,7。

 

疲れたので、とりあえずここまで。

あとは、遺伝子発現以外の情報(生態毒性だと致死率・繁殖阻害・成長阻害とか)と各モジュールとの関係を見るなどの解析をして、面白いモジュールを見つけるのが王道でしょうか。

 

 

ちなみに同じ発現データの相関を取ってMDSプロットしてみた場合。

library(MASS)
p<- isoMDS( 1-abs(cor(t(data))), k=2, maxit=100)
plot(p$points, type="n",cex.axis=1.5,cex.lab=1.5)
text(p$points, rownames(p$points), col="red",cex=1.5)

f:id:Kyoshiro1225:20180105154944p:plain

 

 

去年の振り返りと2018年にやりたいこと

2017年の振り返りと、今年2018年にやりたいこと。

 

2017年は 、学位取得後ポスドクとして過ごした初めての年でした。ただ所属は変わってないこともあって、正直まだまだ学生気分で適当にやってます。2017年の始めに書いた目標(去年の振り返りと2017年にやりたいこと)がどれだけ達成できたかをチェックしてみました。

  • 就職先を探す。→ 。いまだ探し中。。。
  • 学会やセミナーなど外に顔を出す。 → 。3つの国内学会のみ。
  • 博士課程の内容を投稿論文として外に出し切る。 → 。今年は博士課程の仕事を、論文3報として出せた(もっとも1報は2017年始でacceptだった)。ただ2017年始の記事にも書いてるけど、完全に出し切るには追加実験が必要。在庫整理はまだ続く…。
  • 博士後の仕事もアウトプットする。 → 。Data report 1報、国内学会での発表2件。
  • NGSでの解析をもうちょっと続けたい。面白い。 → 上記の通りそれなりに出来てはいるが、期待してたほど進んでいない。
  • できれば、データ解析dry系の仕事もしたい。大局的な視点を得られるような。 → 。上に同じ。
  • 勉強する内容は2016年を踏襲。遺伝生態学バイオインフォマティクス機械学習(深層学習含む)。教科書は『保全遺伝学入門』『バイオインフォマティクス ゲノム配列から機能解析へ』『ゼロから作るDeep Learning』を考えています。 →。『バイオインフォマティクス…』は大半読んだけど、あとは読めてない。代わりに勉強会で『基礎からのベイズ統計学』をざっと読んだ。
  • ランニングを続ける。週1回。 → 。アプリのSTRAVAでの記録によると、1年で計37回走っていた模様(下図)。なので平均10日に1回ペース。8~9月はプライベート面でも研究面でも忙しかったため、あまり走れていない。1~3月は単にサボり。

    f:id:Kyoshiro1225:20180103142624p:plain

 

 

研究面での総評。反省。

論文を4報出すなど(うち1報は2016年アクセプトですが)、アウトプットについては満足ですけど、研究が進んだという実感はあまりないのが残念なところ。論文を出すための在庫整理的な実験が多かったかも。所属変更までに終えなければならないのである程度は仕方ないですが…。

並行して新しいことを始められれば良かったのですが、在庫整理的なテーマで今年度から研究費を取ってしまった?ので時間をかけない訳にはいきませんでした。上の目標達成度合いの"△"が多くなった理由はこれ。エフォートの安売りは身を亡ぼしますね。身の丈に合った研究計画を心掛けなければ。

 

 

今年の目標。

4月からの所属は未だ確定していないので(!)、ひとまず3月までの目標を。

  • ポスドク先探し。引き続き。とりあえず当たるまで出しまくる。
  • 博士の仕事を出し切る。簡単な追加実験を一つだけおこない、投稿論文にまとめる。できれば3月までに投稿。
  • NGS解析に関して、2月から3月に一通りのwet実験を済ませる。データ解析は4月以降になりそう。
  • 上の在庫整理的なテーマはどうなるか…。1月中旬から2月初旬はこれに専念する予定。ただおそらく今年度で打ち切りにするので、深入りしすぎないように。
  • NGSに関して、データ解析法で新しいことを試したい。やりたいことは固まってきたので、まとまった時間が取れるかどうか。とりあえず1月初旬はこれに時間をかける。

 

論文のメモ: Zebrafishのマイクロアレイメタ解析

「化学物質曝露後のゼブラフィッシュ胚のトランスクリプトーム:メタ解析

Schüttler A, Reiche K, Altenburger R, Busch W. 2017. The transcriptome of the zebrafish embryo after chemical exposure: a meta-analysis. Toxicol Sci, 157 (2), 291-304.

ゼブラフィッシュ胚を化学物質に曝露させてマイクロアレイ解析した論文全33報のメタ解析。対象とした物質は全60個。全ての曝露物質で共通して発現変動する遺伝子(DEG)があるか、探してます。始め、DEGの選別基準をt検定での有意性としていたけれど、それではばらつきが大きくて共通のDEGは見つからなかったので、効果量 (effect size) を元にDEGを選別したところCa循環関連遺伝子の発現が多くの曝露系で低下していたという結果。Narcosis毒性の論文でも、Ca関連の遺伝子はいろんな物質曝露によって影響を受けやすいと述べられてました。この論文の考察でも述べられてるけど、AOP (Adverse Outcome Pathway) を発展させるためにはこのCa循環のようにどの反応でも出てくるものとspecificなものを区別するのが大事なんでしょう。

t検定ベースではDEGを見つけられないので、単一の遺伝子に基づいた分析でなく複数遺伝子をまとめたエンリッチメント解析やネットワーク分析をやろう、と薦めてるのにこの論文ではそれらをやっていない。。。もしかしたら既に別の論文を準備しているのかも。

 

(追記2020.10.03)

その後、こういう論文が同じグループから出てました。https://doi.org/10.1093/gigascience/giz057

論文のメモ: ヨコエビの巣穴潜り

ヨコエビは負の光走性だが、産まれたばかりの個体は正の光走性だと前回の論文にありました。自分の飼っているヨコエビは歳をとるほど穴に潜らなくなるので、てっきり逆かと思ってました。この現象に光走性は無関係で、別の要因が関係しているのかも。

 

   

「底質毒性試験条件下でのHyalella aztecaの穴掘り行動

Doig LE, Liber K, 2010, An assessment of Hyalella azteca burrowing activity under laboratory sediment toxicity testing conditions, Chemosphere 81:261-265.

底質の種類、明暗条件、個体の成長段階、餌条件を変えて穴掘りへの影響を調べています。砂が多い底質より泥っぽい方がよく潜り、餌をあげた方がよく潜るという結果。あと小さい個体の方が穴に潜りがち。これらは自分の観察結果と一致してます。

明暗での差は明確ではなかったそうです。一度潜ったら外の環境が明るかろうが暗かろうが関係ないのかな。なぜ加齢とともに潜らなくなるのかは結局不明。

 

「淡水ヨコエビH aztecaを用いた底質の影響試験:labと実際のギャップ

Wang F, Goulet RR, Chapman PM, 2004, Testing sediment biological effects with the freshwater amphipod Hyalella azteca: the gap between laboratory and nature, Chemosphere 57:1713-1724.

Hyalella aztecaは本当は泥を食べてないから底質に毒性があることを示す試験生物種には適切ではないよ、というミニレビュー。H. aztecaが泥に潜るということに関してlab間で観察結果が異なっていて、もしかしたらcryptic speciesの問題かもしれないとの議論も。

 

「非致死エンドポイントとしての潜掘能の解析

Siebeneicher S, Wahrendorf DS, Wetzel MA, Jungmann D, 2013, Analysis of burrowing ability as a sublethal endpoint in a marine sediment bioassay with Corophium volutator (Pallas). J Soils Sediments 13:197-206.

成体のオスの穴掘りが最も遅いというシンプルな論文。それでも平均約10分で穴を掘り終わっている様子。メスと亜成体は1~3分以内で穴を掘り終えてます。オスは穴に入っているメスを探し出して穴の中で交尾するため、自分では穴を掘らないらしいです。この種のこのあたりの繁殖に関する行動はFish&Mills (1979) に詳しいみたい。

 

論文のメモ: 最近読んだヨコエビ系の話(共食い・光走性)

ヨコエビが出てくる論文。生態毒性と関連するのもあったり、なかったり。

 

   

抗うつ剤ヨコエビを光の方へ向ける

Guler Y, Ford AT, 2010, Anti-depressants make amphipods see the light, Aquatic Toxicol 99:397-404.

選択的セロトニン再取り込み阻害作用を持つ抗うつ剤フルオキセチンを海産ヨコエビEchinogammarus marinusに曝露させ、その行動変化を見た論文。曝露によって光走性と重力走性を示すようになったそうです。ただ濃度と走性の関係は単調増加ではない。

他にも寄生虫による寄生、セロトニン曝露などによる影響も調べています。寄生虫が体内のセロトニンレベルを調節して行動を変化させるという知見をもとに、この研究も始まっているっぽい。あとジクロフェナックとカルバマゼピンも調べられてますが、明確な影響は見られなかった様子。

この行動変化が、どれくらい生態学的に重要なのかは結構難しそう。意外とヨコエビでも、行動の変化がエンドポイントに使われてるのを知りました(例えばこれ)。

  

ヨコエビの光走性と共食い

Hunte W, Myers RA, 1984, Phototaxis and cannibalism in gammaridean amphipods, Mar Biol 81: 75-79.

Gammarus属の3種ヨコエビは、加齢とともに負の光走性を示し始めたという論文。共食いの餌食にならないよう、幼体は成体と棲み分けているのではないか、とのお話し。

 

ヨコエビの血縁認知

Patterson L, Dick JT, Elwood RW, 2008, Embryo retrieval and kin recognition in an amphipod (Crustacea), Animal Behaviour 76:717-722.

あまりちゃんと読んでませんが、ヨコエビの育児嚢brood pouchから卵を奪った後でそっと戻し、それを共食いするか観察するという鬼畜な実験。親が産んだものではない卵を戻した時に共食い率はどうなるか、がメインの目的です。カッコウの托卵みたいな実験。ちなみにこの論文のretrieveって何かと思ったら、このヨコエビApherusa jurineiは卵を育児嚢から出し入れできて、育児嚢に戻すことをretrieveと呼ぶみたいです。ヨコエビは一般に卵を育児嚢で孵化させるという"passive"なケアをしますが、この種は卵をcurlしたりstrechしたり"active"なケアをするとか(どんな感じかあまりイメージできていない)

自分の卵以外はあまりretrieveせず、さらに共食いしてしまうという結果。でも自分の卵でも結構共食いしている…。

 

「陸生ヨコエビの共食いと食物量

Duarte C, Jaramillo E, Contreras H, Acuña K, 2010, Cannibalism and food availability in the talitrid amphipod Orchestoidea tuberculata, J Sea Res 64: 417-421.

ハマトビムシの共食いについて。亜成体は成体に食べられてしまうという実験結果です。ただ餌があると、その共食いの効果は減少するそうです。亜成体しかいない系だと餌ある条件の方が致死率高いのが面白い。餌の量が十分だったのかは気になります。

上のHunte and Myers, 1984と似たような、成長段階での棲み分けについてもイントロで語られてます。

 

Gammarus pulexは子ども食いを避ける

Lewis SE, Dick JT, Lagerstrom EK, Clarke HC, 2010, Avoidance of filial cannibalism in the amphipod Gammarus pulex, Ethology 116: 138-146.

産仔したばかりのメスは、オスや産卵前のメス、抱卵しているメスに比べて共食い(亜成体食い)をあまりしないという報告。抱卵したばかりのメスは、オスよりむしろ共食いをしています。