備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

論文のメモ: AOP Networkについて

AOP(Adverse Outcome Pathways)に関する話。

ETCに出ていた以下のcompanion papers+αを読んで、AOPの理解が進んだので備忘録的に書いておきます。どちらもOpen Accessです。

ざっくり言うと、「AOPは個々に独立しているわけではなく別の複数のAOPsと関連しあっているので、複数のAOPsをまとめて考えることが大事だよね、AOP Networkを考えようぜ」という論文たちです。

 

 

Knapen D, Angrish MM, Fortin MC, Katsiadaki I, Leonard M, Margiotta‐Casaluci L, Munn S, O'Brien JM, Pollesch N, Smith LC, Zhang X, Villeneuve DL, 2018, Adverse outcome pathway networks I: development and applications, Environ Toxicol Chem, 37(6):1723-1733.
Villeneuve DL, Angrish MM, Fortin MC, Katsiadaki I, Leonard M, Margiotta‐Casaluci L, Munn S, O'Brien JM, Pollesch N, Smith LC, Zhang, X, Knapen D, 2018, Adverse outcome pathway networks II: network analytics, Environ Toxicol Chem, 37(6):1734-1748.

 

そもそもAOPって何?

AOPは、「外的なストレスが生物体内のどの部位にどのように作用し、有害影響(Adverse Outcome; AO)を引き起こすか」というつながりを整理する枠組みのことで、「有害性発現経路」とか「有害性転帰経路」、「毒性発現経路」なんて訳語もあるそうです。

例えば下の図のような感じ。アセチルコリンエステラーゼ阻害から致死・個体群減少に至るAOPの例(参考:Russomら, 2014, AOP16)。有機リン系殺虫剤などは体内に取り込まれると、アセチルコリンエステラーゼ(AChE)と結合し、その酵素活性を阻害します。これが曝露後に分子レベルで生じる最初期の応答(Molecular Initiating Event; MIE)です。その後、アセチルコリンが蓄積していき、痙攣や心拍数の増加など細胞・組織レベルの応答(Key Event; KE)を引き起こし、最悪の場合、死亡や個体群の減少につながります(=AO)。このように、外的ストレスによる生体機能のかく乱を、複数の生物学的階層をまたぐ一つの経路として捉えるのがAOPです。

f:id:Kyoshiro1225:20180706203551p:plain

 

コンセプトの詳しい説明は、Gerald Ankley御大が2010年にETCに発表した論文"Adverse outcome pathways: A conceptual framework to support ecotoxicology research and risk assessment"を読むのが良いと思います。

 

 

AOPの歴史

ここまでの話だと「AOPの何が新しいのかよく分からん、なぜそんなに盛り上がってんの?」って感じかもしれませんね。まぁ盛り上がってるのに特に理由はなくて流行ってそんなもの、と言われればそうかも。

それに実際、AOPみたいな研究は古くからあるみたいです。

 

LaLoneら(2017, ETC)によると、分子レベルの動きを化学物質曝露と関連づけた研究は1975年から存在してて(Payne and Penrose, 1975*1、1989年には"Biomarkers: Biochemical, Physiological, and Histological Markers of Anthropogenic Stress"と題するSETACのワークショップが開かれてます。ただ、ここまでは分子レベルの応答が曝露の指標として使えるかという側面が強く、現在のAOPとはまだ開きがありますね。

今のAOP的な考えがほぼ確立するのが2000年代です、たぶん。2007年にNRCが「21世紀の毒性試験 (Toxicity Testing in the 21st Century)」という報告書を出しており、この中で毒性の発現経路に着目してハイスループットなin vivo試験やin sillico解析を活用することの重要性が述べられているそうです(参考:林, 2013)。この報告書は化学物質によるヒト健康リスクを念頭に置いてますが、その延長で生態リスク評価・管理へ応用するときにAOPが出現してきたっぽいです。AOPという言葉が論文で初めて使われたのは、上述のAnkleyら (2010) です。

AOPの概念はヒト健康リスクの研究から生まれてますが、AOPという用語は上述のAnkleyら (2010) が初出で生態毒性分野から使われ始めました。ヒトの皮膚感作性試験ではAOPの構築が構築がかなり進んでいるので(AOP:40)、てっきりその周辺から生まれた言葉かと思っていましたが、逆輸入だったようです。

 

 

生物学・毒性学などとの違い

AOPが盛り上がっているように見えるのは、化学物質管理や毒性試験のあり方にコミットすることを目指した実学的なものだからかもしれません。

AOPは毒性の生物学的なメカニズムをすべて明らかにすることを主目的としていません。Villeneuveら (2018) も、AOP networkはbiological fidelityよりpredictive utilityを重視しており、weight of evidenceが十分なら全てのKey Eventsを盛り込む必要はないと述べています。確かに上述のAChE阻害のAOPも、3つ目のKEから致死まではかなり適当というか、間に何か入っていても良さそうなものです。

 

 

AOP Networkの概要

で、ようやく本題のAOP Netowrkですが、KE(MIE・AO含む)を共有する既存のAOPsをつなげます。例えばアロマターゼ阻害による繁殖能阻害に関するAOP (AOP25) は下図のように整理されてます。

f:id:Kyoshiro1225:20180707154709p:plain

 

これだけだと単純な経路ですが、KEを共有する他のAOPsを表示すると下図のようになります。ごちゃごちゃしてますが、灰色の三角が他のAOPsを表してます。

f:id:Kyoshiro1225:20180707155106p:plain

 

AOP25とKEを共有している一例がAOP122。4つ目のKE(17β-estradiol synthesis by ovarian granulosa cellsのreduction)以降は、全てAOP25と一緒ですね。

f:id:Kyoshiro1225:20180707225141p:plain

 

こういった共通部分のあるAOPsをまとめていくと Villeneuveら (2018) のFig. 1のようなAOP Networkができます。Fig.1を見ると、"17β-estradiol synthesis by ovarian granulosa cellsのreduction"は5つのKEの下流にあって1つのKEの上流にありAOP networkの収束点(point of convergence)だと分かります。

このようにAOP networkの収束・発散を調べることで、適切な毒性試験法の設計や複合毒性の評価につなげられると期待されています。例えば収束するAOP networkは相加あるいは相乗毒性につながるのでは、とのことです。しかし、論文を読んだ印象では定量的な議論が可能な状態ではなく、まだまだコンセプト段階ですね。

 

Knapenら, 2018の後半でちょこっと述べられている排水のハザード同定の話がAOP networkの活用例として面白かったです。排水の有機溶媒抽出物にToxCast in vitro assayを適用して、その結果をAOP wikiと照らし合わせAOP networkを構築し、水生脊椎動物に生じうるハザードを同定する、というもの。エストロゲン受容体アゴニストによる繁殖能低下とかAhR受容体活性化による胚死亡などがハザードとして挙げられているので、既存のAOP wikiの情報量によって大きなバイアスがかかっている気はしますが、方向性は面白いです。

 

 

AOP Networkの課題

上の2つの論文(Knapenら, 2018Villeneuveら, 2018 )ではAOP networkの課題がいくつかあげられてます。AOPではKEが方向性を持つので、同じ現象を扱う場合でも異なるKEに分類されてしまい(例:Increase, vitellogenin synthesisとReduction, vitellogenin synthesis)、networkの解釈が難しい、とか。AOP wikiにのっている多くのAOPsは質の担保がなされていない、とか。

個人的に一番問題だと思ったのは、現状では分かっているAOPsが少なすぎて、あるいは既存のAOPsでもKE間の根拠が薄弱で、実際の環境汚染を対象にできるほど複雑かつ精緻なAOP networkを構築できないのではないか、ということです。「AOPは発展途上だ」とか「AOPは日々更新されていく」みたいな文言はよく見ますが、企画倒れにならないで欲しいものです…。

また、 Knapenら, 2018を読むとAOP networkを図示できる便利なツールがあるように思えましたが、全然そんなことはなかったです。Cytoscapeプラグインとして紹介されているAOPXplorerを試しに使ってみましたが、既存の複数のAOPsのまとまりをネットワークとして図示してくれるだけで、 Knapenら, 2018のFig.1で示されているようなextractionとかfilteringとかはほぼ対応していません…。まだまだこれから、ということでしょうか。

 

 

最後の方でダメ出しばかりになってしまったので、期待していることを一つ。どうやらAOP-DBというウェブ上での検索機能付きのデータベースが今開発中とのこと。AOP-DBAOP knowledgebaseと名前ややこしい…)は、KEGG pathwayやGene Ontologyなど既存の生物学の用語とAOPsを結び付け、さらにAOPと化学物質との関連も示してくれるそうです。既存のデータベースを統合しているだけではありますが、こういうツールがあるとエンドユーザーとしてはとても助かります。

Pittman ME, Edwards SW, Ives C, Mortensen HM, 2018, AOP-DB: A database resource for the exploration of Adverse Outcome Pathways through integrated association networks, Toxicol Applied Pharmacol, 343:71-83.

 

(追記 2018.07.19)

ツールはEffectopediaの方が優れているかも?まだほとんど試してませんが・・・。使ってみてからまた追記するかも。

*1:brown troutとカラフトシシャモのAryl Hydrocarbon Hydroxylase (CYP1A1) と石油曝露の関係を調べた論文。CYP1A1の曝露のバイオマーカーとしての利用可能性を調べただけで、Laloneらの言うようにadverse effectsとの関係は見ていない気がするが・・・。

「傷はぜったい消毒するな」感想

どうして消毒してはいけないのか。それは、消毒によって細菌だけでなく人間の皮膚の細胞まで破壊され、さらに皮膚が乾燥してしまい、傷の治りが遅くなるから。また、消毒すると、皮膚常在菌が殺されて、その隙に病原性を持つ通過菌(例:黄色ブドウ球菌)が侵入してくるため、傷が化膿する原因にもなります。

ではどうすれば良いのか。「消毒しない・乾燥させない」を徹底すれば良いそうです。近頃よく見るハイドロコロイド素材の絆創膏などで傷口を覆えばOK。傷口からの滲出液には細胞成長因子なる物質が含まれており、傷の治りを促進するため、滲出液を傷口で保持しておくことが大事みたいです。

 

 

書名に関連する内容はあらかたこんな感じです。

ただ本書は、それ以外の枝葉が多い。面白い部分もあれば少しシツコイ部分も。

筆者の湿潤医療が医学界に中々受け入れられなかったこともあってか、医学界への攻撃やらパラダイムの話に紙幅がけっこう割かれています。これはシツコイなと思った部分。まぁ気持ちはわからなくもないですが…。医師は常に目の前で苦しんでいる患者に対処しなければならないため、誤った治療法であってもとりあえず施され続け、今まで残ってきた、という話は自分の専門の実学・工学にも通ずるところがある気がします。

最後の章の進化についての脱線?は面白かったです。皮膚に存在する神経伝達物質は元々は創傷治癒物質だったのでは、とか。専門家から見てどこまで正しいかは分かりませんが楽しく読めました。

 

 

 

傷はぜったい消毒するな 生態系としての皮膚の科学 (光文社新書)

傷はぜったい消毒するな 生態系としての皮膚の科学 (光文社新書)

 

 

階層ベイズモデルを用いてバトルMCの強さランキングを作成する

誰が最強のMCなのか。MCバトル好きの間では常に議論になることです。

 

MCバトルの勝敗は、各MCの実力だけでなく、MCのコンディションやMC同士の相性、バトルの審査方法、会場の空気など様々な要因によって決まります。実力あるMCであっても意外な人物に惨敗したり、成績が振るわない対戦形式があったりして、勝敗の結果からMCの実力を推定するのは案外難しいものです。

 

勝敗の結果から各プレイヤーの実力を推定する方法として階層ベイズモデリングがあります。例えば将棋の勝敗データに適用したブログ記事→階層ベイズモデルで勝敗データからプロ棋士の強さを推定する - StatModeling Memorandum。今回は、このブログの著者が書いたStan・Rベイズモデリング本(通称アヒル本)を参考にして、階層ベイズモデルを用いてバトルMCの実力を推定してみました。

 

 

 

勝敗データ

ネット上に散らばっている勝敗データをかき集めました。

2000年代のバトル結果はネットであまり集められなかったので、2010年~2017年のデータのみ対象にしました。また、地方で開催されているバトルを含めるとキリが無くなるので、UMB(Ultimate MC Battle)やKOK(King of Kings)の本戦などの全国大会だけを選びました。

対象にした大会は、UMB2010~2017、KOK2015~2017、罵倒Grand Championship 2014・2015・2017、戦極MC Battle 第6・8・9・10・13・16章、フリースタイルダンジョンの初代モンスター時代の1on1のみ*1フリースタイルダンジョンの東西口迫歌合戦です(一部抜け落ちている試合あり)。全部で661試合。もし他に勝敗データを提供してくださる方がいらっしゃれば、ぜひコメントいただけると嬉しいです。

 

負けてしかいないMCはほとんど推定に役立たないので除外したところ、139MC・477試合が残りました。この477試合のデータを用いて、ベイズモデリングをおこないました。

 

f:id:Kyoshiro1225:20180603113946p:plain

こんな感じでExcelにまとめました。

 

モデル式

ヒル本の将棋の棋士の強さ推定モデル(p.188~190)をほぼそのまま拝借します。

Performance [g, 1] ~ Normal ( μ [Loser [g] ], σ [Loser [g] ] )

Performance [g, 2] ~  Normal ( μ [Winner [g] ], σ [Winner [g] ] )

Performance [g, 1] < Performance [g, 2] 

μ [ n ] ~ Normal ( 0, σn )

σ [ n ] ~ Gamma ( 10, 10 )

 

gは試合のインデックスを示し、今回は477まであります。nはMCのインデックスを示し、1~139まであります。Performance[g,1]とPerformance[g,2]は試合gにおける勝者と敗者のパフォーマンスです。各試合におけるプレイヤーmのパフォーマンスは、平均μm・σm正規分布から生成されると考え、1・2式目のように表現しています。σは各MCの"勝負ムラ"を示し、弱情報事前分布であるガンマ分布に従うと設定しています。パフォーマンスの大きい方が勝者となる、という制約が3式目です。

詳しいことはアヒル本を読んでください。

 

Stan・Rコード

下のようなコードをStanで書きました。というか、アヒル本からコピーしました。

data {

  int G;

  int P;

  int<lower=1, upper=P> LW[G,2];

}
parameters {

  ordered[2] performance[G];

  vector[P] mu;

  real<lower=0> s_mu;

  vector<lower=0>[P] s_pf;

}
model {

 for(g in 1:G) {

    for (i in 1:2) {

       performance [g,i] ~  normal(mu[LW[g,i]], s_pf[LW[g,i]]);

     }

 }

 mu ~ normal (0, s_mu);

 s_pf ~gamma (10,10);

} 

 でRからStanを走らせました。

P <- max(data2[,c("Loser_id","Winner_id")])

dat <- list( G =G, P = P, LW=data2[,c("Loser_id","Winner_id")] ) 

stanmodel <- stan_model(file="model.stan")

fit <- sampling(stanmodel, data=dat, pars=c('mu','s_mu','s_pf'), seed=1234, chains =4 , iter = 2500) 

 

 

結果

推定された強さμの高いトップ20のMCは下の通りになりました(μの5~95パーセンタイル値を図示してます)。図の下に行くほど強くなっています。誰もが納得のR-指定がトップ1に輝いていますね。その後のGADORO、mol53、晋平太などの並びも、それなりに妥当ではないでしょうか。

f:id:Kyoshiro1225:20180603114622p:plain

注意すべきは、推定結果は今回扱った勝敗データに依存しているという点。当たり前ですが、扱う勝敗データを拡張すれば結果は変わります。今回は全国レベルの大きな大会だけに絞ったので、地方予選で勝ち続けていてもそれが推定結果に反映されてません。さらに、ここ2~3年の人数が大きい大会で優勝した人は、勝利した試合数が多いので有利になっています。

ちょっと意外な人がトップ20に入っているのもデータ選択の妙ですね。GASHIMAや鎮座DOPENESS、般若は、勝利した試合しか今回のデータに含まれてないのでランキング上位ですが、データ数が少ないので信頼区間が非常に大きくなっています。

 

次に"勝負ムラ"σの大きいMCと小さいMCのトップ10です。上の図がσの大きいMC、つまりムラがあるMCで、下の図がσの小さいMC、つまり安定しているMCです。やはり図の下側からトップ(あるいはワースト)の順になっています。

サイプレス上野が一番ムラがある、という結果でした。なぜか納得です。戦極8章でR-指定を倒して優勝した一方で、フリースタイルダンジョンなどでの連敗が反映されているのでしょうか。安定しているMCには、やはり実力のあるMC達がランクインしてますね。逆にここに入っていない晋平太や崇勲は、割と負けるけどハマったら強いというタイプでしょうか。

f:id:Kyoshiro1225:20180603114647p:plain

 

最後に

できれば年ごとの強さを推定したかったのですが、そのためにはデータ数が少なすぎるみたいです。アヒル本のp.231~235を参考に時系列モデルを作成してみましたが、あまり納得できる結果にはなりませんでした。計算時間もかなりかかるし…。残念。

地方予選も含めて膨大なMCバトルのデータを持っている方がいれば、ぜひ提供してくださいw。 

個人的にはR-指定と晋平太の2トップになって欲しかったなぁ。

 

 

(追記:2018.08.05)

解析のもとにしたExcelファイルアップロードしました→MC_battle.xlsx 

だいぶ適当ですが。例えばUMB2010は自分の印象に残っているバトルしか記載してません。

 

 

StanとRでベイズ統計モデリング (Wonderful R)
 

 

*1:晋平太や呂布カルマなどチーム戦が導入されてからの1 on 1はまだ含めてない。

論文メモ: ヨコエビ Hyalella aztecaのゲノム

 「底質毒性と進化毒性学のモデル生物:Hyalella aztecaのトキシコゲノム

Poynton HC, Hasenbein S, Benoit JB, Sepulveda MS, Poelchau MF, Hughes DST, Murali SC, Chen S, Glastad KM, Goodisman MAD, Werren J, Vineis JH, Bowen JL, Friedrich M, Jones J, Robertson HM, Feyereisen R, Mechler-Hickson A, Mathers N, Lee CE, Colbourne JK, Biales A, Johnston JS, Wellborn GA, Rosendale AJ, Cridge AG, Munoz-Torres MC, Bain PA, Manny AR, Major KM, Lambert F, Vulpe CD, Tuck P,  Blalock B, Lin YY, Smith ME, Ochoa-Acuña H, Chen MM, Childers CP, Qu J,  Dugan S, Lee SL, Chao H, Dinh H, Han Y, Doddapaneni HV, Worley KC, Muzny DM, Gibbs RA, Richards S, 2018, The Toxicogenome of Hyalella azteca: a model for sediment ecotoxicology and evolutionary toxicology, Environ Sci Technol.

ヨコエビHyalella aztecaのドラフトゲノム。Redundansでアセンブリされたゲノムデータ(Hazt_2.0)やその情報はNCBIのページにあります。全長550.9Mbpで、偽遺伝子含めた遺伝子数は20,022個。

ドラフトゲノムを作ったことでアノテーションできる遺伝子数が増えたよ、という話。ゲノムアセンブリ前は、有害物質曝露によって発現変動する遺伝子(DEGs)のアノテーション率は低く、Cdの場合は13%、Znは29%、PCB126は0%、Cyfluthrinは20%でした。リファレンスゲノムができた効果で10~30%アノテーション率が増加したそうです。それでも50%以下で、結構厳しい。Daphnia pulexのゲノム論文(2011, Science)は確か環境変化に対するDEGsはアノテーションされにくい、系統lineageに特異的な遺伝子が多い、という話でしたが、それとも一致している傾向?

 

 

 

「ヒトゲノムを解読した男:クレイグベンター自伝」感想

ひと月くらい前に読了。

バイタリティに富んだ人間という一言に尽きます。

彼が海軍衛生兵としてベトナムへ従軍していた時の話。腹部に傷を負った二人の男が同時期に病院に運ばれてきた。ひとりは生きて当然だと思われたが、すぐに息を引き取った。もうひとりは腸や肝臓、脾臓の一部が吹き飛ばされてすぐに死ぬと思われたが、何日もしゃべり続けて生きながらえていた。二人の対比から、ベンターは人間の精神と意志の力はどんな薬よりも効果があることを学んだ、とあります。ベンターはこの出来事以来ほとんど毎日のように、今日も生きていたいと願うようになったそうです。

これは彼の自伝を象徴するエピソードと思います。とにかく並外れた情熱と行動力が本書の節々から感じられます。ヒトゲノム計画のあとも、微生物メタゲノム*1や人工生命など新しい研究課題に取り組んでますしね。

 

 

ゲノム研究を始める前の学部生のころ(ベトナムからの帰還後)からPNASに論文を載せまくるなど、超優秀だったとは知りませんでした。

 

ショウジョウバエのゲノムを手に入れた際、その分析を短期間で終わらせるために世界中のショウジョウバエ研究者を一か所に集め、11日間かけて皆で解析して3本の一連の論文を発表したと言います。おかけでゲノムプロジェクトを始めてから論文発表まで1年足らずで済ませています。すごすぎ。こういう時代が動いてるというか、興奮が充満してるような感じ、ぜひ参加してみたい。

 

あと民間企業でもアカデミックな研究ができるんだなぁと感心しました(小並感)。彼のマネをして上手くいくかは知りませんが。

 

ヒトゲノムを解読した男 クレイグ・ベンター自伝

ヒトゲノムを解読した男 クレイグ・ベンター自伝

 

 

*1:クレイグベンターがメタゲノム解析の走りだったのは知りませんでした。サルガッソー海これ

論文のメモ: EDA・TIEについての最近の論文

最近出たEDA(Effect-Directed Analysis)とTIE(Toxicity Identification Evaluation)に関する論文。

   

「底質の複雑な毒性の診断:TIEとEDA

Li H., Zhang J., You J., 2017, Diagnosis of complex mixture toxicity in sediments: application of toxicity identification evaluation (TIE) and effect-directed analysis (EDA), Environ Pollution: in press.

総説。様々な化学物質が混在している汚染底質の中で、具体的にどの物質が悪影響の原因になっているのかを探る手法にSediment TIEとEDAがあります。その2つの手法の欠点を補い合い、より効果的に悪影響の原因物質を同定しようという話。ざっと読んでみて、Burgess et al. (2013, ETC) の総説から新しい話はほぼなさそうでした。TIEの利点はbioavailabilityを考慮してる点で、EDAの利点は有機物の細かい分画を実施してる点。それぞれの欠点は逆。↓表にするとこんな感じ。

f:id:Kyoshiro1225:20180329191308p:plain

で、EDAでおこなう有機の分画をTIEでやれば良いよね、その時は強力な有機溶媒で抽出したりせずbioavailabilityを考慮したpassive samplingなどの手法を使おうね、という話の展開。最後、おまけ程度にAOP(Adverse Outcome Pathways)の話もあります。

同じグループから同時期に似たような総説も出てるみたいです↓。 こちらは未読。

You J., Li H., 2017, Improving the accuracy of effect-directed analysis: the role of bioavailability, Environ Sci Processes Impacts

 

 

「パッシブドージングとin vivo毒性試験を組み合わせた底質EDA

Qi H., Li H., Wei Y., Mehler W.T., Zeng E.Y., You J., 2017, Effect-directed analysis of toxicants in sediment with combined passive dosing and in vivo toxicity testing, Environ Sci Technol 51:6414-6421.

上の総説で引用されていたもの。総説で言うところのbioavailabilityを考慮した新しいEDAとはこの論文の内容を指すっぽいので、 実際の研究の流れを知りたければ総説よりこちらを読むべし。

河川底質を有機溶媒で抽出し、その抽出物をゲル浸透クロマト等で分画して毒性試験に使ってます。ここまでは伝統的なEDAですが、抽出物の曝露をポリジメチルシロキサン(PDMS)によるpassive dosingでおこなってることと、毒性試験はユスリカ(in vivo)でおこなってることがこの論文の新しい点だそうです。

目指している方向性は共感出来ますが、毒性原因物質であることの確認が底質含有量と毒性(致死率・バイオマーカー応答)との相関というのは少し弱い気が・・・。考察で述べられているようにどのdosing手法を用いるかによって物質ごとのavailabilityが変化するので、passive dosingを用いずに原因物質かどうかを確認するステップは大事だと思います。

というか、passive dosingがbioavailabilityを模擬?できているのかという根本的な疑問があります。このあたりは勉強したいけど、「こういう操作をしたらこういう結果が得られた」と割り切った方が良いかも。

 

 

「殺虫剤耐性に関する変異を用いて環境試料の毒性原因を同定する

Weston D.P., Poynton H.C., Major K.M., Wellborn G.A., Lydy M.J., Moschet C., Connon R.E., 2018, Using mutations for pesticide resistance to identify the cause of toxicity in environmental samples, Environ Sci Technol 52: 859-867.

面白い!

ピレスロイド系殺虫剤に耐性のある野生集団と耐性のないlab集団の両者を用いて汚染水への曝露試験をした時に、集団間で応答の違いがあれば、その原因はピレスロイド系殺虫剤と分かる、という話。このような、変異mutationによる感受性の違いを利用して、毒性原因物質を推測する手法をbiological TIEと名付けてます。

殺虫剤への耐性がある集団をlabで非汚染下で継代飼育しても、耐性はある程度維持できるそう。ピレスロイド系殺虫剤への耐性がある集団は、DDTに対しては高い感受性を有していました。この原因は不明みたいですが、交差耐性cross-resistanceの逆が生じているんですね。この現象を考えると、biological TIEというコンセプトは実現可能性が低い気もします(というかとりあえず名付けてるだけでは・・・)。ただ方向性は面白いし、AOPEDAの発展した先は実はこんな感じではないかと妄想させてくれます。

1塩基の変異×2がピレスロイド系殺虫剤の耐性獲得につながってるそうです(Weston et al., 2013, PNAS)。

 

海外ポスドク目指しての就活 ~公募アプライ編~

この時の続き。


この秋Marie-Curie FellowshipとCanon European Fellowshipに応募しましたが、12月中旬にCanonからはお祈り通知が来ました。Marie-Curieもおそらくダメだろう、ということで12月末から公募を探し始めました(遅い)。で、実際Mari-Curieはダメでした

(→Marie-Curie fellowshipの結果が返ってきたよ)。

 

出した公募10個ほども全部ダメで、4月から国内の某ポスドク職として採用していただけることになりました。採用されるまでには本当に多くの方のお世話になり、ご迷惑をおかけしました。感謝しても感謝しきれません。

 

結局国内に就職するので、失敗の記録ではありますが、どこかの誰かの参考になるかもしれないので、海外ポスドク目指しての就活をここに記録しておきます。ただ就活の過程で、海外のポスドクになるには(海外学振などお金をこちらが持って行く場合を除けば)受け入れ先とコネクションがないと厳しいとか、日本で確固たる地位を確立してから海外へ出る方が帰国時の就職先の心配をしなくても良いのではないか、というお話を複数の方々から受けたので、そのことも念頭に置いて読んでもらえればと思います。

 

 

公募探しに利用した主なポータルサイトは以下。

・Research gate

・Nature jobs

・EuroScienceJobs

・jobs.ac.uk

 

個人的に良さげな公募が多く見つかったのは、Research gateとNature jobsでした。Research gateは自分の"スキル"に適した公募を勧めてくれるのが良いけど検索しにくい。Nature jobsは絶対数が多くて更新も頻繁っぽい。

生態毒性というニッチな分野でのポスドク情報は、ドイツのThe University of Koblenz Landauの研究室が運営しているEcotox blogというページがとても参考になりました。自分は利用しなかったけど、水関係の公募はJosh's Water Jobsというサイトに出てました(後輩のYさんに教えてもらった)。

 

 

大してコネクションの無いまま出した公募ですが、数件はSkype面接まで進みました。例えばこんなスケジュールでした。

・2018.01.04 公募締切

・2018.01.31 面接への招待メール

・2018.02.07 面接の際に使用するプレゼンスライドを送ってくれとのメール

・2018.02.09 面接本番

2/7のメールがなぜか迷惑メールに振り分けられていて、面接にスライドが必要なことを面接の10分前に知らされるという最悪のアクシデントが起きたこともあり、この面接は散々なことに…。それまでのメールは普通に受け取れていたのに、なぜ!? ありあわせの資料を急遽つなぎ合わせて送信し、「だいぶシンプルな資料だね」みたいな感想を言われ、それでも45分くらいの面接を最後までしてもらえましたが…。

 

この面接で知ったのは、実験手法のかなり細かい部分まで聞かれるということです。もちろん「このポストでどういうことがやりたいか?」とか「何が求められていると思いますか?」みたいな良くある質問もありましたが、中には「YYYの正式名称は何?」とか「XXXをしたいときに用いる統計手法は?」とかクイズみたいな問いまで。

なぜそこまで詳しく聞くのか当時は分かりませんでしたが、おそらく海外ではテクニシャンがいたり分業が盛んだったりで、学生やポスドクが全ての作業を担うことは少ないのでしょう。だからカバーレターに「XXXができます!」と書いてても、実際は全くできないというケースが多いみたいですね。もしくは、自分の受け答えがあまりにお粗末だったために初歩的な質問が出されたのかも…。

 

 

Marie-Curie fellowshipの結果が返ってきたよ

結果は惨敗。サクラ散る。

 

Marie-Curie Individual fellowshipはEUがお金を出しているフェローシップです。獲得すると、日本の大学教授並みの給料がもらえ、プラス旅費と家族手当、研究費が手に入り、同業者から一目置かれる(であろう)高ステータスなフェローシップです。平たく言うと学振のEU版ですね。

 

去年の夏から申請書の準備をし、9月中旬に応募して、1月29日に結果が来ました。Marie-Curieの申請書はExcellence (weight 50%)・Impact (weight 30%)・Implementation (weight 20%) の3つのパートで構成されてますが、それぞれのパートの点数と長所・短所が記述形式で返ってきました。下のような感じです。

Excellence Score: 3.60 (Threshold: 0/5.00 , Weight: 50.00%)

Strengths:
- The state-of–the–art in the project field is comprehensively presented and major gaps in the existing knowledge are specifically identified.
- The research objectives are clearly and logically presented.

(略)

Weaknesses:
- The appropriateness of the research approach is not convincingly demonstrated. The proposed methodology, especially in its experimental
part, is not presented in sufficient detail.

- The proposal does not comprehensively describe what specific measures will be taken to integrate the researcher within the host’s research
team.

科研費でも不採択の場合に審査員からの評価を教えてもらえますが、Marie-Curieは記述式の評価がもらえる分、より具体的に改善ポイントのわかる点が良いですね。申請書作りにも審査にも多大な時間が使われているのだから、科研費でもこれくらいのフィードバックがぜひ欲しいところです。

 

総合点は、100%中68%でした。70%が足切りなので惜しいところだったのかと思いきや、実際にpassするには85~90%は必要みたいです。なので全然惜しくない…。

評価を見てみると、アウトリーチやスケジュールの緻密さに重きを置いているのが分かります。一応簡単なアウトリーチの予定は書いてたのですが、"The quality of communication of the project results to different target audiences is not sufficiently demonstrated."とのこと。小中高への課外授業とかマジで書かないとプラスにならなさそう…。

 

気持ちを切り替えて、今は雇われポスドクへの道を模索中です。

相互情報量ベースのネットワーク分析 using R minet

先日WGCNA(Weighted Gene Coexpression Network Analysis)を試しに使ってみました(この記事 → 論文のメモ: 生態毒性研究へのWGCNAの適用)。しかし、遺伝子発現のデータは別に直線関係ばかりではないので(最近読んだ論文のメモ: omicsデータの用量応答モデル)、ピアソンの相関係数に基づいて計算することに違和感を覚えました。

そこで、非線形の関係も扱える相互情報量(mutual information)に基づくネットワーク分析を勉強してみました。

 

 

 

参考にした情報は以下の論文+Wikipediaの"相互情報量"と"情報量"。

ARACNEをRで実装した論文。

Meyer PE, Lafitte F, Bontempi G, 2008, minet: AR/Bioconductor package for inferring large transcriptional networks using mutual information, BMC Bioinfor 9(1): 461.

相互情報量とピアソン相関係数のどちらが適切かは時と場合によるという話。

法隆大輔, 林武司, 2013, 遺伝子発現プロファイル類似度としてのピアソン相関係数相互情報量の比較, 計量生物学 33(2):125-143.

 

 

まず相互情報量を求める

相互情報量の定義はwiki参照。数式で書くとこんな感じらしい。

I(X;Y)=\sum _{{y\in Y}}\sum _{{x\in X}}p(x,y)\log {\frac  {p(x,y)}{p(x)\,p(y)}},\!(wikiより)

連続値の場合の周辺確率と同時確率の求め方は、色々提案されているようですが(たぶん)、一番分かりやすいのはデータを分割して離散化する方法でしょう。

下のデータで遊んでみる。G1とG2が遺伝子発現量を、Sが試料番号を示してます。

> data

     S1 S2  S3 S4 S5   S6 S7  S8 S9
G1   62 41     5 30 15    52 45    1   39
G2 167 42 136 50 98  114 90 167  38

f:id:Kyoshiro1225:20180126222931p:plain

 

ピアソンの相関係数は-0.20です。

f:id:Kyoshiro1225:20180126224258p:plain

一方、相互情報量の場合。

まずデータを分割して離散化します。区切り方は、区切りの幅を同一にする"equalwidth"か区切り内のデータ数を同一にする"equalfreq"か、など選択します。

> d <- discretize ( t(data) , nbins=3 ) #デフォルトだとnbinsはサンプルサイズの平方根

> d

  G1 G2
1  3   3
2  2   1
3  1   3
4  2   1
5  1   2
6  3   2
7  3   2
8  1   3
9  2   1

f:id:Kyoshiro1225:20180126232725p:plain

## こういう感じに分割される

# このデータの場合equalfreqもequalwidthも同じ

次に相互情報量を下記の式から求めます。Hはエントロピー

H(P)=-\sum _{A\in \Omega }P(A)\log P(A)

I(X,Y)=H(X)+H(Y)-H(X,Y)(wikiより)

上の図をもとに集計表を作成し、X(=G1)とY(=G2)のエントロピーを求めます。

  • H(X) = -  { 1/3*log(1/3) + 1/3*log(1/3) + 1/3*log(1/3) }  = 1.584963
  • H(Y) = -  { 1/3*log(1/3) + 1/3*log(1/3) + 1/3*log(1/3) }  = 1.584963
  • H(X,Y) = - { 1/3*log(1/3) + 2*1/9*log(1/9) + 2*2/9*log(2/9) } = 2.19716
  • I (X; Y) = 1.584963 + 1.584963  - 2.19716  =  0.972766 

 

一応、Rのinfotheoライブラリーのmutinformation関数で検算しておきます。求め方は"empirical (=maximum likelihood)" か"shrink entropy"か、"schurmann-grassberger"など選べます。

empirical methodで求めた相互情報量は0.973で、上記の手計算と一致していますね。

> mutinformation(d, method="emp") ## 底はe

          G1      G2
G1 1.099 0.674
G2 0.674 1.099

> natstobits ( mutinformation(d, method="emp") )  ## 底2のビットに変換

                  G1             G2
G1 1.5849625 0.9727653
G2 0.9727653 1.5849625

 

ちなみにRのminetパッケージ(infotheoを利用している)だとbuild.mim関数で一気に求められます。

> build.mim( t(data), estimator="mi.empirical", disc="equalfreq")
                   G1             G2
G1 0.0000000 0.6742695
G2 0.6742695 0.0000000

 

 

相互情報量をもとにネットワーク分析をしてみる

ぶっちゃけRのminetライブラリにぶち込むだけですが、とりあえずやってみます。

次はデータを拡張して、下のものを使用します。G1~G10が遺伝子で、各サンプルS1~S6における発現量のデータです。サンプル6個で相互情報量を求めるのは厳しいかも…。

f:id:Kyoshiro1225:20180127153823p:plain

 

ピアソン相関係数の行列はこんな感じ。

f:id:Kyoshiro1225:20180127154215p:plain

相互情報量を、build.mim関数で求めたのが下。

> mim.eqwi <- build.mim( t(data) , estimator ="mi.empirical", disc="equalwidth")

f:id:Kyoshiro1225:20180127154341p:plain

 

このように類似度行列が得られたら、次は図示するための準備。WGCNAの場合と同様に閾値で区切って0/1データに変換するなどの処理を行います。とりあえずminetライブラリに実装されているARACNEを用います。

> net.eqwi <- aracne(mim.eqwi)

f:id:Kyoshiro1225:20180127161839p:plain

#赤字の場所がARACNEによってカットされた部分。indirectな関係を除外できるということですが…?

 

最後に、相互情報量相関係数の結果を比較。snaライブラリーで図示。

>  mim.cor <- build.mim( t(data) , estimator ="pearson")  # 相関係数使用, 離散化はされない

> net.cor <- aracne(mim.cor)

 

> library( sna ) 

> par (mfrow=c(2,1) )

> gplot(net.eqwi, usearrows=FALSE, displaylabels=TRUE)

> gplot(net.cor, usearrows=FALSE, displaylabels=TRUE)

f:id:Kyoshiro1225:20180127160810p:plain

#左が相互情報量ベースで右がPearson相関係数ベース

 

 

論文のメモ: omics technologyとAOP

AOP(Adverse Outcome Pathways)の構築に、網羅的な生物応答の解析技術(omics)を用いて何ができるかというお話し。omicsの中でも特にtranscriptomicsについて。

 

「化学物質リスク評価へAOPを適用するうえでomicsの果たす役割

Brockmeier EK, Hodges G, Hutchinson TH, Butler E, Hecker M, Tollefsen KE, Garcia-Reyero N, Kille P, Becker D, Chipman K, Colbourne J, Collette TW, Cossins A, Cronin M, Graystock P, Gutsell S, Knapen D, Katsiadaki I, Lange A, Marshall S, Owen SF, Perkins EJ, Plaistow S, Schroeder A, Taylor D, Viant M, Ankley G, Falciani F, 2017, The role of omics in the application of adverse outcome pathways for chemical risk assessment, Toxicol Sci 158: 252-262.

2014年リバプール大学でのワークショップをもとに書かれた総説。

現状ではomicsは生態リスクの評価をおこなうに十分な証拠を提供できていない("omics datasets cannot provide sufficient evidence to characterize risk within ERA")とか、omicsが既存の手法を完全い代替することはない(we ... do not fee that they will completely replace all approaches used in traditional risk assessments)とか、omicsの限界点に触れていて好感触。他に挙げられているomicsの課題は、標準法がないこととインフォマティクスの手法が確立してないこと。この辺りはいつもの議論。

omicsを使うことによって 、既知のパスウェイを確認するだけではなく、新規パスウェイを発見することもできる例としてAntczakら(2015)が引用されてます。

   

 

「トランスクリプトーム解析によるエマメクチン安息香酸塩の急性毒性メカニズム洞察

Song Y, Rundberget JT, Evenseth LM, Xie L, Gomes T, Høgåsen T, Iguchi T, Tollefsen KE, 2016, Whole-organism transcriptomic analysis provides mechanistic insight into the acute toxicity of emamectin benzoate in Daphnia magna, Environ Sci Technol 50(21):11994-12003.

AOP構築に至るまでにomics解析をどう活用できるかの事例として読みました。この論文で提唱されたメカニズムはAOP wikiにも仮登録されてます。

既往文献から導き出せるAOP仮説をマイクロアレイ解析で検証してみたという印象。あくまでomicsは確認作業っぽい。

エクジステロイド受容体(EcR)に関するin vitro試験の結果が、単純なomicsだけではAOP構築できないことを示している気がします。エマメクチン安息香酸(EMB)に曝露させるとDaphniaのEcR遺伝子は活性化されるが、in vitro試験ではそのような反応は見られない。これは、EcRシグナル経路がEMB曝露に対する応答の下流にあるから。

因果関係を踏まえてAOPを構築するためには、key event間の関係をこういう風に一つ一つ検証していかないとダメなんですね。当たり前のことでしょうが…。自分にはin vitro試験の必要性を感じさせる事例論文として面白かったです。レポーターアッセイなどin vitroでなくともノックアウト生物を簡単に作れれば良いのかもしれない。

 

 

「生理学を理解するツールとしての機能ゲノミクスの多層式データ統合

Davidsen PK, Turan N, Egginton S, Falciani F, 2015, Multilevel functional genomics data integration as a tool for understanding physiology: a network biology perspective, J Applied Physiol 120(3):297-309.

ネットワーク分析に関して上のBrockmeierら (2017) で引用されていた総説。FF氏が文章を書いたところはなんとなく分かってしまう。

前半の総説部分は、データからネットワークを推定しようという話。非線形のデータにも使える相互情報量に基づいたARACNEでの推定が良いよ、という話など。ネットワーク推定に生物replicatesは>50~100必要とのこと。

 

 

「ゼブラフィッシュ胚を用いた環境毒性評価のための縮小トランスクリプトーム

Wang P, Xia P, Yang J, Wang Z, Peng Y, Shi W, Zhang X, 2017, A reduced transcriptome approach to assess environmental toxicants using zebrafish embryo test, Environ Sci Technol 52: 821-830.

ちゃんと読んでないしAOPともそれほど関係ありませんが、ampliseqを生態毒性の研究に用いた例としてメモ。omicsは標準試験法がないとのことでしたが、マイクロアレイに代わってampliseqが標準法になるかも。遺伝子ごとに用量応答反応のモデル(直線・シグモイド・U字型)を当てはめ、どの濃度範囲で応答するかを調べて、そのEffect Concentrationと生物学的機能とを絡めて議論しているのが面白いです。このETCの論文が引用されてます。k-meansクラスター法で同様の議論をしている論文は多いですが、この論文のアプローチはなんとなく新鮮でした。

 

(追記 2018.03.23)

Leung KM, 2017, Joining the dots between omics and environmental management, Integr Environ Assess Manag 14: 169-173.

IEAMのBrief Communication。あんまり真新しい話はない。