備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

最近読んだ論文のメモ: ネオニコチノイドによる遅発毒性について

前回の記事ネオニコチノイドの曝露時間と影響との関係を書いていて、昔、ネオニコのような神経系の毒は遅発性だと読んだのを思い出しました(この記事とか)。

ネオニコの遅発毒性 delayed toxicity に関する文献を、さらに探ってみました。

 

イミダクロプリドは実環境に近い濃度で淡水ヨコエビの摂食を攪乱する

Agatz A., Ashauer R. and Brown C.D., 2014, Imidacloprid perturbs feeding of Gammarus pulex at environmentally relevant concentrations, Environ. Toxicol. Chem., 33(3), 648-653. 

実際の河川で検出されたレベルの濃度(96h-LC10以下)のイミダクロプリドを淡水産ヨコエビG. pulexに96 h曝露させた実験。曝露後は3日間きれいな系に移し、摂食率を測定。結果、高濃度(100 µg/L ≒ 96h-LC10)だとpost-exposureの3日間では摂食率は回復しなかったそうです。 一方で低濃度(< 30 µg/L)では、post-exposureの摂食率はコントロールと同レベルまで回復してます。

post-exposureの3日間で、(摂食率だけじゃなく)致死にも影響が出てないか、それが論文を読んだ目的でした。30 µg/Lは曝露直後の致死は0%だけれど、postexposureの計7日後には致死20% になったとのこと。これはTennekらが言う「ネオニコの不可逆性的 irreversible な結合」に起因するdelayed mortalityだろうと考察されてます。しかしなぜ100 µg/Lの7d致死を示さないのか? 見落としたのかな?

 

 

「7種の淡水節足動物に対するチアクロプリドの急性・遅発性毒性

Beketov M.A. and Liess M., 2008, Acute and delayed effects of the neonicotinoid insecticide thiacloprid on seven freshwater arthropods, Environ. Toxicol. Chem., 27(2), 461-470. 

チアクロプリドを7種の節足動物に24時間曝露させ、きれいな系に移し、11~30日後の生存率などを調べた研究。上の論文で使われたG. pulexも登場。Daphnia magnaは個体群増加率まで求めてます。

ちょっと曝露濃度の設定が高すぎる気もしますが、曝露1~5日後に生存率ががくっと下がる例として分かりやすい。

 

 

「ミツバチに対するイミダクロプリド毒性の特徴

Suchail S., Guez D. and Belzunces L.P., 2000, Characteristics of imidacloprid toxicity in two Apis mellifera subspecies, Environ. Toxicol. Chem., 19(7), 1901-1905. 

死亡率が対数軸。90%と100%の差が不自然に?強調されてます。delayed effectsはそれほど明確ではないです。

最近読んだ論文のメモ: ニコチンの生態毒性 その4 ~ネオニコの作用機序との比較~

 ニコチン毒性の作用機序は、農薬のネオニコ関連でたくさん研究されているようす。

 

 

Yamamoto I.,  Yabuta G., Tomizawa M., Saito T. Miyamoto T. and Kagabe T., 1995, Molecular mechanism for selective toxicity of nicotinoids and neonicotinoids, J. Pest. Sci, 20(1), 33-40.  
Tomizawa M. and Casida J.E., 2003, Selective toxicity of neonicotinoids attributable to specificity of insect and mammalian nicotinic receptors, Annual Review  Entomol., 48(1), 339-364.  

 まずざっと総説を読みました。読んでから気づいたけど、同じグループの論文でした。

ニコチノイドも、ネオニコチノイドもニコチン性アセチルコリン受容体(nAChR)のアゴニストで、神経系の毒性を引き起こす。どちらもイオン化した状態で中枢神経系のnAChRに結合する 。

※ただしイオン化したままでは神経系に浸透できないので、非イオンである遊離態として浸透してから、イオン化する。一方ネオニコはそもそも体内でイオン化していない。

 

 

「リスク評価におけるDruckrey–Küpfmüller式の重要性」

Tennekes H.A., 2011, The significance of the Druckrey–Küpfmüller equation for risk assessment—The toxicity of neonicotinoid insecticides to arthropods is reinforced by exposure time: Responding to a Letter to the Editor by Drs. C. Maus and R. Nauen of Bayer CropScience AG, Toxicology, 280(3), 173-175.   

ニコチンではなくネオニコチノイドの話ですが、パルス曝露との関連が語られていたので読んでみました。まずTennekes (2010) が論文を出します。それに対してMaus & Nauen (2011) が下記のコメントを出します。上のTennekes (2011) はそのMaus & Nauen (2011) に対する返答です。

Maus C. and Nauen R., 2011, Response to the publication: Tennekes, HA (2010): the significance of the Druckrey–Küpfmüller equation for risk assessment—the toxicity of neonicotinoid insecticides to arthropods is reinforced by exposure time. Toxicology, 280(3), 176-177.   

とりあえず関心のあるところだけ議論の流れを追ってみました。つまりネオニコの曝露時間と影響との関係をどうモデル化するか、についてです。ネオニコの実際の影響のようなより一般的な話題はほぼスルーしました。

 

Tennekes, 2010 『ネオニコの毒性はHaber則で考えるべし。低濃度でも長期間なら影響大きいよ。』

Maus & Nauen, 2011『いやHaber則と、その定式化であるDruckrey–Küpfmüller式は受容体への不可逆的な結合にしか適用できないよ。ネオニコは可逆的だからダメ。実際、不連続的な曝露状況だと、ネオニコ曝露から回復した例もあるし(Nauen, 1995, Pest Sci)。』

Tennekes, 2011『ネオニコはアセチルコリンエステラーゼで分解されないから、結合部位に長く残存するよ。なので実質的には不可逆みたいなもの。』

 

Tennekes, 2011は相手のコメント一つ一つに応えていない気がしますが、そして数理モデルの話に寄り過ぎている気がしますが、書いている内容は勉強になりました。

  

 

(追記)

冨澤元博, 大塚博子, 宮本徹, ELDEFRAWI, M. E., & 山本出. (1995). Pharmacological Characteristics of Insect Nicotinic Acetyicholine Receptor with Its Ion Channel and the Comparison of the Effect of Nicotinoids and Neonicotinoids. Journal of Pesticide Science, 20(1), 57-64.

ニコチンの無脊椎動物に対する作用機序の分析例として。

最近読んだ論文のメモ: パルス曝露の影響

定常的な曝露ではなくて、短期間の曝露の影響についてどんな研究がなされているのかちょっとだけ調べてみました。農薬の研究が結構多いみたいです。

 

「短期間の殺虫剤曝露がヨコエビの生存と繁殖能に与える影響

Cold A. and Forbes, V.E., 2004, Consequences of a short pulse of pesticide exposure for survival and reproduction of Gammarus pulex, Aquat. Toxicol., 67(3), 287-299. 

淡水産のヨコエビG. pulexピレスロイド系殺虫剤のエスフェンバレートに曝露させてます。1時間の曝露をおこなってから清浄な容器に移し、2週間の生存率や産仔数・子供の生存率などを見ています。色々な実験を行っているしそれぞれは面白いんですが、なんかとっ散らかっている印象。できれば曝露時間、曝露濃度とエンドポイントの関係を体系的にまとめて欲しかったかも。

 

 

「パルス的曝露における曝露時間とrecovery time

Zhao Y. and Newman M.C., 2006, Effects of exposure duration and recovery time during pulsed exposures, Environ. Toxicol. Chem., 25(5), 1298-1304. 

こちらの論文は、曝露が1回ではなくて、複数生じる場合を想定。曝露の間のcleanな系にいる期間をrecovery timeと呼んで、どれくらいのrecovery timeがあれば元の曝露がなかった状態に戻れるかを調べています。Discussion部分のデータ分析の詳細が把握できてないのですが、まだ体系的にまとまっている段階ではないかな?

上のCold and Forbes (2004) と違ってこちらの曝露期間は12h以上と長め。実環境中でもこれくらいの時間幅で濃度変動するんでしょうか?

 

「パルス曝露したマラチオン毒性のメカニズム解明

Trac L.N., Andersen O. and Palmqvist A., 2016, Deciphering mechanisms of malathion toxicity under pulse exposure of the freshwater cladoceran Daphnia magna, Environ. Toxicol. Chem., 35 (2), 394-404. 

これは体系的にまとめようとしていて分かりやすい! 統計処理の記述も丁寧で好感が持てます。しかし結果はそれほどきれいではないかも。

塩素消毒のCT値みたいに「曝露濃度×曝露露間=equivalent integrated does」という指標を使い、短期間の曝露による影響を評価してます。1 µg/L×48h, 2 µg/L×24h, 16 µg/L×3hの曝露後にきれいな系に移して3~48h後の生存・遊泳阻害・酵素活性などを調査。

生存率は、「低濃度×長期間」が「高濃度×短期間」よりも影響が大きいけど、統計的に有意ではない。遊泳阻害は「高濃度×短期間」の影響が強い。こちらは明確な差がある。わずか3hの曝露でも高濃度であれば影響が48h後まで残るから、こういう実環境に近い曝露方式も考えるべき、という主張でした。(16 µg/Lが本当にenvironmentally realistic concentrationなのかはたぶん書かれてなかったと思います。

 Conclusionに書かれてますが、Daphnia magnaでさえGSTとかCYPに関する十分な塩基配列情報がないというのは意外。

 

(2016.02.20 追記)

まだちゃんと読めてませんが、総説がありました。濃度が一定でない曝露による影響をどう定式化するかに焦点を絞っているみたいです。面白そう。

Ashauer R., Boxall A. and Brown C., 2006, Predicting effects on aquatic organisms from fluctuating or pulsed exposure to pesticides, Environ. Toxicol. Chem., 25(7), 1899-1912. 

 上のTrac et al. (2016) のように「曝露濃度×曝露露間」が同じならば影響が一定になるというのはHaber's lawと言うそうな。

(2016.02.26 追記)

このAshauerって人のグループは2000年後半くらいからパルス曝露影響の数理モデル化に関する論文を出しまくってます。有害物質が生物体内に取り込まれて排出・代謝されるまでについての「Toxicokinetics」と体内における有害物質が生物に及ぼす影響の大きさに関する「Toxicodynamics」を組み合わせているということですが、ちょっと詳細まで追うのがしんどいです。いつかじっくり読もう。

最近読んだ論文のメモ: タバコの吸い殻やニコチンによる生態毒性 その3 ~ニコチンのfate~

これまで、タバコの吸い殻による生態毒性に関していくつか文献を読んできました。タバコ浸出液にTIEを適用してニコチンが主な毒性要因らしいとした論文や、タバコ吸い殻からのニコチン浸出量を測定した論文など。

最近読んだ論文のメモ: タバコの吸い殻やニコチンによる生態毒性 

最近読んだ論文のメモ: タバコ吸い殻による生態毒性 その2 

 

 

さらにもう少し文献を探してみました。まず、ニコチンの環境中での動態fateについて。

「ニコチンの動態と環境影響

Seckar J.A., Stavanja M.S., Harp P.R., Yi Y. and Garner, C. D., 2008, Environmental fate and effects of nicotine released during cigarette production, Environ. Toxicol. Chem., 27(7), 1505-1514. 

ニコチンの分解性、生態毒性、分配係数などを測定し、環境中での挙動と影響を評価した論文。細かい部分では突っ込みどころが多いけど(光分解実験とか)、全体像を見るのが目的の研究だからと言われれば、まあアリかも。

 生態毒性は、藻類の生長とレタスの種子発芽・根の生長で評価してます。Daphniaに対するnicotineの毒性値は数mg/L未満でしたが、藻類の96h生長阻害EC50は72 mg/Lという結果。レタスのEC50は90 mg/L以上。(ニコチンの急性影響は神経系への毒性だろうから、動物に対して鋭敏なのでしょうか?)

得られた分配係数をCanadian Environmental Modeling Center level III model という環境動態モデルに入れて計算すると、定常状態ではニコチンの93%は水中に存在するという結果に。そして大気環境中へのnicotine排出量を1.59 kg/hとして*1、定常状態での大気・水・土壌・底質中での濃度を算出してます。水中でのニコチン濃度は5.75 ng/Lで、毒性試験結果と比較すると生態影響のあるレベルじゃないですよーという結論。

環境への排出量としてこれまでの文献で見てきたノンポイント負荷が入っていないのは少し気になりますが、大きな傾向は変わらないかも。(藻類じゃなくてミジンコを対象にしたとしても。)ただノンポイント負荷を考える場合、パルス的な曝露の影響は大きく変わる? 

中々妄想させられた論文でした。

 

バルセロナでの処理水・地下水中の汚染物質

Teijon G., Candela L., Tamoh K., Molina-Díaz A. and Fernández-Alba A.R., 2010, Occurrence of emerging contaminants, priority substances (2008/105/CE) and heavy metals in treated wastewater and groundwater at Depurbaix facility (Barcelona, Spain), Sci. Total Environ., 408(17), 3584-3595. 

地下水と再生水を飲料水に使えないか、ということで地下水と処理水、未処理水中の170個の化学物質濃度を測定した論文。nicotineに関する部分のみ拾い読み。

流入水サンプル(n=18)の全てでニコチンが検出されていて、101~3249 ng/Lの範囲。平均値は895 ng/L。放流水では75%のサンプルで検出されていて、濃度範囲は107~269 ng/L(平均184 ng/L)。流入水でも生態影響の生じるレベルではなさそうです。

知りたかったのは流入水サンプルの由来というか、ノンポイントソース(路面排水)が含まれているかでしたが、それに関する記述は見つけられませんでした。 

 

「地表水中の薬品の存在と浄水処理での除去

Huerta-Fontela M., Galceran M.T. and Ventura F., 2008, Stimulatory drugs of abuse in surface waters and their removal in a conventional drinking water treatment plant. Environ. Sci. Technol., 42(18), 6809-6816. 

上と同様に、飲料原水と処理水中の化学物質濃度を測定した研究。またスペイン。またnicotine部分のみ読んでみました。

河川水中のニコチン濃度は700~900 ng/Lで、日変動も季節変動もあまりない様子(例外的に秋に200 ng/Lになっているくらい)。塩素添加した後の処理水中のニコチンは、検出下限30 ng/L以下だったそうです。

 

「マーカー物質として下水中のカフェインとニコチンの代謝物を測定する

Senta I., Gracia-Lor E., Borsotti A., Zuccato E. and Castiglioni S., 2015, Wastewater analysis to monitor use of caffeine and nicotine and evaluation of their metabolites as biomarkers for population size assessment, Water Res., 74, 23-33. 

イタリアの下水処理流入水のニコチン、およびその代謝物のコチニン、trans-3'-hydroxycotinineをLC-MS/MSで測定した論文です。

流入水中のニコチン濃度は1.36~6.87 µg/Lの範囲。上のTeijonら (2010) と同レベルですね。

知りたかったノンポイントソースとの関連が、この論文でようやく見つかりました。ニコチン濃度は降雨とともに上昇するという結果(Fig. 4)。路面上のタバコ吸い殻による影響だろうと述べられてます。その寄与の定量的な評価はされてませんが。なお、代謝物のコチニンとtrans-3'-hydroxycotinine濃度は明確な降雨の影響を受けてません。

さらにニコチンのstabilityを評価する実験もおこなっていて、それによるとニコチンは4℃でも20℃でも少なくとも24時間は分解されないとのこと。

 

(追記:2016.02.26)

「晴天時および降雨時の都市沿岸域における医薬品の分布

Benotti M.J. and Brownawell B.J., 2007, Distributions of pharmaceuticals in an urban estuary during both dry-and wet-weather conditions, Environ. Sci. Technol., 41(16), 5795-5802.

受水域でのニコチン濃度が降雨によって増加するもう一つの例。下水処理による除去率(87%)も示されています。

(追記終わり)

 

 

ここからは、タバコの吸い殻の生態影響に関して。

Healton C.G., Cummings K.M., O'Connor R.J. and Novotny T.E., 2011, Butt really? The environmental impact of cigarettes, Tobacco Control, 20(Suppl 1), i1-i1.

Tabacco controlという雑誌の、吸い殻のポイ捨てに関する特集号の巻頭言。吸い殻浸出液の魚類に対する致死毒性を調べたSlaughter et al. (2011) も同じ号でした。

気になったのが"butts are also reported to comprise an estimated 25-50 percent of all collected litter items from roads and streets"という記述。出典は書いていないという。。。でも調べてみるとMoriwaki et al. (2009) は、路面堆積ごみの内のタバコ吸い殻の重量割合は22%と報告しててあながち間違いでもなさそう(ごみの数ベースだと71%)。※このMoriwaki et al. (2009) の重量割合は篩で分けた画分を対象にしているわけではないので(空き缶とかも含む)、水環境への影響の大きさを表した値ではない。

 

「タバコのポイ捨ては醜悪なだけでなく有害か?

Register K., 2000, Cigarette Butts as Litter- Toxic as Well as Ugly?, Underwater Natural., 25(2), 23-29. 

Daphnia magnaをタバコ吸い殻浸出液に曝露させた実験。一応メモ。

*1:この値の出典が見つけられませんでした…。

最近読んだ論文のメモ: 個体群増加率の信頼区間の求め方

例えば50匹の試験生物のフルライフサイクル試験をおこなったとき。試験データをもとに推移行列を作成して、個体群増加率を求めます。その時、データのばらつきはどう表現すべきなのでしょう? ばらつきがないと条件間の差は評価しづらい? ブートストラップなどのリサンプリング手法を使う? でも何を使うべき?

そのあたりの疑問に対して、下の論文を読んでみました。

 

「個体群増加率の信頼限界

Alvarez-Buylla E.R. and Slatkin M., 1991, Finding confidence limits on population growth rates, Trends Ecol Evol., 6(7), 221-224. 

下のCaswellの教科書の第1版(1986)も引用されている総説。

 大きく3つの手法が紹介されてます。 「Aij = aij + eij」として(aが真の値でeが誤差項)、テーラー展開近似をおこなう手法。生活史変量の分布が既知のときに、モンテカルロシミュレーションをおこなってλの分布を計算する手法。そして、ジャックナイフ法かブートストラップ法でリサンプリングする手法。

サンプル数が少ない時は、近似をおこなうとλのばらつきを過小評価してしまうことが多いので、MCシミュレーションかリサンプリングをすべし、とのことです。(というか自分はコンピュータ頼りの手法に毒されちゃっている?のか、解析的な方法を思いつきもしませんでした。)

 

Caswell H., 1986, Matrix population models, 1st Ed., John Wiley & Sons, Ltd. ISO 690.   

第7章がまさにドンピシャの内容でした。この教科書、昔に結構読んだつもりになってましたが、全然読めてなかったです。(自分が図書館で借りたのは第1版ですが、目次を見る限り2001に出た第2版は何倍も記述が厚くなってそう。別の図書館で第2版 l.]をちょっと見てみた方が良いかも。)

上の総説と重複する部分が多いですが、具体例が豊富。

決定係数R2について

今さら何をと言われるかもですが、決定係数の話。

最小二乗法での線形回帰をおこない、決められた目的変数に対してどの説明変数が最も当てはまりが良いかを選ぶという解析をしてます。

 

その当てはまりの良さの指標としてとりあえず、相関係数・決定係数・AICをRに計算させていたのですが、決定係数の値を見てちょっと違和感が…。決定係数の定義から調べてみました。

 

下の井口先生のページが大変参考になりました。

決定係数R2は回帰のバラツキ指標ではない - Yahoo!知恵袋

色々な論点がありますが、特に関心があったことだけメモ。

 

  • (回帰直線に良く適合しているように見えた場合でも)回帰の傾きが小さいと、決定係数も小さくなることがある。

 これは回帰残差が小さくても、全変動(下式の分母)も小さいと結果としてR2が小さくなるからみたいです。

f:id:Kyoshiro1225:20160113150214j:plain

(AICを異なるデータの評価に用いているのはおかしいというコメントを頂きました。ご指摘ありがとうございました! 以下は削除。)

元記事ではAICでの評価をしてなかったので、とりあえず追加してみました。元記事のデータでRを動かしてみると、

> extractAIC (res1)
[1] 2.00000 10.12601
> extractAIC (res2)
[1] 2.000000 6.579876

となります。確かにB(res2)の方が適合度が高いです。これはAICが単純に下の式のように残差とパラメータ数から算出されるからだと思います。

f:id:Kyoshiro1225:20160113151600j:plain

 

  • 定数項をモデルに入れるか入れないかは、そもそものモデルの原理や、回帰結果の標準偏差を考慮しておこなう。このあたりの話はみどり本での議論に似ていると思いました。

 

博士論文提出までのスケジュール

自分は秋入学なので、順当に進めば夏学期に博士論文 提出です。先輩方の例では、最終審査は7月頃。そこからさかのぼって、博士論文提出までのスケジュールを書いておきます。

  • 3月末:博士論文の初期原稿を指導教員の先生に提出
  • 4月中旬:副査の先生方に予備審査用の原稿提出
  • 5月初旬:予備審査 ⇒ 論文修正
  • 6月初旬:博士論文 提出
  • 7月:最終審査

こう書いてみると、本当に時間ないですね…。

正月は家族みんなでゾンビ観た

正月実家に帰省したら、Amazon プライムに加入してて、(リストにある)映画や海外ドラマが見放題でした。なぜか、ゾンビ出まくりのアメリカドラマ「ウォーキングデッド」を観ることに。家族皆で1/1と1/2はぶっ続けで観て、1シーズン分+4話くらい堪能しました。

 

正月から家族で観るものでは全くないのですが、時間が過ぎるのを忘れて楽しみました。ハマった。ただのゾンビ映画じゃなくて、これはヒューマンドラマですね。ゾンビのせいで、世界は数人~数十人単位でのコミュニティが散在する状況。そのコミュニティ内での人間模様みたいなのが見所になってます。コミュニティ間での抗争なんかもあって、飽きさせないです。

 

シーズン4ではコミュニティ内で感染症が流行します。主人公たちは、感染症にかかった人達を密閉された場所に隔離します。しかし、もっと開放的なところに隔離した方が良い。空気の交換ができないとウイルスがとどまり続け、治るはずのものも治らなくなる。主人公たちの行為は「非感染者の予防のため」にはなるが「治療のため」にはならない。というのは父の談。なるほど。

 

 

去年の振り返りと 2016年にやりたいこと

あけましておめでとうございます。

2015年は充実してました。何より、研究が楽しかったです。

 

 

2016年の目標・希望は大体下のような感じ。

  • まず修了。「こんなレベルの研究で博士号取れるのか(+もっと続けたい)」という想いは常にあるけど、やっぱりキリがないので、通常の期限である3年間で終えられるようにしたいです。
  • 論文を2本は出したい。自分の本筋の研究と、上に書いた個体群の話(これは自分のデータじゃなくて、T君のもの)。
  • 無事修了出来たら、博士のテーマの延長的な研究をやりつつ、ちょっと違うこともやりたいです。遺伝生態学と遺伝子発現、個体群動態あたりを考慮した研究の土台作りみたいなのをやりたいけど、状況次第でしょうか。
  • 勉強したいのは、①遺伝生態学(なんとなく目をつけてる本は『生物多様性と生態学』『保全遺伝学入門』)、②次世代シーケンサー解析(特にde novo シーケンス)、③統計学機械学習とか?)。
  • 就職先/留学先を探さないと。
  • 引っ越し などなど。

 

最近読んだ論文のメモ: SVMによる遺伝子の分類 -影響の大きさ予測-

「影響レベルを分類するエンドポイントとしての転写産物の解析」

de Boer T.E., Janssens T.K., Legler J., van Straalen N.M. and Roelofs D., 2015, Combined transcriptomics analysis for classification of adverse effects as a potential endpoint in effect based screening, Environ. Sci. Technol., 49(24), 14274-14281. 

Effect levelを遺伝子発現で分類・識別できるか。

EC10レベルとEC10レベルの重金属などに曝露したトビムシの遺伝子発現データを使って、未知サンプルのeffect level を予測できる分類モデルを作成した研究。モデルはSVM (Support Vecotor Machine) で作成してます。

 SVMの詳細は正直良く理解できてませんが、なんでもSVMで予測モデルを構築する前に用いる変数(=遺伝子)を選択しないといけないようです。分類に関係しない変数が混ざっていると予測精度が落ちるのだとか。

その変数選択が予測の結果に効いてくる、というのが論文のポイント。変数選択法はRFE (Recursive Feature Elimination) とLimma パッケージとの2つを比較してます。どちらも詳細は把握してません…。 とりあえず結果だけ書くと、線形モデルのLimmaの方が予測が正確で、GO (Gene ontology) で見てもまとまりのある遺伝子群を選択していたようです。衝撃なのは、RFEとLimmaで選択された遺伝子がほぼ重なっていないこと (Fig. 1)。おまけに既往文献で選択された遺伝子とも重なっていません。

 

この論文は遺伝子発現を調べる目的を「(将来)影響の予測」としていますが、自分の関心はむしろ「原因の推定」です(例えばGarcia-Reyero et al., 2012のような)。しかしこの著者らのグループも、始めは「原因の推定」のために遺伝子発現を使用していたっぽい記述が…。Results & Discussionの終盤。

Nota et al. *1 used an unshrunken centroid multiclass classifier (略) to select a set of 188 genes that was able to differentiate between six metals. (略) Although a multiclass aproach is better able to pinpoint the actual exposure type*2, it would be less suitable to predict unknown chemicals that were not present in the training set and therefore it will have less predictive power for future applications. 

この問題は常について回っている本質的なものですが、未だにしっくり来る回答を自分は得られてません。AOPという概念が回答になるんでしょうか。そのあたり、もうちょっと勉強しないと。

 

ていうか、そもそも機械学習もしっかり勉強しないといけないし。SVMやらランダムフォレストやら。いやはや。

*1:この論文の著者グループと同じ。2010年の論文

*2:毒性要因・曝露物質という意味で使われています。