備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

論文のメモ:ヨーロッパの新しい水質モニタリング (EDAや網羅的な化学分析)

年始に参加させてもらった、混合物・複合影響評価に関する勉強会。その内容に近い論文を読んでみました。

 

ヨーロッパでの水質モニタリングの話。

河川には人為起源の多数の化学物質が含まれるので、決められた少数の物質だけモニタリングの対象にしていては不十分なのではないか。もっと生態系への影響を反映したモニタリングの方法を考えよう、的な論文たちを読んだので簡単なまとめです。

 

 

 

「将来の水質モニタリング ~混合物に適したツール~

Altenburger R, Ait-Aissa S, Antczak P, Backhaus T, Barceló D, Seiler T, Brion F, Busch W, Chipman K, de Alda M, de Aragão Umbuzeiro G, Escher B, Falciani F, Faust M, Focks A, Hilscherova K, Hollender J, Hollert H, Jäger F, Jahnke A, Kortenkamp A, Krauss M, Lemkine G, Munthe J, Neumann S, Schymanski E, Scrimshaw M, Segner H, Slobodnik J, Smedes F, Kughathas S, Teodorovic I, Tindall A, Tollefsen K, Walz K, Williams T, Van den Brink P, van Gils J, Vrana B, Zhang X, Brack W, 2016, Future water quality monitoring — Adapting tools to deal with mixtures of pollutants in water resource management, Sci Total Environ, 512-513, 540-551. 

ヨーロッパでは、水域生態系の保全のためにWater Framwork Directive (WFD) なる指令?を2000年に施行したそうな。WFDの目標達成を目指して、EU各国は2003年から法律を策定して頑張ってきたみたいです。(ここまでは年始の勉強会で聞いた話。ここ以降は↑の論文の話+解釈込み。)が、WFDで定められた"good ecological status"は未だ達成されてない場所が多い。というか、その原因が化学物質汚染なのかどうかも良く分からん、という状況らしいです。

問題を難しくしている一つは、河川中に多数の化学物質が共存していることです。冒頭に書いた通り、少数の物質のみ測定の対象としていても影響を過小評価してしまうし、また、複数物質が共存するときには単一で存在するときと異なる影響を生物に及ぼす(Combined effects)こともあります。そんな複雑な環境における化学物質モニタリングのあるべき姿?を提案しているのが本論文です。

大きく3つのアプローチ、(i) 化学分析、(ii) Effect-ased tools、(iii) Effect-directed analysis (EDA) を使おう、と書いてます。

まず化学分析。検出される物質のパターンをクラスター分析などで解析し、「この物質とこの物質はよく一緒に検出されるね」みたいな傾向をつかむのが大事だと言っています。

次にEffect-base tools。化学分析だけだと本当に影響が出るかわからないので生物応答を指標にして、影響をしらべようねという話です。Whole effluent Toxicity (WET) 的な考えですね。指標とする生物応答は、重大な悪影響につながるものでないとダメなので、そこはAdverse Outcome Pathways (AOP) の考えを援用するそうです。ただ通常のAOPと違い、混合物を対象にしているので"individual initiating events"よりむしろ"common adverse outcome"を指標にするみたい。…これ、どういうこと? AOPの個々の"molecular initiating events"に捉われないということかと理解したけど、具体的に何を見るのか…?表3とAOPの関係は?

最後にEDAを使って"driver chemicals"を同定する。多数の化学物質が共存すると言っても、実際には少数の物質が悪影響の引き金となっています。その少数の物質をdriversと呼び、それらを同定するのがEDAです。EDAは、環境水の分画と各画分に対するレポーターアッセイなどを繰り返して、どの画分(とどの物質)が悪影響の原因かを探る手法です。

勉強会の良い復習になりました。けど総説なので、やっぱりふわふわした読後感。

 

 

「ヨーロッパの河川中の微量汚染物質:effect-based toolsのためのMoA調査

Busch W, Schmidt S, Kühne R, Schulze T, Krauss M, Altenburger R, 2016, Micropollutants in European rivers: A mode of action survey to support the development of effect-based tools for water monitoring, Environ Toxicol Chem, 35, 1887-1899. 

ETCのFocus論文。面白かった。

基本的には、河川水中の化学物質を網羅的に分析した6つの論文を再解析した研究です。6つの論文で実際に検出された426物質を対象に、Hazard Quotient (HQ = 測定濃度/毒性値) を算出し、また文献情報をもとに各物質の作用機序(Mode of Action; MoA)をざっくり31種に分類してます。

たぶんこの論文のメイン部分で、かつ面白いのが、MoAごとにHQの合計値を求めている点。HQ合計値が大きいMoAは悪影響につながりやすいと見做して、そのMoAを検出できるbioassaysをモニタリングのツール(effect-based tools)に使おう、という議論をしています。EDA的な考え方ですね。ただ、割り当てられているMoAがobserved adersed effects(致死など毒性値を求めるベースとなったエンドポイント)の原因であるとは限らないんですよね…。そのちぐはぐ感は拭えません。

他にも手法上の課題はかなりあるみたいです。MoAをざっくり分けている点や、毒性値の実験データがない場合はQSARで予測していてそれが実際の値と離れている点など。

単純に読んだあと気になったのは、河川水に生物を曝露させたとき、そのMoAは何に分類されるのかなぁということ。各物質HQの合計値が高いMoAと一致しているのかどうか。

 

 

「水質モニタリングに用いる生物試験の組み合わせ:微量汚染物質による毒性への寄与

Neale P, Altenburger R, Aït-Aïssa S, Brion F, Busch W, de Aragão Umbuzeiro G, Denison M, Du Pasquier D, Hilscherová K, Hollert H, Morales D, Novák J, Schlichting R, Seiler T, Serra H, Shao Y, Tindall A, Tollefsen K, Williams T, Escher B, 2017, Development of a bioanalytical test battery for water quality monitoring: Fingerprinting identified micropollutants and their contribution to effects in surface water, Water Res, 123, 734-750. 

34個の化学物質に対して、in vivo・invitro含む20種類のバイオアッセイをおこなった研究(化学物質は、↑のBuschら(2016) のHQをもとに選定)。データが膨大過ぎて、詳細は正直追えてません。Water Res 誌でも最近はこういう論文多いです。NatureとかScience並みのSupporting Info。査読者も大変ですね…。

結論は「bioassayの種類によって検出できる毒性の得手不得手があるから、色々な試験を組み合わせよう(意訳)」で、無難な感じ。

個人的には、次のような結果を示してくれているのが嬉しい。

・Daphnia magnaの遊泳阻害試験やfish embryo toxicity test (FET) などのwhole-organism試験は、大部分の化学物質の影響を検出できる。ただし、その濃度レベルはin vitroの試験に比べると高め。

また、この論文で得られたデータを、既往の河川の化学分析結果に適用してmixture toxicity modelingもしてます。

 

 

 

 

なんとなく、彼らがやろうとしていることが理解できました。

水質モニタリングでの化学分析をもっと網羅的におこなう、モニタリングに導入するbioassayの種類はメカニズムベースで考える(なるべくin vitroでやりたい)、測定した物質で毒性影響が説明できるかどうかはmixture toxicity modelingで確かめる、EDAで毒性のdriversを探索する。そんなところでしょうか。

ただEDAはルーティーンでやるのかな?かなり面倒な気が…。

海外ポスドク目指して就活中 ~メール・Skype編~

去年学位をとったポスドクです。

今の契約は今年度末までなので、そろそろ次のポジションを確定させておきたいところです。

 

何も考えず自由に海外へ行けるのは今ぐらいしかなさそうだし、一度は行ってみたいので、海外就活を目指すことにしました(適当)。

本当は海外学振に出せればよかったのですが、応募時点では色々あって海外という選択肢の可能性が低かったため、出さず…。5月くらいにようやく 「海外行くか」と意識が固まりました。

探してみると、海外学振以外にも応募できるfellowshipが複数。Marie-Curie Fellowshipとか。まずは受け入れてくれるボスにメールで打診することから始めました。メール作成には、次の2つのサイトを参考にしました(良い印象をもたれるポスドク応募メールを書く4つのポイント - アメリカポスドクの歩き方Going abroad)。

下が送ったメール。 

Dear Prof. XXXX,

 

My name is XXXX, a post-doctoral researcher at XXXXX, Japan. I would like to know is there an available post-doctoral position in your laboratory?

 

I received a Ph. D. degree last XXXX, and currently continue to work under the supervision of Dr. XXXX, as a postdoctoral fellow. During the Ph. D. period, I have gained professional experiences of XXXX, XXXX, and XXXX. After receiving Ph. D, I started to XXXX (and now submitted a paper on XXXX).

Prof. XXXX, I have read many papers by you and your co-workers, and am impressed with your academic works. I especially admire your works on XXXX (e.g., XXXX et al., 2011, YYYY; XXXX et al., 2015, YYYY). I believe your works will really XXXX. Thus, I hope to study XXXX in your laboratory as a post-doctoral fellow.

 

I understand that there may be no available funding for a new post-doctoral researcher. I will apply for Marie-Curie post-doctoral research fellowship (and other possible fellowships). I already confirmed on the website that your institute is eligible to host a Marie-Curie fellow. https://www.xxxx

 

I have attached my CV. I look forward to hearing from you. Thank you for your consideration.

 

Sincerely,

XXXX

 

英語が適切かどうかは分かりませんが、とりあえず返信をもらえたのでダメすぎることはないと思います…。

 

ありがたいことに、2日後には返信がもらえました!

で、早速Skypeで話をすることに。ただ1回目は、教授が電車での移動中にSkypeをしようとして電波が悪くて中止。2回目は、教授のOfficeからSkypeしてもらい、上手く話ができました。

すごく緊張したけど、良い人そうで話してるうちにリラックスできました。英語も心配だったけど、教授がゆっくり話してくれた上、依然としてSkypeのつながりが良くなかったのでそれを理由に何度も聞き返せたので、なんとかなりました。一安心。

 

話した内容は、割とネットで予習した通りでした。

・まず自己紹介(博士課程とポスドクでの研究内容)

ポスドクで何をしたいか(自分の場合、対象とする生物種に拘りがあるかとか)

・教授のところでやっている研究について

・必要なスキル(プログラミングが出来るかとか)

・スケジュールについて(Fellowship締め切り、Proposal書いたらメールする)

 

自己紹介のところでは興奮して、ちょっと喋りすぎでした…。「あなたのグループのあの論文読んで…」みたいに言ったら「ちょっと待って、いっぱい論文出してるからどれのことか分からんけど…ちょっと落ち着いて」という感じ。

 

 20~30分くらいであっという間でした。緊張したけど、実際に話せたことでやる気出てきました。

 

(追記)

続きのはなし→海外ポスドク目指しての就活 ~公募アプライ・Skype面接編~

「化学の歴史」感想

全部読み通しました。が、ちょっと退屈だったかも。

研究の歴史を勉強するのは好きです。高校の時、村上陽一郎の「新しい科学論」というブルーバックスの本を読んでから。
科学史を知ると、今現在の科学が磐石ではないこと、これからダイナミックに変化していくだろうことを感じられてなんだか楽しい。


燃焼を説明するために、フロギストンという概念を産みだした結果、錆びの時にはフロギストンの質量が負、燃焼の時の質量は正になってしまったことを、中学生で勉強した時はバカみたいだなとぼんやり感じてました。しかし、ラボアジエが登場するまではそもそも正確な定量が重視されていなかったのだと筆者は書いていて(p. 67)、なるほどと思わされました。

動きが起きていて面白く感じたのは、ラボアジエ(1743~94)とトムソン(1856~1940)、ラザフォード(1871~1937)が居た時代あたり。
特に後者の原子の構造が理解されていく流れは、謎解き感があって良いです。多方面の実験結果や理論をもとに紆余曲折を経て、原子構造の理論が形成されていったのが分かります。


化学の歴史 (ちくま学芸文庫)

化学の歴史 (ちくま学芸文庫)


化学史じゃないけど、最近一部で話題になっていた
いま敢えて問います。天動説と地動説、どちらが正しいと思いますか?(松浦 壮) | 現代ビジネス | 講談社(1/3)も面白かったです。

論文のメモ: トキシコゲノミクスのデータベースを生態毒性学に活用した例

トキシコゲノミクス(toxicogenomics)は、トキシコロジー(toxicology, 毒性学)とゲノミクス(genomics, ゲノム学)をあわせた言葉で、遺伝子の変異や発現変動を網羅的に見ることで生体内で生じる毒性影響のメカニズムを理解しようという学問です。

Comparative Toxicogenomics Database (CTD) なるデータベースが、化学物質と関連する遺伝子およびパスウェイ・疾患のリストをまとめています。CTDはヒトやマウスだけでなく、色んな生物種を網羅しているので、生態毒性学にも活用できそうです。

 

 

「Comparative Toxicogenomics Database

Davis A.P., Grondin C.J., Johnson R.J., Sciaky D., King B.L., McMorran R., Wiegers J., Wiegers T.C., and Mattingly C.J., 2017, The comparative toxicogenomics database: update 2017. Nucleic Acids Res., 45 (D1), D972-D978.

2017年のupdate版。

データはここで公開されています。ほぼ毎月updateされている模様。「Download」からcsvファイル等をダウンロードすれば、大規模データの解析もできます。

 

 

「環境中で採取した非モデル生物をシステムレベルで理解したい

Williams T.D., Turan N., Diab A.M., Wu H., Mackenzie C., Bartie K.L., Hrydziuszko O., Lyons B.P., Stentiford G.D., Herbert J.M., Abraham J.K., Katsiadaki I., Leaver M.J., Taggart J.B., George S.G., Viant M.R., Chipman K.J., and Falciani F., 2011, Towards a system level understanding of non-model organisms sampled from the environment: a network biology approach. PLoS Comput Biol, 7 (8), e1002126.

 7地点から採ってきたヒラメのメタボロームとトランスクリプトーム(+αでバイオマーカーなど)を調べて、各地点の有害物質汚染との関連を考察した論文。

大昔に読んだときは理解できなかった部分がとても面白かったです。各地点で発現した遺伝子が一般にどのような化学物質によって引き起こされるかを、CTDで検索してます(表2)。MeV (Multiple experiment Viewer) を使って解析している様子。でも表2の導き方がいまいち分からない。Enrichment解析をしているが…。

このCTDによる検索の結果は必ずしも正しくない、ということもDiscussionで少し述べられてます。例えばCTDで「煙草の煙」が示唆されても、単純にAhR inducerかもしれない、とのこと。

 

「生物影響と汚染物質の関連付けをおこなう事前知識ベースの手法

Schroeder A.L., Martinović-Weigelt D., Ankley G.T., Lee K.E., Garcia-Reyero N., Perkins E.J., Schoenfuss H.L., and Villeneuve D.L., 2017, Prior knowledge-based approach for associating contaminants with biological effects: A case study in the St. Croix River basin, MN, WI, USA, Environ. Pollut., 221, 427-436. 

USEPA・USGSあたりのお仕事。既にここまでやられているとは…、ちょっと落胆。

下水処理施設の上流・下流の河川水を採取して、大規模な化学分析とファットヘッドミノーの遺伝子発現解析を実施しています。研究の構成はFig. 1に示されています。

自分の理解不十分なのか、ネットワークモデルを構築する意義が良く分からない。結局、1つの化学物質に対してCTD曰く関連のある遺伝子XXX個のうち、実際に発現変動した遺伝子がYYY個あって、その変動が有意かどうか、フィッシャーの正確率検定のようなもので判断しているだけでは?面白かったけれど、理解不十分。また読む必要あり。データ解析法の元ネタ論文(Catlett et al., 2013, BMC Bioinforma)を読んだ方が良いかな?

この研究のようなデータベースをもとにおこなう解析は、(まあ当然ではあるけど)研究の盛んな物質を重視する傾向があることもdiscussionで指摘されてます。

 

 

Szklarczyk D., Santos A., von Mering C., Jensen L.J., Bork P., and Kuhn M., 2015, STITCH 5: augmenting protein–chemical interaction networks with tissue and affinity data, Nucleic Acids Res., 44 (D1), D380-D384.

CTDと似たようなデータベース。STITCHはCTDからもデータを収集しているようです。とりあえずメモとして。

 

右下腹部の違和感の原因

右下腹部に鈍い違和感。走った後に脇腹が痛くなる感覚に似ているが、それよりも軽い痛み。

 

一度目は3か月くらい前。その時は、特に何もせず、4日間くらいで収まりました。

次は1週間くらい続いたので、お医者さんに診てもらいました。血液検査に尿検査、そしてCTスキャンまでやりました。

 

痛みの場所からして、盲腸もしくは尿管結石が疑われましたが…。

結局そのどちらでもなかったみたいです。血液中の白血球数(WBC)などから、炎症が起こってないので、まあ大丈夫だろうと。CTスキャンでも特に異常が見られませんでした。

 

では何が起きてたのかと言うと、ただ「大腸にガスが溜まっていた」みたいです。CTスキャンで見ると、痛みの場所が黒くなっており、ガスが溜まってることが分かりました。

その当時の生活から推測すると、たぶん座り過ぎがガス溜まりの原因でしょう。論文書きなどで長時間椅子に座りっぱなしで動かなかったので…。お医者さんに行ってから、1時間に1回ほどは席を立って動くようにしたところ、違和感はなくなりました。

しかし、こんな簡単なことが原因だとは思わなかったです。大したことない症状で医者に行ってちょっと恥ずかしい…。

リアルタイムPCRで発現量比の差を解析する統計的手法

リアルタイムPCRで発現解析時の統計手法

遺伝子Aの発現量が条件αと条件βで変わらないかどうか、リアルタイムPCRで調べたい。そんなときの話です。

複数のハウスキーピング遺伝子のCt値(あるいはCp値)と遺伝子AのCt値との差(=ΔCt)を条件α・βごとに求めて、さらに各条件でのΔCtの差(=ΔΔCt)を求める。ΔΔCtが0なら条件間での発現量に差はない。ざっくり書くとこんな感じが一般的な方法でしょう(Livak法あるいはPfaffl法)。

 

しかし「ΔΔCtが0である」ことが統計的に有意かどうか、どのように判断するのがベストなのでしょう?

 

 

ネットで見つけた回答

似たようなことはやはり皆考えてるようで、researh gateで同じような質問が複数見つかりました。

1Which_statistical_analysis_significance_tests_must_to_be_perform_for_relative_RT-qPCR_experiments

2Does_anyone_know_how_to_determine_the_significance_of_differential_gene_expression_using_RT-qPCR_data

1では「ΔCtは正規分布するので、ΔCtに対してt検定をしろ」と言うのがpopular answerになっています。さらにBioconductorのLimmaパッケージによるmoderated t-testを薦めてます。ちなみにGoni et al. (2009) もlimmaをお薦めしてます。

2では「t検定の仮定(正規性・等分散性)を満たせばt検定を使い、仮定を満たさなければWilcoxonの順位和検定を使うか、対数変換などによって仮定を満たすようデータをいじってからt検定をするかだ」との回答がpopular answerです。

 

この2のやり方は、2段階の検定の問題がありそうです(参考:井口研究室ブログ: 正規性検定をノンパラメトリック検定の選択基準にするな*1。なので、1のようにΔCtがどのような分布をとるのか予め理屈から考えておき、それに基づき統計手法を選択するというスタンスが好ましいでしょう。

 

また、N<5の少数サンプルの場合には、正規性の検定をすること自体が正直ナンセンスな気がします。直感で書いているので、特に根拠はないですが…。

 

 

どのような確率分布を仮定すべきか

では、1の言う「ΔCtは正規分布に従う」説は正しいのか。

自信はないですが、それなりに妥当だと思います。遺伝子の発現量はたぶん対数正規分布に従い、またcDNA濃度の対数とCt値は線形関係です。なので、Ct値は正規分布でしょう。正規分布の差は正規分布なので、ΔCtも正規分布に従うはずです。

ただ、サンプルや対象遺伝子の性質によっては正規分布の仮定を置くのが妥当ではないかもしれません。Tichopad et al. (2009, Clinical Chem, 55:10) がDiscussionで同様のことを述べてます。いわく"Cq values obtained with samples of solid tissues are commonly assumed to be normally distributed, but to our knowledge, the validity of this assumption has yet to be demonstrated"とのこと。もっとも最新の知見では、より明確なことが分かってるかも。

正規分布に従うと仮定できるなら、ΔCtの差をt検定やANOVAで調べるのも妥当ですね。ただどういう場合にその仮定が妥当なのか、それが良く分からない。繰り返しますが、別に自信を持って書いているわけではないです…。詳しい人が見てましたら、ぜひ教えてください…。

 

(追記 2018.10.22) 

読み返してみて気付きましたが、ΔCtに対するt検定は増幅効率の異なるPCR産物には適用できませんね。この場合、Pfaffl法で相対発現量に変換してから検定をおこなうのが妥当でしょうか。

 

 

実験操作のばらつきを考慮したモデルで解析できないか?

ここからは、考えがまとまっていないつぶやき。

もう一歩進んで、抽出・逆転写・PCRなど実験操作による誤差も考慮したうえで有意差の検定をできないものでしょうか。下の論文での線形回帰モデルは、それに近いんですが、ΔΔCt法と絡める方法はちょっと思いつかない。特に複数のreference genesのΔCtをもとに標準化する場合。

Tichopad A., Kitchen R., Riedmaier I., Becker C., Ståhlberg A., and Kubista M., 2009, Design and optimization of reverse-transcription quantitative PCR experiments, Clinical Chem., 55 (10), 1816-1823.

 

 

*1:もっと言うと、「少数サンプルの時はWilcoxonを使うと良い」との記述は良く分からない。少数サンプルでノンパラ検定をおこなうと検出力がかなり低くなるはず。少数サンプルはそういうもんだという意味なのか…? また等分散の仮定はWelchのt検定なら不要?

論文のメモ: 28S rRNAのhidden breakについて

一部の生物種は、28S rRNAの真ん中あたりに切れ目が入っていることをこの記事に書きました。その切れ目はhidden breakと呼ばれ、28S rRNAが分裂するときに一部の塩基が消失することはgap deletionと呼ばれているみたいです。

今回は、hidden breakについて少し文献を読んだので、ここにまとめます。

 

 

ハダカデバネズミは分裂する28S rRNAを持ち、正確なタンパク翻訳をおこなう

Azpurua J., Ke Z., Chen I.X., Zhang Q., Ermolenko D.N., Zhang Z.D., Gorbunova V., and Seluanov A., 2013, Naked mole-rat has increased translational fidelity compared with the mouse, as well as a unique 28S ribosomal RNA cleavage, PNAS, 110 (43), 17350-17355.

なんとなく、すごく読みやすかった論文。

28S rRNAにhidden breakがあると報告されている生物種は、昆虫や甲殻類が多いみたいですが、ハダカデバネズミにもhidden breakがあるようです。28S rRNAの分裂はリボソームの構造に影響するので、タンパクの合成速度と忠実度(fidelity)も影響を受けるだろうと仮説を立てて、ハダカデバネズミの翻訳速度とfidelityをhidden breakがないマウスのそれと比較しています。

結果、翻訳速度はマウスと同じだったけど、ルシフェラーゼアッセイで測定した翻訳のfidelityはマウスよりも高かったそうな。Hidden breakの存在とfidelityとの関係は直接調べたわけではないのでそのあたりは強引な論文ですが、ハダカデバネズミを用いてる点がPNASに載る所以でしょうか…。

 

「哺乳類の28S rRNAにおける新規のプロセッシング

Melen G.J., Pesce C.G., Rossi M.S., and Kornblihtt A.R., 1999, Novel processing in a mammalian nuclear 28S pre‐rRNA: tissue‐specific elimination of an ‘intron’bearing a hidden break site, EMBO J, 18 (11), 3107-3118.

上の論文で引用されてた、哺乳類でも28S rRNAのhidden breakが見つかった例。今のところ哺乳類でhidden breakが見つかったのは、上の論文のハダカデバネズミとこの齧歯類だけみたいです。

面白いのが、睾丸testisのみでhidden breakのない28S rRNAも見つかっている点。他の部位ではイントロン?のところでhidden breakが生じるのに対して、testisではイントロンが除去されてhidden breakが生じない、ということ。そのあたりのメカニズムは良く分かってないみたいです。

 

アルテミアプラナリアの28S rRNAにおけるgap region

Sun S., Xie H., Sun Y., Song J., and Li Z., 2012, Molecular characterization of gap region in 28S rRNA molecules in brine shrimp Artemia parthenogenetica and planarian Dugesia japonica, Biochem, 77 (4), 411.

上に書いた哺乳類ではD6領域にhidden breakがありますが、他の昆虫や甲殻類ではD7a領域にhidden breakがあるそうです。

この論文は、2生物種のD7a領域のgap region近くをシーケンスしたものです。Terminal deoxynucleotidyl transferaseでcDNAの3末端にpolyG配列を付与して、その配列をもとに28S rRNAの片割れを読む手法など参考になりそう。

28S rRNAのD7a領域内のUAAUという配列が、hidden breakを持つ種に共通しているという知見があったけれど、この論文で調べたアルテミアにはUAAU配列は存在しなかったそうです。

 

シロイヌナズナ葉緑体23S rRNAのhidden break形成にはDEAD box proteinが必要

Nishimura K., Ashida H., Ogawa T., and Yokota A., 2010, A DEAD box protein is required for formation of a hidden break in Arabidopsis chloroplast 23S rRNA, Plant J, 63(5), 766-777.

今度は植物の葉緑体。28Sではなく23S。詳しくは読んでません。後で追記するかも。hidden breakのメカニズムについて。

 

 「トビケラの絹糸腺リボソームのキャラクタリゼーション」

Nomura T., Ito M., Kanamori M., Shigeno Y., Uchiumi T., Arai R., Tsukada M., Hirabayashi K., and Ohkawa K., 2016, Characterization of silk gland ribosomes from a bivoltine caddisfly, Stenopsyche marmorata: translational suppression of a silk protein in cold conditions, Biochem. Biophys. Res. Commun., 469 (2), 210-215.

こちらもメモ。

トビケラの28S rRNAもD7a領域にhidden breakがあるみたいです。面白いのが、冬にだけ80Sリボソームが分裂してしまうこと。冬は転写活性を抑えるために28S rRNAのhidden breakが発生するのではないか、と考察されてます。

あと、hidden breakとL23a proteinが関係しているかも、という話も始めて知りました。

(追記 2018.02.03)

L23a proteinとhidden breakについて。元ネタのRoss et al. (2007, Nucl Acids Res, 35) をざっと読みましたが、L23aがhidden breakを引き起こしている、というレベルの知見ではなさそう。L23aとリボソームの位置関係と、Hidden breakを持つ昆虫などがL23aに特徴的なドメイン(Histon H1-like domain)を持っていたという系統関係とをもとに考察されただけ? 上のNishimura et al. (2016) ほど因果関係を詰めているわけではない。

 

(追記 2018.06.12)

「菌類における26S rRNAの転写後marurationの同定

Navarro-Ródenas A., Carra A., and Morte A., 2018, Identification of an alternative rRNA post-transcriptional maturation of 26S rRNA in the kingdom fungi, Frontiers  Microbiol, 9.

菌類でhidden breakが見つかったよ、という報告。Desert truffles(砂漠のトリュフ?)の3種で26S rRNAのhidden break周りの塩基配列を読んでいます。

 

論文のメモ: RT-PCRを始めるにあたって読みたい文献

リアルタイムPCRを用いた遺伝子発現解析の原理、実験手法やデータ解析法について。

いちばん分かりやすく丁寧なのは、タカラサーモの日本語解説でしょう。特にサーモの「リアルタイムPCRハンドブック」は最高。それらを読んだ後に、将来論文に引用することを想定して読むべき文献は、下のようなものでしょうか。

  

 

全般的なことについて
Bustin S.A., Benes V., Garson J.A., Hellemans J., Huggett J., Kubista M., Mueller R., Nolan T., Pfaffl M.W., Shipley G.L., Vandesompele J., and Wittwer C.T., 2009, The MIQE guidelines: minimum information for publication of quantitative real-time PCR experiments, Clinical Chem., 55 (4), 611-622.

論文など公表するときに記載するべきことのリスト。MIQEガイドライン。公表する際のチェックリストですが、実験を始めるときにこれが頭に入ってると良いでしょう。

例えば、逆転写活性の阻害・PCRの阻害をチェックすべし、というのが必須項目に挙げられてますが、ちゃんと実施している論文は結構少ないかも。

 

 

実験手法について
Nolan T., Hands R.E., and Bustin S.A., 2006, Quantification of mRNA using real-time RT-PCR, Nature Protocols, 1 (3), 1559-1582.

Nature ProtocolのRT-PCR法まとめ。データ解析法は詳しくないですが、実験手法は一通り詳しく書いてます。

 

Taylor S., Wakem M., Dijkman G., Alsarraj M., and Nguyen M., 2010, A practical approach to RT-qPCR—publishing data that conform to the MIQE guidelines. Methods, 50 (4), S1-S5.

MIQEガイドラインに則った実験手法まとめ。

 

 

リファレンス遺伝子の選択について

遺伝子発現解析は、ハウスキーピング遺伝子群(リファレンス遺伝子)とターゲット遺伝子との発現量の相対比較でおこなうのが主流です。そのリファレンス遺伝子として18S rRNAやβアクチン、GAPDHなどがよく使われていますが、これらの発現量は条件によって変動することが広く知られています。なので、実験系によってリファレンス遺伝子を選び直すステップが必要になります。

では、どのようにしてベストなリファレンス遺伝子を選ぶのが良いのでしょうか。いくつかの方法が提案されています。BestKeeper、NormFinder、geNORMの3つを下に記しておきます。

  

Pfaffl M.W., Tichopad A., Prgomet C., and Neuvians T.P., 2004, Determination of stable housekeeping genes, differentially regulated target genes and sample integrity: BestKeeper–Excel-based tool using pair-wise correlations, Biotechnol. Letters, 26 (6), 509-515.

BestKeeper。Excelファイルがwebで配布されてます。

リファレンス遺伝子の選択方法はきわめて単純で、基本的に (i) Cp値のばらつきが小さく、(ii) 全部の候補リファレンス遺伝子のCp値の幾何平均と高い相関を示すような遺伝子を、安定的なリファレンスとして選択するというものです。

  

Andersen C.L., Jensen J.L., and Ørntoft T.F., 2004, Normalization of real-time quantitative reverse transcription-PCR data: a model-based variance estimation approach to identify genes suited for normalization, applied to bladder and colon cancer data sets, Cancer Res., 64 (15), 5245-5250.

次にNormFinder。ExcelのアドインとRスクリプトが公開されてます。 

 

Vandesompele J., De Preter K., Pattyn F., Poppe B., Van Roy N., De Paepe A., and Speleman F., 2002, Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes, Genome Biol., 3 (7), research0034-1.

ソフトウェアgeNORMの元論文。geNORMは有料なので、自分は使っていませんが、そのアルゴリズムは論文を読めばわかるように、割と単純です。リファレンスに使える遺伝子の組なら、その相対発現比はどの細胞・条件でも1に近いはず、という仮定が根底にあるんですね。

(追記)

Rパッケージの"NormqPCR"はgeNORMを装備しているみたいです。もちろん無料。

 

 

相対定量の方法について

ΔΔCt法は下の2つをチェックすべし。プライマーの増幅効率が全て2と同等ならばLivakの2-ΔΔCtを用い、増幅効率がプライマーごとに異なるならばPfafflの方法を用いる。

Pfaffl M.W., 2001, A new mathematical model for relative quantification in real-time RT–PCR, Nucleic Acids Res., 29 (9), e45-e45. 
Livak K.J. and Schmittgen T.D., 2001, Analysis of relative gene expression data using real-time quantitative PCR and the 2− ΔΔCT method, Methods, 25 (4), 402-408.  

 

 

(追記)

こちらの記事に、発現量の有意差の統計的な検定法について書きました。t検定かノンパラか、など。

論文のメモ: RINは 全ての生物種のRNA分解指標にはできない

動物組織から抽出したRNAの分解度合は、電気泳動によって評価するのが普通です。ヒトなどの場合は、バイオアナライザーという装置で泳動して RIN (RNA Integrity Number; Schroeder et al., 2006) なる指標で分解度を評価します。RINの考え方は、RNAの中で大部分を占めるrRNAの存在比(分解度合)などに基づいて、RNA全体の分解度を推定しようというものです。

ただしRINは、ヒトや哺乳類のRNAを対象とした指標であり、昆虫や甲殻類など一部の生物種には適用できない場合があります(例えば下のWinnebeck et al., 2010)。昆虫や甲殻類の28S rRNAはスプライシング後に"gap deletion"なる現象によって切れ目を入れられて、RNA抽出や泳動前の熱変性の際に2つの断片に分かれてしまいます。そのため本当はRNAが分解していなくとも、28S rRNAが見られないために分解されたとみなされてしまうのです。

 

 

「RIN: RNA非分解度の指標

Schroeder A., Mueller O., Stocker S., Salowsky R., Leiber M., Gassmann M., Lightfoot S., Menzel W., Granzow M., and Ragg T., 2006, The RIN: an RNA integrity number for assigning integrity values to RNA measurements, BMC Mol. Biol., 7 (1), 3.

RNA分解度の評価としてRINを提案した論文。18S rRNAと28S rRNAの量比という指標では分解度を正確に表現できていないという問題を克服するために、RINが開発されたようです。

主にヒト・マウ・ラットのRNAサンプル1208個の波形データを専門家が1~10の分解レベルにカテゴリー分けし、そのカテゴリー分けはどのような特徴量(例:28Sと18Sのピーク高さ比)によってなされているのかをニューラルネットワークを用いて計算しています。ちなみにRINは数字が小さいほど(すなわち1に近いほど)、RNAが分解していることを示します。

ニューラルネットワークの詳細は分かりませんが(というかもはや読んでない)、カテゴリー分けに対する寄与の大きかった特徴量は、順にtotal RNA 比・28Sピーク高さ・28S 面積・fast regionに対する18Sと28S の面積比だそうです。total RNA比とは全RNAに対する18S・28S rRNAの面積比であり、fast regionとは5S と18Sに挟まれた領域のことです。このあたりの特徴量の説明は、Wikipediaにも簡単に書いてありますね。 

 

「なぜ昆虫のRNAは分解して見えるのか?

Winnebeck E.C., Millar C.D., and Warman G.R., 2010, Why does insect RNA look degraded?, J. Insect Sci., 10 (159), 1-7.

ミツバチのRNAでRINを測ろうとして、プロトコル通りにRNAを加熱してBioanalyzerに流すと28S rRNAが見えない。RNAが分解したのかと思いきや、そうではない。gap deletion (hidden break) のために28S rRNAが断裂しただけである。なので、RNAは加熱しないで流す。そうすると28S rRNAのピークが確認できるよ、気をつけよう。そんな論文です。 

28S rRNAが断裂するメカニズムについても、既往文献を引用して、まとめられています。

 

節足動物における"分解したRNA"プロファイル

McCarthy S.D., Dugon M.M., and Power A.M., 2015, ‘Degraded’RNA profiles in Arthropoda and beyond, Peer J, 3, e1436.

クモやムカデ・フジツボ類も、28S rRNAは加熱すると分裂するという話。加熱しないで泳動すれば28S rRNAピークも見られると、Winnebeck et al., 2010, J. Insect Sci.と同じようなことを書いています。

 

ただ自分の経験によると、これはヨコエビには適用できないっぽいです。ヨコエビRNAは、加熱しなくても28S rRNA分裂が生じます。同様の報告はVidal-Dorsch et al. (2016) もしています*1

例えば下の図は、あるヨコエビのtotal RNA泳動図です。Bioanalyzerでの泳動前に加熱してませんが、28S rRNAピークは小さくなってしまいます。

f:id:Kyoshiro1225:20170425105708j:plain

 

なぜこのように生物種によって28S rRNAの切れやすさに違いが生じるのでしょうか。たぶんですが、28S rRNAの配列が異なると二次構造も変化してhidden breakの水素結合部分の強さが変わるからでしょう。

 非モデル生物を扱うときは、本当に予想外のことが生じますね。

 

*1:著者のDorisさんにメールしたら、Bioanalyzer前に加熱はしてないとのことでした。

生物サンプルの送付依頼

1月ほど前、某国の研究者から遺伝子解析したいので生物サンプル送ってくれないか、という問い合わせメールが来ました。

良いよ~、でもCOI領域なら既に300 bpくらい既に読んであるので配列データ送るね、と返信したところ、1月ほど音沙汰なし。

自分とは異なる研究分野なので、連携出来たら面白いかと思ったけど、まあいっか。こちらからアクションを起こしてまで連携しようという気はないです。