備忘録 a record of inner life

やったことや考えたこと・本・論文・音楽の備忘録。 特に環境科学・生態毒性に関して。

blast+の計算時間

12/6(火)からlinuxコマンドライン上でlocal blastxをおこなってますが、まだ終わらない…。こんな感じのコマンドを入力してから、もうじき7日経ちます。

blastx -query Trinity.fasta -db nr -max_target_seqs 2 -outfmt 5 -evalue 1e-05 -num_threads 6 -out out_nr.xml

 

海外の掲示板を見ると*1、「小さいマシンなら20k proteinのblastpは7~14日で終わる」と言ってます。たぶんCPU8とかの普通のパソコンの話。別のページでは「30kの核酸配列をnrデータベースでblastxすれば10日はかかる」とのこと。自分のデータは約80kなので、もっと時間がかかるかな…。11月中旬に、ほぼ同じ条件でntを対象にblastnをした時は一晩で終わったのに、nrとntでこれほど違うのか。

 

 

time blastx -query ......

このtimeコマンドでblastxの計算時間を見てみようとしたのですが、このコマンドだけで3時間もかかっていたのでイラついて止めちゃいました。

*1:掲示板へのリンクを貼るとBad requestと出てブログが更新できません。

論文のメモ: 廃水に曝露させたミジンコの発現変動遺伝子

「ゴム廃水曝露ミジンコにおける発現変動遺伝子の定量化

Jo H.J. and Jung J., 2008, Quantification of differentially expressed genes in Daphnia magna exposed to rubber wastewater, Chemosphere, 73 (3), 261-266. 

卒論生のT君の参考にできそう(うちの専攻は卒論提出が2月初旬で遅い)。たいした論文ではないけど、内容のシンプルさと対象遺伝子の生物学的な議論をほとんどしてないという点(曝露のマーカーとして遺伝子発現を使おうとしてる点)で、うちの専攻の卒論生に向けた参考文献としては適当かも。

DD-PCR (differential dislay-PCR) の一種ですがACP (annealing control primer) というエラーが生じにくいプライマーを使って、オオミジンコのマーカー探索をおこなった論文。ゴム廃水と亜鉛溶液とに曝露させて、計2つのマーカーの用量応答関係をqPCRで評価したもの。

 

 

ACPの論文は下。アブストくらいしか読んでませんが、イノシン塩基配列(poly dI)を含むプライマーを使うみたいです。

Hwang I.T., Kim Y.J., Kim S.H., Kwak C.I., Gu Y.Y. and Chun J.Y., 2003, Annealing control primer system for improving specificity of PCR amplification, Biotech., 35 (6), 1180-1191. 

 

RNA-seqにおけるrRNAの扱い

どういう働きの遺伝子がどれくらい発現しているか、見たいのはmRNA。しかしRNAの大部分はrRNAです。シーケンス前にoliog-dTビーズやらで取り除く操作をおこなっても、全てのrRNAが除去できるわけではありません。

なのでmRNAだけが解析対象なら、dry解析時にもrRNAを取り除く必要があります。例えば、下のSortMeRNAというソフトを使えば簡単にできます。

 

Kopylova E., Noé L., and Touzet H., 2012, SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data, Bioinfor., 28 (24), 3211-3217. 

 

 

ということで自分のRNA-seqデータにSortMeRNAを適用してみました。linux上でダウンロード、インストールすれば簡単に使えます。「indexdb_rna」で既知のrRNAデータのインデックス化をして、そのインデックスをもとに「sortmerna --ref XXXX -- reads XXXXXX --fastx」でrRNAを除去します。

 

で、結果は…。なんとリード数が除去前の1/10に。めちゃくちゃびっくりしました。Latexのoligo-dTキットでrRNA除去したと思ってたのに…。どうやら、サンプルをもっと薄めてからキットを使わないといけなかったようです。

既往文献を見てもrRNAがそんなに残っているという例は見られないですね。SortMeRNAを使ったRNA-seq論文を見ると、Wang et al. (2016, Plos One, 11(6): e0157656) ではrRNAの割合は3%と報告されていますし、Matra et al. (2016, Genomics Data, 10, 35-37) では除去されたリード数は約25%です。

うわぁ~、ショック。せっかくおこなったRNA-seqが…。手伝ってくれた人にも色々申し訳ないです。

 

 

(追記2016.12.03)

はやとちりだったかも。

SortMeRNAコマンドでは、「--aligned XXXXX」の引数で指定されるファイルがrRNAの配列で、「--other XXXXXX」で指定されるのがrRNAを除いた配列みたいです。てっきり「--aligned」の方がrRNAを除いた配列かと思ってました。

Takaraのキットを使ったrRNA除去操作の前後でTotal RNA量を吸光度ベースで測っていて、キットによってTotal RNA量は1/100ほどになっていたので、まあ冷静に考えたらrRNAの大半は除去されてますよね…。でもキットの使用量をケチって推奨の値より若干少な目にしていたので不安だったのです。

 

SortMeRNAで除去した結果については、まだちょっと良く分からない部分があります。検討中。

論文のメモ: de novo RNA-seqはどれくらいデータがあれば論文になるか

de novo RNA-seqデータの解析中。初めてのことだらけで、いろいろと手探りです。

まずはお試しでシーケンスしただけなので、そのデータで論文が書けるとは思ってませんが、じゃあ一体どれだけの(量・質の)データがあれば書けるのか、いまいち分野の常識が分かってないので、調べてみました。

 

新聞を読むようにざっと情報だけ拾い読んだのは、下の10論文。

多少の差はあれど、全部「de novo RNA-seqしました」「今後このアセンブリデータが役立つだろう」みたいなRNA-seq自体が目的のような論文です。実際10のうち3つは、full paperでなくてdata reportとかshort communicationの類です。

 f:id:Kyoshiro1225:20161130203559p:plain

 

多くの論文でN50は1,000 bpくらいまで達してますね。「このアセンブリデータは有用です」と言うためにはそれぐらいの長さは必要なのでしょうか(もちろん種のゲノムサイズ等によるのでしょうが)。逆にN50が1,000 bpに届かないくらいのアセンブリデータで論文にしようとすれば、切り口の面白さが必要になるのかなぁ。

 

ざざっと読んで、dry解析手法のデファクトスタンダードがなんとなく分かりました。Illuminaのショートリードで読んで*1、TrinityでアセンブリNCBIなどのデータベースで相同性検索。ついでにBlast2GOなどのソフトでGO解析やpathway解析する。そんな流れが定番ですね。

ただ一方で統一されていない部分も目につきます。

例えば多くの論文は、たぶんですが、Trinityでアセンブリされた"the longest isoform"を"unigene"としてカウントしてるっぽい。しかしunigeneを、Trinity後にTGICLやCD-Hitsでクラスタリングされた配列と定義している論文もあります。他には、配列のクオリティーに基づくトリミングやフィルタリング、(dry解析での)rRNA配列の除去などは、そもそも言及していない論文がある点が気になりました。結局は目的次第なのか?

 

*1:今後はどうなんだろう?de novoの場合はやっぱロングリードの方が良いように思えるのですが。ロングのNGSがもっと安くなれば変わっていくのでしょうか。

論文のメモ: 曝露生物の日齢と有害物質への感受性との関係

「Daphniaの日齢が金属毒性に及ぼす影響

Hoang T.C. and Klaine S.J., 2007, Influence of organism age on metal toxicity to Daphnia magna, Environ. Toxicol. Chem., 26 (6), 1198-1204. 

一般に若い曝露生物の方が、年老いた生物よりも感受性は高いです。ただ生まれたばかりの個体とか卵に関しては、その傾向が当てはまらないかもしれない、ということでおこなわれた研究。用いるオオミジンコDaphnia magnaの日齢を変えて、12時間の金属(Cu, Zn, Se, Ag)曝露による致死率・成長阻害・繁殖阻害を調べてます。

金属曝露に対する感受性は日齢と直線関係ではなかったという結果。感受性は産まれた直後に低く、歳をとると高くなるが、ある時点を過ぎるとまた低くなっています。産まれた直後は、体内の栄養を使い外部とのやり取りが少ないから感受性が低いのではないか、と考察されてます。

地味に面白いのは、Cu・Znの曝露とSe・Asの曝露とで、感受性の最も高くなる日齢が異なっているという点。Cu・Znの曝露では生後100 h、Se・As曝露では生後50hあたりで感受性最大です。Cu・Znの毒性は主にNa・Ca摂取阻害であり、生後4dの子どもを作る時点でNaやCaが必要になるので、効果的になるそうです。一方、Seの毒性は活性酸素、Asはenergy inhibitionだそうで、それらの影響は2dの脱皮時に最大となると考えられるのだとか。このへんの考察が勉強になる論文でした。

 

 

Ubuntuのアップグレード失敗からの復旧

次世代シーケンサーのデータ解析に、大学で放置されていたLinuxを使い始めました。Linuxはほぼ触ったことがなかったので、解析の入り口に立つまでにかなり苦労しました。

Ubuntuのバージョンは12.04 LTS。

 

 

Ubuntuのアップグレードをしませんか」みたいなメッセージが出てきたので、何も考えずに従うと、再起動後マウスとキーボードが動かなくなっている。なのでログインもできない。

USB端子でなく、PS/2端子のキーボードなら反応することが分かり、ログインには成功。しかしデスクトップ画面がこんな感じになっている。真っ黒。左のタスクバー(Launcerって言うの?)も表示されていない。「Ctrl+Alt+F1」で仮想コンソールも開けない。「Ctrl+Alt+F1」で端末も開けない。

f:id:Kyoshiro1225:20161120142804j:plain

 

参ったなと、色々ネット検索。

起動時の下の画面の時にF6を押して、Grub画面を表示。そこでprevious versionを選択し、dpkgを選ぶ。"repair broken packages"と書いている。一通りdpkgが終わったところで、resumeを選択し、再開。

f:id:Kyoshiro1225:20161120143211j:plain

 

すると、無事紫色の画面が出て、マウスとキーボードが使えるように!

寄り道をしまくったので、復旧するまでに半日くらいかかってしまいました。

SETAC NA @Orlando

SETAC Nort AmericaのAnnual Meetingに参加してきました。大統領選中に開催されるというタイミング。思っていたより、混乱している感じは受けませんでした。自分の観測範囲が狭かったからでしょうか。トランプが大統領になると、環境系の研究費が削られるという話は聞きましたが。

 

情報収集としては非常に有益な学会でした。AOP(Adverse Outcome Pathway)に代表される体系化しようとする動きの強さを感じました。既知のある生物種から他の種の感受性を推測する外挿の話がなかなか面白かったです。詳しいことは研究室のブログに書いたので、ここには書かない。

自分のアピールという意味では、あまり効果なかったかな。ポスター発表ではアピールしたい人には届けられなかったです。次はもう少しいいネタを持って行きたい。

あと英語が分からなさ過ぎて死んだ。非ネイティブの留学生の英語とは、当たり前かもしれないけど、全然違います。特におじさんの発表は、もごもごしていて聞き取りにくい。

 

 

フロリダ州までのフライトは合計16時間ほどあったので、行き帰りで5~6本映画観ました。ちょうど「The Ides of March」という大統領予備選をテーマにした映画がありました。他は「スティーブジョブズ」と「ベン・ハー(リメイク版)」が面白かった。ベン・ハーの映像の迫力、マジですごかった。最後の急展開は、正直どうかと思ったけど。

 

論文のメモ: 下水中の薬品・科学論文の書き方など

Editorialなど、最近読んだ短い文章をいくつか。

 

2016, Using waste water to flush out drug dealers, Nature, 537 (7620), 280.

違法ドラッグの使用を調べるために下水を使うというのが面白いです。自分の学科ではPPCPや大腸菌の挙動調査に下水が使われてますが、こういうのがあるとは。

 

Chapman P.M., 2016, How to review and edit scientific manuscripts, Integ. Environ. Assess. Manag., 12 (4), 608-609.

reviewerとeditorへのお叱り。"Be prompt"とか"Be thorough"とか、内容はまあ「せやな」って感じ。

今査読受けてる論文のeditorに見せてやりたいです。

 

Chapman P.M., 2014, Scientific papers should not be boring, nviron. Mar. Pollut. Bull., 87 (1-2).

この人、こういう雑文?をすごい書いてます。論文の文を短くシンプルにするために、しゃべったのを録音して書き写す、というのは面白い。あと、キャッチ―なタイトルを勧めてますが、論文の中身が推測できないタイトルは自分はあまり好きではないかな…。でも確かについ読んでしまうのも事実。

  

Chapman P.M., 2016, Sediment Contaminant Bioaccumulation: With or Without Gut Contents?, Bull. Environ. Contam. Toxicol., 97, 151-152.

またこの人。Retrospective。有害物質のBioaccumulationを求めるときに、消化管内に入った底質の分は除外しないと、過大評価しちゃうよという警告(ただ研究目的によっては除外する必要なし)。全て排泄させて測定するか、消化管の重量と底質の有害物質濃度から補正計算をおこなうか。自ら糞を食べてしまう生物の場合は、全て排泄させるのが難しいから補正計算が必要になるそうです。

 

論文のメモ: 甲殻類と細菌の関係

気晴らしで読んでみた論文。自分自身の研究との関連は特にないです。

 

「海産ヨコエビの新しい体表面共生細菌

Gillan D.C. and Dubilier N., 2004, Novel epibiotic Thiothrix bacterium on a marine amphipod, Applied Environ. Microbiol., 70 (6), 3772-3775.

海産ヨコエビの表面に硫酸酸化細菌がいることをFISH(fluorescence in situ hybridization)と配列解析で確認したという報告。何が研究の面白いところか始めは分からなかったけど、たぶんThiothrix以外の細菌が共生しているのは見つからなくて、見つかったThiothrixのある種が他の環境(底質など)にはいないという共生関係の特異性が面白いんですね。

 

「外部共生するヨコエビの硫化物耐性

Bauermeister J., Assig K., and Dattagupta, S., 2013, Exploring the sulfide tolerance of ectosymbiotic Niphargus amphipods from the Frasassi caves, central Italy, Internat. J. Speleol., 42 (2), 6.

上の海産ヨコエビと同じように硫黄細菌と外部共生している淡水産ヨコエビをつかった研究。「硫黄細菌が毒性の高い硫化水素を硫酸まで酸化するために、ヨコエビ硫化水素の毒性を受けにくいのではないか」という説を検証してます。このような方向性なら、環境毒性をやってる身としては、研究の面白さはよく分かります。

毒性実験の設計がひどいですけど(n=1など)、抗生物質で硫黄細菌を殺したうえで硫化水素を添加した系とそのまま硫化水素を与えた系で、致死率の大きな差は見られなかった模様。硫黄細菌がいないはずの系でも、それなりの耐性があったので、硫黄耐性は細胞共生以外のメカニズムによるものではないかと推測してます。

 

抗生物質耐性遺伝子の避難所としてのDaphnia

Eckert E.M., Di Cesare A., Stenzel B., Fontaneto D., and Corno G., 2016, Daphnia as a refuge for an antibiotic resistance gene in an experimental freshwater community, Sci. Total Environ., 571, 77-81.

タイトルのキャッチ―さに釣られて、なんとなく読んでみました。短い報告で、Daphniaに食べられるから周りの水中の薬剤耐性菌は減少するけど、Daphniaの体内(もしくは表面)には薬剤耐性菌が潜んでいるという話。だから何というわけではないけど、こんな研究もあるのかという意味で面白かったです。

この論文を読んだ後だと、上の硫黄細菌の研究に関して、抗生物質を与えた後でもヨコエビ内に硫黄細菌が残っていて硫化水素を解毒したんじゃないかという妄想が…。硫化水素の取り込みは鰓や表皮メインだろうから、体内の細菌は関与しないので違うか。

 

論文のメモ: 魚類からの環境DNAの排出速度

 「環境DNAの排出速度

Maruyama A., Nakamura K., Yamanaka H., Kondoh M., and Minamoto T., 2014, The release rate of environmental DNA from juvenile and adult fish, PloS one, 9 (12), e114639.

研究室で紹介された論文。自分は環境DNA(eDNA)について全く詳しくないけれど、面白かったです。論文では環境DNAの排出率がjuvenileとadultで違うというところに注目してて、若い方が代謝速度が大きいので環境DNAの排出率[copies/h/g body]も大きくなると論じてます。ただ誤解してるかもしれませんが、結果(Fig.1)を見ると分解の速度もjuvenileとadultで違います。juvenileの方が分解速度が大きいです。年寄りの皮膚などから排出されたDNAは分解が遅いとかあったら面白そう。