ゲノムネッ トは、ゲノム解析および関連する医学・分子生物学・薬学などの学術研究 を促進することを目的として、1991年から京都大学化学研究所スーパーコンピュー タラボラトリ(以下SCL)およ び東京大学医科学研究所ヒトゲノム解析センター(以下HGC)によって運用が開始さ れたインフラストラクチャです。世界中で各種のゲノムデータがほぼ指数関数的に増加 していく状況の中で、大量のゲノムデータを交換するための専用のネット ワークおよび大規模なスーパーコンピュータシステムを用いて、この分野にお いては国内はもちろん世界でも最大級の統合的ゲノム解析サービスを提供し続 けています。当初は ftp や電子メールを用いたサービスが主でしたが、現在 ではかなりのサービスがWeb経由で どこからでも利用できるようになっています。実際、国内お よび海外から頻繁に利用されており、高い評価を受けています。
以下ではWebを中心に御紹介します。他にもftpや電子メールを使ったサービス があります。詳しくは
北陸地方におけるゲノム解析研究の促進と活性化を目的として、北陸先端大の Sun Enterprize 3000 (4CPU、メモリ512MB、ディスク256GB、ホスト名 db1)を用いて、SCLおよびHGCの協力のもと、1998年9月より試験的に ゲノムネットのサーバを運用してきました。2000年11月からは Sun Ultra 80 (4CPU、メモリ4GB、ディスク1TB、ホスト名 gd1) にサーバ機能を移 し、現在に至っています。このマシン上では、FASTAやBLASTなどの解析サービ スに加えて、DGBET/LinkDBやKEGGなど、SCLやHGCとほぼ同様のことができます。 特に Webサーバに関しては、 SCLおよびHGCのWebサーバと全く変わりなく御利用頂けます。データベースの 更新は毎日自動で行なわれ、SCLやHGCとほぼ同じ状態を保ち続けます。
大量のゲノムデータを扱って研究開発を進める場合、ゲノムネットのサーバが 使用しているファイルを直接扱えることは非常に有益です。例えば、 佐藤研の関係者ならばgd1 に、そうでないJAISTの方は db1 にログインして、/bio/db/ideas 以下にあるファイル 群を御覧下さい。これらのファイルに対して研究者独自のスクリプトを走らせ ることで、Webで提供される以外のゲノム解析研究を自由に行なうことが可能 になります。また、直接ゲノム解析研究と関係なくても、既定のフォーマット で格納された大量の情報は、シミュレーションやデータベースなど情報処理の 研究材料としても有益だと考えます。ちなみに gd1 では、大雑把に 見積もって、現在 530GB 程度のディスクを消費してこのサーバを運用していま す。
source /bio/lib/cshrc.ideas でパスや環境変数などの設定が大体 できると思います。それでもうまくいかない場合は 佐藤まで御連絡下さい。 また、gd1 では locate コマンドが使えますので、ファイ ル名の一部を憶えていれば locate パターン などとして瞬 時に探すことが出来ます(例:locate mew)。
北陸先端大の標準ネットワーク環境であるFRONTIERの一部として、automount 設定に gd1 のデータベース領域を組み込んでいます。これにより、 FRONTIER配下のワークステーション群の一部または全域において、ゲノム データベースを参照することが可能になっています(別のページを参照)。
ゲノムネットは「学術研究目的」に限定して利用することが求められています。 もちろん、Webやftp経由のサービスに関してはこの制限は当てはまりませんが、 db1 にログインしてゲノムネットサーバの内部データを御使用にな る場合は、必ず「学術研究目的」で御利用下さい。特に商行為を目的とする利 用は絶対になさらないよう強くお願い致します。
御質問・御意見等なんでも結構ですので、お気軽に佐藤までお寄せ下さい。特 に、ゲノムデータを本格的に研究に使用したい場合は御一報頂けると助かりま す。宜しくお願い致します。