Resources Linkage for e-Science – RENKEI –

研究コミュニティ形成のための資源連携技術に関する研究「RENKEIプロジェクト」

松岡 聡氏
松岡 聡氏

東京工業大学 学術国際情報センターでは、NIIをはじめとする8機関・大学と共同で研究コミュニティ形成のための資源連携技術に関する研究「RENKEI(REsources liNKage for E-scIence) プロジェクト」を進めています。
今回はそのサブテーマの一つである「RENKEI POP(Point of Presence)」とSINET3の関わりについて、東京工業大学 学術情報センター教授 松岡 聡氏と、同特任助教 滝澤 真一朗氏、同特任助教 佐藤 仁氏にお話を伺いました。
(インタビュー実施: 2010年5月7日)

東工大 学術国際情報センターでは、学内の情報化以外にも様々な取り組みを行っておられるそうですね。

松岡氏: 当センターでは、現在大きく分けて三つの事業に取り組んでいます。
まず一つ目は、今お話のあった学内向け情報基盤の構築・運用です。ここではキャンパスネットワーク「Super TITANET」の運用のほか、教育・研究用計算機やスパコン「TSUBAME」の運用、クラウド型の学内向けホスティングサービス、コンテンツサービスの提供などを行っています。 全学統一認証システムも構築しており、一度自分用のポータルにログインすれば、他のシステム/サービスもシングルサインオンで利用できる環境も実現しています。
残りの二つは、どちらかというと対外向けの活動で、その一つは本学以外の大学・研究機関と連携して、情報分野における先端研究を推進するというものです。 我々自身も研究者ですから、先に述べたような学内情報基盤の整備以外に、e-サイエンス関連のプロジェクトやスパコン、HPC関連の研究開発など、様々な研究に取り組んでいます。
また、もう一つは他大学の情報センターとの連携で、平成22年4月より「学際大規模情報基盤共同利用・共同研究拠点」の構成センターに加わりました。 ちなみに、当センターの名称に「国際」とある通り、タイやカナダ、アメリカなど、海外の大学・研究機関との連携も推進しています。

情報技術以外の分野の研究者とも連携を深められているそうですが。

松岡氏: 先端サイエンスの世界では、今やどの分野においても高度な情報処理技術が不可欠になっています。 たとえばヒトゲノムなどでも、昔は10年掛けて解析していたものが、最新のスパコンを利用すれば数分で読むことが可能になります。そうすると、今までとは全く違った視点での研究が可能になるんですね。これは地球環境や天体の研究などについても全く同じ事が言えます。
ところが、生物学や天文学が専門の先生方は、コンピュータや情報処理技術にまで精通しているわけではありません。いろいろな分野の研究を加速していく上では、我々のような情報分野の研究者の後押しが欠かせないのです。

現在進められているRENKEIプロジェクトについても伺いたいのですが。

松岡氏: 今お話した通り、現代のサイエンスはゲノム分析のシーケンサや電波望遠鏡、加速器、放射光施設などから生み出される膨大のデータを分析したり、シミュレーションしたりすることが重要なテーマになっています。 しかし、そうしたe-サイエンスのためのインフラやセンターを、それぞれの研究分野が個別に持つのでは効率が悪い。そこで、すべてのサイエンスの研究者が利用できる共通のデータ基盤を作ろうというのが、RENKEIプロジェクトの狙いです。
これまで国内では、スパコンの計算能力向上に多くの労力が割かれてきました。もちろん、それはそれで大事なことであり、本学でも現在TSUBAMEの後継機となる「TSUBAME2」の開発に取り組んでいます。 しかし、いくら計算だけが速くても、それだけでは充分とは言えません。e-サイエンスの進化を促すためには、大量のデータを「蓄積できる」「高速に読み書きできる」「処理できる」「転送できる」データ基盤が存在するということも同じくらい重要なのです。

RENKEI POP」はその中でどのような役割を担っているのですか。

滝澤 真一朗氏
滝澤 真一朗氏

滝澤氏: RENKEI POPは、RENKEIプロジェクトの5つのサブテーマの一つ「実証評価・ユーザー連携」として実施しているもので、拠点間の高速データ転送をサポートするアプライアンスの研究開発を行っています。これを利用すれば、各大学や研究機関のスパコンに存在する大容量の研究データを、他の拠点でも簡単に利用することができます。 現在は東工大に2台、阪大、名大、筑波大、NII、KEK、産業技術総研にそれぞれ1台ずつRENKEI POPのノードを配備しており、相互にデータの参照や転送が行えるようになっています。
開発にあたっては「globus toolkit」や「Gfarm」などのソフトウェア資産を活用しているほか、拠点間を結ぶネットワークとしてSINET3のL3-VPNを利用しています。10Gbpsの帯域を活用できるため、8GBのデータでも約15秒で転送できます。 現状、拠点内の通信ボトルネックの存在や、ホスト毎のTCP通信チューニングが完全でないため、フルに活用できていませんが、各拠点管理者と協力して性能向上に努めています。

それは速いですね。今後SINETの高速化が進めば、データをさらに短時間で転送できるようになるのですか。

佐藤 仁氏
佐藤 仁氏

佐藤氏: 基本的にはそうなのですが、その際には現在のRENKEI POPの仕様のままというわけにはいきません。 というのも、今まではネットワーク帯域がボトルネックになっていたところが、今度はRENKEI POP側のI/O性能が問題になってくるんですね。
ちなみに現在のRENKEI POPの仕様は、CPUがCore i7 975 Extreme、メモリ12GB、10GbE NIC、データ記憶用ストレージ30TBと、ハイエンドPCに大容量のストレージを加えたようなデザインになっています。帯域が10Gbpsならこの仕様で問題ないのですが、さらに高速になってくるとこのままでは少々厳しい。 RENKEI POPをうまく動作させるためには、ネットワーク帯域やI/O性能などの要素がすべてバランスされている必要がありますので、帯域が40Gbpsにアップしたら40Gbps向け、100Gbpsにアップしたら100Gbps向けに、新たに仕様を作り直すことになります。

各分野の研究者にとっても、こうした環境が実現するのは朗報ですね。

松岡氏: そうですね。大容量データを利用する研究はいろいろありますが、今まではそれをネットワークで転送することは非常に困難でした。 たとえ10Gbpsの回線を使っていても、実際のスループットはそれにはほど遠いため、磁気テープやディスクを物理的に輸送せざるを得ませんでした。
しかし、RENKEI POPを利用すれば、収集したデータを他大学の高性能スパコンで解析するといったことも容易に行えます。我々としても、早期の実用化を目指して研究開発を進めていきたいと考えています。

最後にSINETへの期待と今後の研究に掛ける抱負を伺えますか。

松岡氏: まずSINETに対しては、ネットワーク以外のサービスの拡充を期待しています。回線サービスについては歴史も古く、RENKEI POPでも役立ってくれています。しかし、今後のサイエンスにおいては、全国的な共通データ基盤を整備していくことが極めて重要です。我々も各大学の情報センターと連携して基盤整備を進めていますが、その取り組みにも是非協力して頂きたい。
また、今後の研究という意味では、グランドチャレンジ的な研究に携わる人材の育成に力を入れていきたいですね。 学生にもよく「生活臭の強い研究は止めよう!」と言っているのですが(笑)、Webやケータイを使ったサービスなどは民間企業に任せておけばいい。 せっかく大学で研究しているのですから、我々はいろいろなサイエンスのグランドチャレンジを支援していくべきと考えています。また、そのことが、情報系のグランドチャレンジにもつながると考えています。

ありがとうございました。