Prototype random number generator board

SINETを介した計算機資源等の提供、円滑なキャンパス移転

田村 義保氏
田村 義保氏

大学共同利用機関法人 統計数理研究所では、統計科学に関する最先端研究や、様々な分野の研究者との共同研究を幅広く展開しています。
同研究所におけるネットワーク活用について、統計数理研究所副所長 データ科学研究系教授 田村 義保氏と、同 統計科学技術センター 計算基盤室室長 中村 和博氏にお話を伺いました。
(インタビュー実施: 2010年3月11日)

統計数理研究所(以下、統数研)の概要についてお話頂けますか。

田村氏: まず日本の統計学の事情についてお話しますと、現在、日本の大学で統計学の専門学部・学科を置いているところは一つもありません。そこで統数研が、日本における統計科学のCenter of Excellenceとして、統計数理研究の中核的な役割を担っています。
世界をリードするような成果も数多く挙げており、本機関の所長を務められた故 赤池弘次先生の「赤池情報量規準」のように、モデル選択の手法として世界的に利用されているものもあります。
一般に統計学というと、新聞などに載っている円グラフや棒グラフなどをまず想像されるかも知れませんが(笑)、実は最先端科学から生活に密着した分野まで、幅広い領域で活用されています。世論調査や選挙の当落予想だけでなく、自然科学や医学、金融工学、さらには小売店の需要予測や売上げ分析に至るまで、あらゆるところに統計学が用いられているのです。

それで統数研内にも、様々な分野の研究グループが設置されているのですね。

田村氏: そういうことです。19世紀の著名な統計学者、カール・ピアソンは「統計は科学の文法である」と言っていますが、何らかのデータを元にして、モデルの構築や分析を行っていくためには、統計学の知識がかならず必要になります。どのような分野の学問であるかを問わず、データを利用するところでは、すべて統計学が欠かせないのです。意外かも知れませんが、古典文学の研究などでも、文体の特徴を調べる手法として統計学が利用されているんですよ。
私自身も専門分野は時系列解析、つまり時間経過に伴って変化するものを予測・制御するための統計学ですが、現在は医学部と共同で生物の呼吸と脳の働きについての研究を行っています。

まさに現代科学の基盤になる学問というわけですね。ITの活用についてはいかがですか。

田村氏: 情報化への取り組みも非常に早かったですね。日本初の商用コンピュータは富士通の「FACOM128A」と言われていますが、これを初めて導入したのも統数研です。
統計学では大量のデータを扱いますから、高速なコンピュータとネットワークが必須です。ネットワークについても、現在のようなインターネット環境が一般化する以前から、東大のTISNやJUNETとの接続を行っています。所内においても、80年代後半には既に10BASE-5、いわゆるイエローケーブルを敷設してLANを構築しています。

ITに対するユーザーからの要求レベルもかなり高くなっているのではないかと思いますが。

中村 和博氏
中村 和博氏

中村氏: そうですね。私の管轄する計算基盤室では、統数研の情報システム部門としての役割を担っていますが、信頼性・可用性やセキュリティについてはかなり気を遣っています。
特に最近では、メールなども研究を支える重要なツールになっていますので、ダウンタイムは可能な限り短くするように心がけています。
また、高速性も非常に重要な要件ですね。当研究所では外部の大学・研究機関に対してスパコンをはじめとする計算機資源を提供していますし、データの大容量化も年を追う毎に加速しています。
それだけに、ネットワークも速ければ速いほど望ましい。比較的早くからSINETを導入したのも、こうしたニーズに応えていくためです。

スパコンのお話が出ましたが、その他にはどのような用途でネットワークが利用されていますか。

田村氏: たとえば、所内の物理乱数発生ボードで作成した乱数を、オンデマンドで所内外から利用できるサービスを提供しています。
物理乱数には、疑似乱数に比べて周期性や「クセ」が少ないというメリットがありますが、その一方で費用が高額なのが難点です。もちろん物理乱数発生ボードを所有している研究所や大学もありますが、研究者個人レベルでは手が届かないケースも少なくありません。その点、統数研では世界最高レベルの性能を誇る装置を開発していますので、これを広く利用してもらおうと考えたわけです。

ただし、ディスクにダウンロードできるくらいの乱数でしたら問題ないですが、装置の性能を最大限に活用するとなると、現在のネットワーク環境ではまだまだ厳しい面もありますね。
2010年7月には3種類の物理乱数発生ボードが稼働しますが、これをオンラインの状態でフル活用すると約600MB/sもの帯域を占有します。そういう意味ではSINETの帯域も、もっと太くなってくれるとありがたい(笑)。
また、その他の例としては、先に述べた私の研究でも実験/解析データの共有にSINETを活用しています。当研究所・共同研究所との間でデータを高速に同期させられるため、非常に便利ですね。こうした大容量データをいちいち添付ファイルで送ったりしていたのでは、効率が悪くて仕方がありませんから。

研究所の立川移転の際にもSINETが役立ったとのことですが。

中村氏: 移転の段階では、まだスパコンのレンタル期間が残っていましたので、スパコンを物理的に移設して稼働させるか、それともネットワーク経由で利用するかの判断を迫られました。一度スパコンをバラして運び、また組み上げて設定などを行うとなると、コストも手間もかなり掛かってしまいます。そこで、残りの期間はネットワーク経由で使用することにしたのですが、SINETのL2-VPNを利用していたおかげで、移転後も以前と同じ感覚でスパコンを使うことができました。場所は違っても同じセグメントとして一体運用できますし、煩雑なネットワーク機器の再設定作業も必要ありません。
また、研究データやメールサーバのデータなどについても、一度テープに落としたりすることなく、SINETを利用して移すことができました。移転に伴うダウンタイムをほぼゼロで抑えられたのは、非常にありがたかったですね。

SINETに対する期待などがあればお聞かせ下さい。

中村氏: ユーザーに対して最適なサービスを提供することが我々のミッションですから、今後も様々な改善を行っていきます。特に最近では、コンピュータやディスクの高速・大容量化が急速に進んでいますので、ネットワークがボトルネックにならないように注意する必要があります。ぜひSINETにも、より高速で高信頼なネットワークサービスを提供し続けて欲しいですね。

最後に今後の抱負を伺えますか。

田村氏: 統数研では、統計数理に関する最先端研究だけでなく、他の分野への普及活動にも力を入れていきたいと思っています。
具体的には、統計の知識を網羅し、なおかつ研究プロジェクトのマネジメントができるような人材を育てていきたい。他分野との融合を深めることで統計学の裾野も広がりますし、新しい研究分野の開拓にもつながります。そのためにも、先端研究と普及・啓蒙活動を両輪で廻していくことが重要だと考えています。

ありがとうございました。