格子QCDシミュレーションによるハドロン物理・素粒子標準模型の研究

筑波大学 計算科学研究センターは、計算科学の発展に貢献する全国共同利用施設として、2004年に設置された施設です。
今回は素粒子物理研究のために構築された データグリッド「JLDG」とSINETの役割について、お話を伺いました。

吉江 友照氏
吉江 友照氏

筑波大学 計算科学研究センターは、計算科学の発展に貢献する全国共同利用施設として、2004年に設置された施設です。
今回は素粒子物理研究のために構築されたデータグリッド「JLDG」とSINETの役割について、素粒子宇宙研究部門の吉江 友照准教授と超高速計算システム研究部門の建部 修見准教授にお話を伺いました。
(インタビュー実施:2008年7月1日,更新:2010年3月10日)

筑波大学 計算科学研究センターの活動目的について教えて頂けますか。

吉江氏: まず一点目は、計算機を利用した大規模シミュレーションや解析によって、各研究分野における課題を解くことです。たとえば、私の専門である計算素粒子物理学では、格子QCDシミュレーションによるハドロン物理や素粒子標準模型の研究を行っています。
素粒子標準模型はかなり確立された理論なのですが、これが本当に正しいか検証したり、標準模型を超える理論の手がかりがないか予言したりすることが、現代素粒子物理学の重要課題になっています。こうした研究を解析的な手法で行うことは難しいため、数値的手法、つまり計算機を使ったシミュレーションが欠かせないのです。
また、「計算科学研究センター」という名称が示すとおり、計算機科学、情報科学の先進研究も当センターの重要な目的の一つです。たとえば、現在我々が利用している計算機「PACS-CS」も、計算科学分野の研究者の方々と一緒に開発したものです。

サイエンス分野とコンピュータサイエンス分野の研究者が、お互いに連携しながら研究活動を行っているのですね。

建部 修見氏
建部 修見氏

建部氏: そういうことです。当センターには、素粒子宇宙、物質生命、地球環境生物の3分野の研究者と、我々計算機分野の研究者が集まっていますが、こうした形のセンターは全国的にも珍しいのではないでしょうか。
計算機分野には、計算情報学研究部門と超高速計算システム研究部門の2つの部門がありますが、私が所属する超高速計算システム研究部門では、超高速計算機のアーキテクチャ設計や、システムに必要なソフトウェア、テクノロジーの開発などを行っています。
先端研究のための計算機には、一般の企業システム向けのサーバなどとはまったく異なる要求が課せられます。たとえば今お話のあったPACS-CSでも、ノードへのデータ転送を高速に行う仕組みを実装するなど、並列計算を超高速で行うための様々な工夫を盛り込んでいます。

素粒子物理研究においても、ネットワークを活用したプロジェクトが進められているそうですが、これはどういうものなのでしょう。

吉江氏: 少々専門的になりますが、我々の研究においては「QCD配位」というものが基礎的なデータとなります。一度QCD配位のデータが生成されれば、これを用いて素粒子のいろいろな性質を研究できます。
ただし、一つ問題があって、QCD配位のデータ生成には膨大な計算機資源が必要なのです。たとえスパコンを利用しても、1台だけではなかなか追いつきません。そこで、複数の研究機関のスパコンを利用して基礎データを生成し、これをネットワークで共有しようというプロジェクトが2002年に発足しました。
「hepnet-J/sc」と呼ばれるこのプロジェクトでは、SINETのGbE専用線を採用して、筑波大・KEK(高エネルギー加速器研究機構)・京大・阪大・広島大・金沢大を結ぶ広域分散型ファイルシステムを構築しました。
具体的には、各拠点のスパコンに接続したファイルサーバをファイアウォール代わりに利用し、これらのファイルサーバ間でデータをミラーリングする形で運用を開始しています。

なるほど。それならお互いのデータを有効に利用できますね。

吉江氏: ただし、この方法にも課題がありました。たとえば、我々の研究ではデータをあるひとまとまりの形で利用するのですが、これが複数のディスクに分散してしまうのです。また、ユーザー側でデータの所在やミラー先を覚えきれない、ユーザー・グループの概念がなくサポートが大変などの問題も生じてきました。
そこで、こうした点を解消する新たな仕組みとして、2005年より開発に着手したのがデータグリッド「JLDG(Japan Lattice Data Grid)」です。開発にあたっては「スペースの制限のないフラットなデータ共有システム」「組織をまたがるユーザー管理」の2点を実現したいと考えました。
具体的なJLDGの構成要素としては、建部先生も開発に携わられたグローバルファイルシステム「Gfarm」、仮想組織管理ツール「VOMS」、ユーザー認証システム「Naregi-CA」、グリッド・システム構築用ツールキット「Globus Toolkit」などが挙げられます。
また、ネットワークには、従来のGbEブリッジ接続に代わって、SINET3のL3-VPNサービス(MPLS/VPN)を利用しています。

JLDGでは、従来のようにデータの所在を意識する必要がないのですか。

建部氏: そうですね。ユーザーは自分が所属する組織のサーバにログインするだけで、研究に必要なデータを自由に利用できます。そのデータが実際にどこのサーバに格納されているかは、まったく意識しなくても大丈夫です。
ただし、こうした仕組みを実現する上では、いくつかの工夫が必要になります。たとえば、遠くのサーバにあるデータを取りに行くと時間が掛かるので、ファイルの複製を各拠点のサーバに配置する作業を裏側で行っています。
この結果、データのコピー作業が頻繁に発生するため、ネットワークの速さが非常に重要なのです。JLDGのような大規模データ共有においては、高速ネットワークの存在がマスト要件と言えるでしょう。

そこをSINETが支えているというわけですね。JLDGの活用状況はいかがですか。

吉江氏: 2007年3月から試験運用を行ってきましたが、2008年5月より正式運用を開始し、ユーザー登録も順調に進んでいます。
また、実はJLDGと似たデータグリッドが海外でも構築されており、これらを結ぶGrid of Gridsとして「ILDG(International Lattice Data Grid)」が運用されています。JLDGも、英国・欧州・米国・豪州のグリッドと並んでILDGに参加し、国内外の研究者に対してSINET経由でQCD配位を提供しています。データ転送の記録を見ると、現在は月間1000件程度のデータが利用されているようです。

JLDGが新たな発見を生むきっかけになるといいですね。
最後に今後に向けた抱負をお聞かせ頂けますか。

吉江氏: 現在JLDGは、計算素粒子物理研究者にデータを公開するために使われていますが、近い将来には日常的な研究インフラとして利用できるようにしていきたい。
もっとも、大規模データの複製を作る際にも、グリッド上の遠隔サイトからデータを転送するにも高速なネットワークが不可欠ですので、SINETのサービスにも大いに期待しています。

建部氏: 基本的には、高速な計算機を創り上げていくということに尽きますが、そこには計算機のアーキテクチャやファイルシステム、通信ソフトや各種ライブラリなど、様々な要素が含まれています。
今後もこうした研究開発を進め、シームレスで効率的なシステムを実現していきたいですね。

ありがとうございました。