SlideShare ist ein Scribd-Unternehmen logo
1 von 11
Downloaden Sie, um offline zu lesen
45分で理解する




           最近のスパコン事情

           オフィスサイトウ 斉藤之雄
               www.fxfrog.com
              Twitter @yukio_saitoh


                                不許複製   2012/07/03

                                                    1
インデックス

•   スパコンとは(一般定義)
•   グリッド・コンピューティングとの違い
•   実物スパコン例 (東京工業大学 TSUBAME 2.0)/ GPGPU
•   実物スパコン例 (富士通 K コンピュータ) / 専用CPU
•   スパコン性能は国際競争力を示す
•   GPGPU 入門マシンを自作しよう(予算5万円)
•   身近なスパコン、計算資源利用方法
•   きっと役立つ情報入手先
•   まとめ



メモ:技術者向けではなく広く一般パソコン利用者が抵抗なく吸収できる
ように書きました                          2
スパコンとは(一般定義)
•   スーパーコンピュータ(略称:スパコン)は、1970年代前半の黎明期から演算処理速度がその時
    代の一般的な大型コンピュータよりも極めて高速なコンピュータのこと。1990年代以降は並列コ
    ンピューティングによるハイパフォーマンス・コンピューティング (HPC) もほぼ同義語として使
    用されているが、スパコンの構成法の一つである。
•   主要スパコンメーカ:富士通,日立, NEC, IBM, HP, SGI, クレイ, DELL 等


•   スパコンは膨大な科学計算処理が目的であり、かつては軍事目的や工業製品の設計用に注目され
    ていたが、1990年以降は新薬開発の短縮化、外科手術の最適化、地震津波予測、気象予測、構造
    計算、金融工学のシミュレーションに幅広く利用されている。
•   基盤ソフトウェアは 2000年までは UNIX が主流であったが、現在は※ Windows HPC Server 2008 R2
    採用例があるが、ソルバー(科学技術計算公式群)が充実している Linux が主流となっている。
•   スパコンの構成は並列化計算のため構成は計算ノード、ネットワーク、ペタバイトストレージを
    形成しており高密度配置した 19’ ラック1基で数100 GFLOPS の演算性能を持つものが珍しくない。
•   Top 500 と呼ばれる全世界のスパコン・ベンチマークランキングリストがあるが、ベンチマークに
    対する消費電力の優れたスパコンリストに Green 500 がある。Top 500 と Green 500 両方にトップク
    ラスであることがホンモノの実力を持ったスパコンであるといえる 。




    ※ 初代は Windows Compute Cluster Server
                                                                  3
グリッド・コンピューティングとの違い

•   グリッドは広域ネットワーク上の計算,データ,実験装置,センサ,人間
    などの資源を仮想化・統合し,必要に応じて仮想計算機 (Virtual Computer) や
    仮想組織 (Virtual Organization) を動的に形成するためのインフラであり、コン
    ピュータ処理を集約し、再利用する仕組み。
•   スパコンは同一建屋あるいは敷地を対象としたグリッド・コンピューティ
    ングに形成されている。
•   一般的なパソコンを用い、使用しない夜間時間に稼働する専用ミドルウェ
    アを介在し、家庭からのWANネットワーク越しに計算資源を集中させ、大
    規模計算を行う仕組みがあり、分散コンピューティング技術として利用さ
    れている。スパコンに匹敵する計算資源があると言われるが、安定した資
    源が担保されたものではないため、生命科学系 BOINC(SETI@homeは下火)
    が主要な目的である。




※ BOINC 利用方法(日本語対応) http://boinc.berkeley.edu/
                                                    4
スパコン例 GPGPU
   (東京工業大学学術国際情報センターTSUBAME 2.0)
                                      ←   ラックを開けたところ
                                          インフィニバンドで結合
                                    (2011/10/19 撮影許可のもと)
                                    ほぼアキバで入手可能パーツ




メモ:NVIDIA社製GPUアクセラレータTesla M2050 + SSD + InfiniBand
ref.) http://tsubame.gsic.titech.ac.jp/tsubame2-system-architecture     5
(General-purpose computing on graphics processing units; GPUによる汎目的計算)
スパコン例 専用CPU
(富士通 K コンピュータ)

            ← モック筺体
            (2011/10/4 撮影許可のもと)
           国家プロジェクトとして富士通が受託開発

           ↓    6次元メッシュ/トーラス構造の
               インタコネクトの立体模造。




 世界第一位でなければならなかった国産スパコンと豆腐インターコネクト
                                  6
スパコン性能は国際競争力を示す
TOP 10 of 500 - 06/2012
1          米国 Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom
2          日本 K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect
3          米国 Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
4          ドイツ SuperMUC - iDataPlex DX360M4, Xeon E5-2680 8C 2.70GHz, Infiniband FDR
5          中国 Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, NVIDIA 2050
6          米国 Jaguar - Cray XK6, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA 2090
7          イタリア Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
8          ドイツ JuQUEEN - BlueGene/Q, Power BQC 16C 1.60GHz, Custom
9          フランス Curie thin nodes - Bullx B510, Xeon E5-2680 8C 2.700GHz, Infiniband QDR
10         中国 Nebulae - Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050


スパコン性能が科学産業において【国際競争力】が優位になるのは全世界
で証明されている。スパコン事業は複数年の設計期間を要するため、単純
な事業仕分けとして規模縮小することは国際競争力を弱めるものである

     ※スパコン性能例として TSUBAME 2.0 で、創薬目的のタンパク質結合
     シミュレーション3ヶ月程度で解析実現(計算設計は数年)                                                                      7
GPGPU 入門マシンを自作しよう
(予算5万円)
•    GPGPU専用の統合開発環境は NVIDIAによる「CUDA」や、AMDの「ATI Stream」があるが、ここで
     は CUDA 環境マシンを紹介したい
     マザーボード: Asus P5K-VM (オンボード VGA でコンピュータ操作)
     CPU: intel Core 2 Duo E8200 @2.66GHz
     RAM:DDR2-800 2GB × 4 (8GB)
     GPU:[ELSA] NVIDIA GeForce GTX 560 Ti OC アクセライズ / CUDA 384 Cores(演算コア数)
          GPU Core 1.80GHz (DDR5/2050MHz, 256bit)
    2009年頃のマシンへ 2011年夏に発売された GeForce GTX 560 Ti OC (2万円) を増設した


deviceQuery 実施例      →    http://www.fxfrog.com/page/13?cat=6973
GPU 性能テスト例           →   http://www.fxfrog.com/page/7?cat=6973
GPU による Windows ドメインパスワードキャッシュ・ブルートフォース解析例
                    →    http://www.fxfrog.com/page/6?cat=6973
準モンテカルロ法でオプション決定価格計算                             →     http://www.fxfrog.com/archives/3484
これらはゼロから開発したものではなく、CUDA 開発環境や SorceForge 等から入手したものである



    CUDA 対応 グラボスペック(2011/Aug) 資料
    http://www.slideshare.net/fullscreen/kermit123/nvidia-cuda-specification-                8
    memo20110828modified/1
身近なスパコン、計算資源利用方法
 •   TSUBAME を利用(みんなのペタスケール・スパコン)




 •   Amazon HPC アプリケーションを利用 (EC2 クラスタ・インスタンス)
     → http://aws.amazon.com/jp/hpc-applications/

     スポットで HPC 利用体験    →   http://www.youtube.com/embed/2Ym7epCYnSk

TSUBAME 計算サービス→ http://www.gsic.titech.ac.jp/tsubame
(評価したいだけであれば、 AWS EC2 クラスタ・インスタンスが                                    9
  迅速且つ経済性が高い)
きっと役立つ情報入手先
•   GPUコンピューティング研究会 (無料会員登録)
    http://gpu-computing.gsic.titech.ac.jp/
•   OpenACC (既存 CUDA ソースに数行追加実装するだけで高速化実現)
    http://www.openacc-standard.org/
•   東工大 GSIC
    http://www.gsic.titech.ac.jp/
•   NVIDIA CUDA コンパイラ (無償入手可。ベータ版入手は要登録)
    http://www.nvidia.co.jp/object/cuda_home_new_jp.html
•   ATI Stream テクノロジ
    http://www.amd.com/jp/products/technologies/stream-technology/Pages/stream-
    technology.aspx
•   Microsoft Windows HPC Server Developers – General (英語)
    http://social.microsoft.com/Forums/ja-jp/windowshpcdevs/threads




                                                                                  10
まとめ
•   気軽にスパコン利用できる時代に入っている
•   スパコン性能を高めることは国際競争力の強化と関係がある
•   スパコンのクラウドサービスもある (IBM, 富士通, Amazon 等)
•   アキバで入手できるパーツでスパコン構築可能
•   スパコンにおけるプログラミング習得は C / C++ 基本文法を理解しており、
    並列化処理 OpenMP等の基礎構文がその上で知識構築が必要
•   並列化処理が苦手でも最適化対応する各種 GPGPU / CUDA オプション製品や
    パッケージが NVIDIA、サードパーティ各社、SorceForge から入手できる
•   GPU はコア間のメモリアクセス距離が物理的に近いため、CPU に対して
    GPU が並列演算性能が高い。またメニーコアで高速演算するにはパソコン
    向け CPU ではなく、K コンピュータのように専用 CPU と内部結合を開発
    せねばならない


    オフィスサイトウでは、InfiniBand や SSD を用いた大量のデータを
    高速かつ確実に処理する手法構成を日々研究しています。                    11
    営業パートナーなどお気軽にご相談ください。 Twitter @yukio_saitoh

Weitere ähnliche Inhalte

Was ist angesagt?

2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例智啓 出川
 
EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活Kuninobu SaSaki
 
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境智啓 出川
 
関東GPGPU勉強会資料
関東GPGPU勉強会資料関東GPGPU勉強会資料
関東GPGPU勉強会資料Kimikazu Kato
 
技術系大学におけるGPU教育の一試行
技術系大学におけるGPU教育の一試行技術系大学におけるGPU教育の一試行
技術系大学におけるGPU教育の一試行智啓 出川
 
Pythonによる並列プログラミング -GPGPUも-
Pythonによる並列プログラミング   -GPGPUも- Pythonによる並列プログラミング   -GPGPUも-
Pythonによる並列プログラミング -GPGPUも- Yusaku Watanabe
 
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割智啓 出川
 
NVIDIA 最近の動向
NVIDIA 最近の動向NVIDIA 最近の動向
NVIDIA 最近の動向NVIDIA Japan
 
Flow in VR Funhouse MOD Kit
Flow in VR Funhouse MOD KitFlow in VR Funhouse MOD Kit
Flow in VR Funhouse MOD KitNVIDIA Japan
 
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層智啓 出川
 
GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)
GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)
GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)智啓 出川
 
20170421 tensor flowusergroup
20170421 tensor flowusergroup20170421 tensor flowusergroup
20170421 tensor flowusergroupManaMurakami1
 
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ智啓 出川
 
OpenCLに触れてみよう
OpenCLに触れてみようOpenCLに触れてみよう
OpenCLに触れてみようYou&I
 
Slurmのジョブスケジューリングと実装
Slurmのジョブスケジューリングと実装Slurmのジョブスケジューリングと実装
Slurmのジョブスケジューリングと実装Ryuichi Sakamoto
 
20170726 py data.tokyo
20170726 py data.tokyo20170726 py data.tokyo
20170726 py data.tokyoManaMurakami1
 
1070: CUDA プログラミング入門
1070: CUDA プログラミング入門1070: CUDA プログラミング入門
1070: CUDA プログラミング入門NVIDIA Japan
 
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)智啓 出川
 
1000: 基調講演
1000: 基調講演1000: 基調講演
1000: 基調講演NVIDIA Japan
 
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)智啓 出川
 

Was ist angesagt? (20)

2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
2015年度GPGPU実践基礎工学 第2回 GPGPUの歴史と応用例
 
EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活EnrootとPyxisで快適コンテナ生活
EnrootとPyxisで快適コンテナ生活
 
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
2015年度GPGPU実践プログラミング 第3回 GPGPUプログラミング環境
 
関東GPGPU勉強会資料
関東GPGPU勉強会資料関東GPGPU勉強会資料
関東GPGPU勉強会資料
 
技術系大学におけるGPU教育の一試行
技術系大学におけるGPU教育の一試行技術系大学におけるGPU教育の一試行
技術系大学におけるGPU教育の一試行
 
Pythonによる並列プログラミング -GPGPUも-
Pythonによる並列プログラミング   -GPGPUも- Pythonによる並列プログラミング   -GPGPUも-
Pythonによる並列プログラミング -GPGPUも-
 
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
2015年度先端GPGPUシミュレーション工学特論 第1回 先端シミュレーションおよび産業界におけるGPUの役割
 
NVIDIA 最近の動向
NVIDIA 最近の動向NVIDIA 最近の動向
NVIDIA 最近の動向
 
Flow in VR Funhouse MOD Kit
Flow in VR Funhouse MOD KitFlow in VR Funhouse MOD Kit
Flow in VR Funhouse MOD Kit
 
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
2015年度GPGPU実践基礎工学 第13回 GPUのメモリ階層
 
GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)
GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)
GPGPU Seminar (Accelerataion of Lattice Boltzmann Method using CUDA Fortran)
 
20170421 tensor flowusergroup
20170421 tensor flowusergroup20170421 tensor flowusergroup
20170421 tensor flowusergroup
 
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
2015年度GPGPU実践基礎工学 第9回 GPUのアーキテクチャ
 
OpenCLに触れてみよう
OpenCLに触れてみようOpenCLに触れてみよう
OpenCLに触れてみよう
 
Slurmのジョブスケジューリングと実装
Slurmのジョブスケジューリングと実装Slurmのジョブスケジューリングと実装
Slurmのジョブスケジューリングと実装
 
20170726 py data.tokyo
20170726 py data.tokyo20170726 py data.tokyo
20170726 py data.tokyo
 
1070: CUDA プログラミング入門
1070: CUDA プログラミング入門1070: CUDA プログラミング入門
1070: CUDA プログラミング入門
 
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細(共有メモリ)
2015年度先端GPGPUシミュレーション工学特論 第4回 GPUのメモリ階層の詳細 (共有メモリ)
 
1000: 基調講演
1000: 基調講演1000: 基調講演
1000: 基調講演
 
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境(OpenCL)
2015年度GPGPU実践基礎工学 第15回 GPGPU開発環境 (OpenCL)
 

Andere mochten auch

Tera Termのインストール
Tera TermのインストールTera Termのインストール
Tera TermのインストールNaoyuki Sano
 
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」mick
 
Talendとtalend5.4のご紹介
Talendとtalend5.4のご紹介Talendとtalend5.4のご紹介
Talendとtalend5.4のご紹介Talend KK
 
plotnetcfg入門 | Introduction to plotnetcfg
plotnetcfg入門 | Introduction to plotnetcfgplotnetcfg入門 | Introduction to plotnetcfg
plotnetcfg入門 | Introduction to plotnetcfgKentaro Ebisawa
 
Pythonista も ls を読むべきか?
Pythonista も ls を読むべきか?Pythonista も ls を読むべきか?
Pythonista も ls を読むべきか?Katsunori FUJIWARA
 

Andere mochten auch (7)

Tera Termのインストール
Tera TermのインストールTera Termのインストール
Tera Termのインストール
 
Visiting HPC 2013
Visiting HPC 2013Visiting HPC 2013
Visiting HPC 2013
 
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
 
オープンソースで開くビッグデータの扉
オープンソースで開くビッグデータの扉オープンソースで開くビッグデータの扉
オープンソースで開くビッグデータの扉
 
Talendとtalend5.4のご紹介
Talendとtalend5.4のご紹介Talendとtalend5.4のご紹介
Talendとtalend5.4のご紹介
 
plotnetcfg入門 | Introduction to plotnetcfg
plotnetcfg入門 | Introduction to plotnetcfgplotnetcfg入門 | Introduction to plotnetcfg
plotnetcfg入門 | Introduction to plotnetcfg
 
Pythonista も ls を読むべきか?
Pythonista も ls を読むべきか?Pythonista も ls を読むべきか?
Pythonista も ls を読むべきか?
 

Ähnlich wie 45分で理解する 最近のスパコン事情 斉藤之雄

第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会Hitoshi Sato
 
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021Preferred Networks
 
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep LearningWatsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep LearningAtsumori Sasaki
 
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄Tak Izaki
 
「スーパーコンピュータとクラウドゲーム」
「スーパーコンピュータとクラウドゲーム」「スーパーコンピュータとクラウドゲーム」
「スーパーコンピュータとクラウドゲーム」Shinra_Technologies
 
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介NTT Communications Technology Development
 
インフラ野郎AzureチームProX
インフラ野郎AzureチームProXインフラ野郎AzureチームProX
インフラ野郎AzureチームProXToru Makabe
 
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月VirtualTech Japan Inc.
 
Singularity Containers for Enterprise Use
Singularity Containers for Enterprise UseSingularity Containers for Enterprise Use
Singularity Containers for Enterprise UseAtsutoHashimoto
 
20221116_DBTS_PGStrom_History
20221116_DBTS_PGStrom_History20221116_DBTS_PGStrom_History
20221116_DBTS_PGStrom_HistoryKohei KaiGai
 
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティスGPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティスVirtualTech Japan Inc.
 
OSC 2012 Hokkaido でのプレゼン資料
OSC 2012 Hokkaido でのプレゼン資料OSC 2012 Hokkaido でのプレゼン資料
OSC 2012 Hokkaido でのプレゼン資料Shin-ya Koga
 
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介シスコシステムズ合同会社
 
GPU-FPGA協調プログラミングを実現するコンパイラの開発
GPU-FPGA協調プログラミングを実現するコンパイラの開発GPU-FPGA協調プログラミングを実現するコンパイラの開発
GPU-FPGA協調プログラミングを実現するコンパイラの開発Ryuuta Tsunashima
 
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2Preferred Networks
 
(JP) GPGPUがPostgreSQLを加速する
(JP) GPGPUがPostgreSQLを加速する(JP) GPGPUがPostgreSQLを加速する
(JP) GPGPUがPostgreSQLを加速するKohei KaiGai
 
【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今Developers Summit
 

Ähnlich wie 45分で理解する 最近のスパコン事情 斉藤之雄 (20)

Cmc cmd slim
Cmc cmd slimCmc cmd slim
Cmc cmd slim
 
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
第162回情報処理学会ハイパフォーマンスコンピューティング研究発表会
 
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
 
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep LearningWatsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
Watsonをささえる ハイパフォーマンスクラウドで はじめるDeep Learning
 
NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄NVIDIA deep learning最新情報in沖縄
NVIDIA deep learning最新情報in沖縄
 
GTC Japan 2017
GTC Japan 2017GTC Japan 2017
GTC Japan 2017
 
「スーパーコンピュータとクラウドゲーム」
「スーパーコンピュータとクラウドゲーム」「スーパーコンピュータとクラウドゲーム」
「スーパーコンピュータとクラウドゲーム」
 
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
【たぶん日本初導入!】Azure Stack Hub with GPUの性能と機能紹介
 
インフラ野郎AzureチームProX
インフラ野郎AzureチームProXインフラ野郎AzureチームProX
インフラ野郎AzureチームProX
 
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
GPU Container as a Serviceを実現するための最新OSS徹底比較 - OpenStack最新情報セミナー 2017年7月
 
Singularity Containers for Enterprise Use
Singularity Containers for Enterprise UseSingularity Containers for Enterprise Use
Singularity Containers for Enterprise Use
 
20221116_DBTS_PGStrom_History
20221116_DBTS_PGStrom_History20221116_DBTS_PGStrom_History
20221116_DBTS_PGStrom_History
 
GPU Container as a Service を実現するための最新OSS徹底比較
GPU Container as a Service を実現するための最新OSS徹底比較GPU Container as a Service を実現するための最新OSS徹底比較
GPU Container as a Service を実現するための最新OSS徹底比較
 
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティスGPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
 
OSC 2012 Hokkaido でのプレゼン資料
OSC 2012 Hokkaido でのプレゼン資料OSC 2012 Hokkaido でのプレゼン資料
OSC 2012 Hokkaido でのプレゼン資料
 
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
ITpro EXPO 2014: Cisco UCSによる最新VDIソリューションのご紹介
 
GPU-FPGA協調プログラミングを実現するコンパイラの開発
GPU-FPGA協調プログラミングを実現するコンパイラの開発GPU-FPGA協調プログラミングを実現するコンパイラの開発
GPU-FPGA協調プログラミングを実現するコンパイラの開発
 
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
続・PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜 #2
 
(JP) GPGPUがPostgreSQLを加速する
(JP) GPGPUがPostgreSQLを加速する(JP) GPGPUがPostgreSQLを加速する
(JP) GPGPUがPostgreSQLを加速する
 
【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今【A-1】AIを支えるGPUコンピューティングの今
【A-1】AIを支えるGPUコンピューティングの今
 

Mehr von Yukio Saito

東京2020ボランティア参加メモ(簡易)
東京2020ボランティア参加メモ(簡易)東京2020ボランティア参加メモ(簡易)
東京2020ボランティア参加メモ(簡易)Yukio Saito
 
Exam prep microsoft_ai900_japanese_210428
Exam prep microsoft_ai900_japanese_210428Exam prep microsoft_ai900_japanese_210428
Exam prep microsoft_ai900_japanese_210428Yukio Saito
 
Simple know how to creating agenda notes and daily reports
Simple know how to creating agenda notes and daily reportsSimple know how to creating agenda notes and daily reports
Simple know how to creating agenda notes and daily reportsYukio Saito
 
Aws 転送時間計測(手順付き参考例)
Aws 転送時間計測(手順付き参考例)Aws 転送時間計測(手順付き参考例)
Aws 転送時間計測(手順付き参考例)Yukio Saito
 
異業種から福祉業界ジョブチェンジして10か月後
異業種から福祉業界ジョブチェンジして10か月後異業種から福祉業界ジョブチェンジして10か月後
異業種から福祉業界ジョブチェンジして10か月後Yukio Saito
 
異業種から福祉介護ジョブチェンジ検討
異業種から福祉介護ジョブチェンジ検討異業種から福祉介護ジョブチェンジ検討
異業種から福祉介護ジョブチェンジ検討Yukio Saito
 
オンデマンド学習スタイル例 NFU
オンデマンド学習スタイル例 NFUオンデマンド学習スタイル例 NFU
オンデマンド学習スタイル例 NFUYukio Saito
 
Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版
Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版
Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版Yukio Saito
 
Tobii eye x controller で遊ぶ
Tobii eye x controller で遊ぶTobii eye x controller で遊ぶ
Tobii eye x controller で遊ぶYukio Saito
 
斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。
斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。
斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。Yukio Saito
 
Microsoft windows phone_激安購入方法
Microsoft windows phone_激安購入方法Microsoft windows phone_激安購入方法
Microsoft windows phone_激安購入方法Yukio Saito
 
PBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜ
PBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜPBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜ
PBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜYukio Saito
 
CentOS7をインストールして遊ぶのだ
CentOS7をインストールして遊ぶのだCentOS7をインストールして遊ぶのだ
CentOS7をインストールして遊ぶのだYukio Saito
 
Androidエミュレータをちょっと速くするintel haxm(ハッサム)
Androidエミュレータをちょっと速くするintel haxm(ハッサム)Androidエミュレータをちょっと速くするintel haxm(ハッサム)
Androidエミュレータをちょっと速くするintel haxm(ハッサム)Yukio Saito
 
Winodws7のruby2でrails4を遊ぶ環境を作るのだ。
Winodws7のruby2でrails4を遊ぶ環境を作るのだ。Winodws7のruby2でrails4を遊ぶ環境を作るのだ。
Winodws7のruby2でrails4を遊ぶ環境を作るのだ。Yukio Saito
 
Astah plugin 実行方法とSysML要求図のサンプル
Astah plugin 実行方法とSysML要求図のサンプルAstah plugin 実行方法とSysML要求図のサンプル
Astah plugin 実行方法とSysML要求図のサンプルYukio Saito
 
Windows8でOpenCVを使ったAndroid(MOVERIO)開発体験したい
Windows8でOpenCVを使ったAndroid(MOVERIO)開発体験したいWindows8でOpenCVを使ったAndroid(MOVERIO)開発体験したい
Windows8でOpenCVを使ったAndroid(MOVERIO)開発体験したいYukio Saito
 
NTTcom cloud n にサービス追加の適当な手順
NTTcom cloud n にサービス追加の適当な手順NTTcom cloud n にサービス追加の適当な手順
NTTcom cloud n にサービス追加の適当な手順Yukio Saito
 
Intel xdk導入とhtml5サンプルビルド手順書
Intel xdk導入とhtml5サンプルビルド手順書Intel xdk導入とhtml5サンプルビルド手順書
Intel xdk導入とhtml5サンプルビルド手順書Yukio Saito
 
圏央道ウォーキング日記
圏央道ウォーキング日記圏央道ウォーキング日記
圏央道ウォーキング日記Yukio Saito
 

Mehr von Yukio Saito (20)

東京2020ボランティア参加メモ(簡易)
東京2020ボランティア参加メモ(簡易)東京2020ボランティア参加メモ(簡易)
東京2020ボランティア参加メモ(簡易)
 
Exam prep microsoft_ai900_japanese_210428
Exam prep microsoft_ai900_japanese_210428Exam prep microsoft_ai900_japanese_210428
Exam prep microsoft_ai900_japanese_210428
 
Simple know how to creating agenda notes and daily reports
Simple know how to creating agenda notes and daily reportsSimple know how to creating agenda notes and daily reports
Simple know how to creating agenda notes and daily reports
 
Aws 転送時間計測(手順付き参考例)
Aws 転送時間計測(手順付き参考例)Aws 転送時間計測(手順付き参考例)
Aws 転送時間計測(手順付き参考例)
 
異業種から福祉業界ジョブチェンジして10か月後
異業種から福祉業界ジョブチェンジして10か月後異業種から福祉業界ジョブチェンジして10か月後
異業種から福祉業界ジョブチェンジして10か月後
 
異業種から福祉介護ジョブチェンジ検討
異業種から福祉介護ジョブチェンジ検討異業種から福祉介護ジョブチェンジ検討
異業種から福祉介護ジョブチェンジ検討
 
オンデマンド学習スタイル例 NFU
オンデマンド学習スタイル例 NFUオンデマンド学習スタイル例 NFU
オンデマンド学習スタイル例 NFU
 
Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版
Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版
Engadget電子工作部 健康ガジェットを作ろう ドS!コーチ発表最終版
 
Tobii eye x controller で遊ぶ
Tobii eye x controller で遊ぶTobii eye x controller で遊ぶ
Tobii eye x controller で遊ぶ
 
斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。
斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。
斉藤之雄 が 公立大学 産業技術大学院大学 で獲得したこと。
 
Microsoft windows phone_激安購入方法
Microsoft windows phone_激安購入方法Microsoft windows phone_激安購入方法
Microsoft windows phone_激安購入方法
 
PBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜ
PBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜPBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜ
PBLでは先行学習は大事だぜ、シラバスは参考程度で主体的に楽しもうぜ
 
CentOS7をインストールして遊ぶのだ
CentOS7をインストールして遊ぶのだCentOS7をインストールして遊ぶのだ
CentOS7をインストールして遊ぶのだ
 
Androidエミュレータをちょっと速くするintel haxm(ハッサム)
Androidエミュレータをちょっと速くするintel haxm(ハッサム)Androidエミュレータをちょっと速くするintel haxm(ハッサム)
Androidエミュレータをちょっと速くするintel haxm(ハッサム)
 
Winodws7のruby2でrails4を遊ぶ環境を作るのだ。
Winodws7のruby2でrails4を遊ぶ環境を作るのだ。Winodws7のruby2でrails4を遊ぶ環境を作るのだ。
Winodws7のruby2でrails4を遊ぶ環境を作るのだ。
 
Astah plugin 実行方法とSysML要求図のサンプル
Astah plugin 実行方法とSysML要求図のサンプルAstah plugin 実行方法とSysML要求図のサンプル
Astah plugin 実行方法とSysML要求図のサンプル
 
Windows8でOpenCVを使ったAndroid(MOVERIO)開発体験したい
Windows8でOpenCVを使ったAndroid(MOVERIO)開発体験したいWindows8でOpenCVを使ったAndroid(MOVERIO)開発体験したい
Windows8でOpenCVを使ったAndroid(MOVERIO)開発体験したい
 
NTTcom cloud n にサービス追加の適当な手順
NTTcom cloud n にサービス追加の適当な手順NTTcom cloud n にサービス追加の適当な手順
NTTcom cloud n にサービス追加の適当な手順
 
Intel xdk導入とhtml5サンプルビルド手順書
Intel xdk導入とhtml5サンプルビルド手順書Intel xdk導入とhtml5サンプルビルド手順書
Intel xdk導入とhtml5サンプルビルド手順書
 
圏央道ウォーキング日記
圏央道ウォーキング日記圏央道ウォーキング日記
圏央道ウォーキング日記
 

45分で理解する 最近のスパコン事情 斉藤之雄

  • 1. 45分で理解する 最近のスパコン事情 オフィスサイトウ 斉藤之雄 www.fxfrog.com Twitter @yukio_saitoh 不許複製 2012/07/03 1
  • 2. インデックス • スパコンとは(一般定義) • グリッド・コンピューティングとの違い • 実物スパコン例 (東京工業大学 TSUBAME 2.0)/ GPGPU • 実物スパコン例 (富士通 K コンピュータ) / 専用CPU • スパコン性能は国際競争力を示す • GPGPU 入門マシンを自作しよう(予算5万円) • 身近なスパコン、計算資源利用方法 • きっと役立つ情報入手先 • まとめ メモ:技術者向けではなく広く一般パソコン利用者が抵抗なく吸収できる ように書きました 2
  • 3. スパコンとは(一般定義) • スーパーコンピュータ(略称:スパコン)は、1970年代前半の黎明期から演算処理速度がその時 代の一般的な大型コンピュータよりも極めて高速なコンピュータのこと。1990年代以降は並列コ ンピューティングによるハイパフォーマンス・コンピューティング (HPC) もほぼ同義語として使 用されているが、スパコンの構成法の一つである。 • 主要スパコンメーカ:富士通,日立, NEC, IBM, HP, SGI, クレイ, DELL 等 • スパコンは膨大な科学計算処理が目的であり、かつては軍事目的や工業製品の設計用に注目され ていたが、1990年以降は新薬開発の短縮化、外科手術の最適化、地震津波予測、気象予測、構造 計算、金融工学のシミュレーションに幅広く利用されている。 • 基盤ソフトウェアは 2000年までは UNIX が主流であったが、現在は※ Windows HPC Server 2008 R2 採用例があるが、ソルバー(科学技術計算公式群)が充実している Linux が主流となっている。 • スパコンの構成は並列化計算のため構成は計算ノード、ネットワーク、ペタバイトストレージを 形成しており高密度配置した 19’ ラック1基で数100 GFLOPS の演算性能を持つものが珍しくない。 • Top 500 と呼ばれる全世界のスパコン・ベンチマークランキングリストがあるが、ベンチマークに 対する消費電力の優れたスパコンリストに Green 500 がある。Top 500 と Green 500 両方にトップク ラスであることがホンモノの実力を持ったスパコンであるといえる 。 ※ 初代は Windows Compute Cluster Server 3
  • 4. グリッド・コンピューティングとの違い • グリッドは広域ネットワーク上の計算,データ,実験装置,センサ,人間 などの資源を仮想化・統合し,必要に応じて仮想計算機 (Virtual Computer) や 仮想組織 (Virtual Organization) を動的に形成するためのインフラであり、コン ピュータ処理を集約し、再利用する仕組み。 • スパコンは同一建屋あるいは敷地を対象としたグリッド・コンピューティ ングに形成されている。 • 一般的なパソコンを用い、使用しない夜間時間に稼働する専用ミドルウェ アを介在し、家庭からのWANネットワーク越しに計算資源を集中させ、大 規模計算を行う仕組みがあり、分散コンピューティング技術として利用さ れている。スパコンに匹敵する計算資源があると言われるが、安定した資 源が担保されたものではないため、生命科学系 BOINC(SETI@homeは下火) が主要な目的である。 ※ BOINC 利用方法(日本語対応) http://boinc.berkeley.edu/ 4
  • 5. スパコン例 GPGPU (東京工業大学学術国際情報センターTSUBAME 2.0) ← ラックを開けたところ インフィニバンドで結合 (2011/10/19 撮影許可のもと) ほぼアキバで入手可能パーツ メモ:NVIDIA社製GPUアクセラレータTesla M2050 + SSD + InfiniBand ref.) http://tsubame.gsic.titech.ac.jp/tsubame2-system-architecture 5 (General-purpose computing on graphics processing units; GPUによる汎目的計算)
  • 6. スパコン例 専用CPU (富士通 K コンピュータ) ← モック筺体 (2011/10/4 撮影許可のもと) 国家プロジェクトとして富士通が受託開発 ↓ 6次元メッシュ/トーラス構造の インタコネクトの立体模造。 世界第一位でなければならなかった国産スパコンと豆腐インターコネクト 6
  • 7. スパコン性能は国際競争力を示す TOP 10 of 500 - 06/2012 1 米国 Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom 2 日本 K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect 3 米国 Mira - BlueGene/Q, Power BQC 16C 1.60GHz, Custom 4 ドイツ SuperMUC - iDataPlex DX360M4, Xeon E5-2680 8C 2.70GHz, Infiniband FDR 5 中国 Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, NVIDIA 2050 6 米国 Jaguar - Cray XK6, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA 2090 7 イタリア Fermi - BlueGene/Q, Power BQC 16C 1.60GHz, Custom 8 ドイツ JuQUEEN - BlueGene/Q, Power BQC 16C 1.60GHz, Custom 9 フランス Curie thin nodes - Bullx B510, Xeon E5-2680 8C 2.700GHz, Infiniband QDR 10 中国 Nebulae - Dawning TC3600 Blade System, Xeon X5650 6C 2.66GHz, Infiniband QDR, NVIDIA 2050 スパコン性能が科学産業において【国際競争力】が優位になるのは全世界 で証明されている。スパコン事業は複数年の設計期間を要するため、単純 な事業仕分けとして規模縮小することは国際競争力を弱めるものである ※スパコン性能例として TSUBAME 2.0 で、創薬目的のタンパク質結合 シミュレーション3ヶ月程度で解析実現(計算設計は数年) 7
  • 8. GPGPU 入門マシンを自作しよう (予算5万円) • GPGPU専用の統合開発環境は NVIDIAによる「CUDA」や、AMDの「ATI Stream」があるが、ここで は CUDA 環境マシンを紹介したい マザーボード: Asus P5K-VM (オンボード VGA でコンピュータ操作) CPU: intel Core 2 Duo E8200 @2.66GHz RAM:DDR2-800 2GB × 4 (8GB) GPU:[ELSA] NVIDIA GeForce GTX 560 Ti OC アクセライズ / CUDA 384 Cores(演算コア数) GPU Core 1.80GHz (DDR5/2050MHz, 256bit) 2009年頃のマシンへ 2011年夏に発売された GeForce GTX 560 Ti OC (2万円) を増設した deviceQuery 実施例 → http://www.fxfrog.com/page/13?cat=6973 GPU 性能テスト例 → http://www.fxfrog.com/page/7?cat=6973 GPU による Windows ドメインパスワードキャッシュ・ブルートフォース解析例 → http://www.fxfrog.com/page/6?cat=6973 準モンテカルロ法でオプション決定価格計算 → http://www.fxfrog.com/archives/3484 これらはゼロから開発したものではなく、CUDA 開発環境や SorceForge 等から入手したものである CUDA 対応 グラボスペック(2011/Aug) 資料 http://www.slideshare.net/fullscreen/kermit123/nvidia-cuda-specification- 8 memo20110828modified/1
  • 9. 身近なスパコン、計算資源利用方法 • TSUBAME を利用(みんなのペタスケール・スパコン) • Amazon HPC アプリケーションを利用 (EC2 クラスタ・インスタンス) → http://aws.amazon.com/jp/hpc-applications/ スポットで HPC 利用体験 → http://www.youtube.com/embed/2Ym7epCYnSk TSUBAME 計算サービス→ http://www.gsic.titech.ac.jp/tsubame (評価したいだけであれば、 AWS EC2 クラスタ・インスタンスが 9 迅速且つ経済性が高い)
  • 10. きっと役立つ情報入手先 • GPUコンピューティング研究会 (無料会員登録) http://gpu-computing.gsic.titech.ac.jp/ • OpenACC (既存 CUDA ソースに数行追加実装するだけで高速化実現) http://www.openacc-standard.org/ • 東工大 GSIC http://www.gsic.titech.ac.jp/ • NVIDIA CUDA コンパイラ (無償入手可。ベータ版入手は要登録) http://www.nvidia.co.jp/object/cuda_home_new_jp.html • ATI Stream テクノロジ http://www.amd.com/jp/products/technologies/stream-technology/Pages/stream- technology.aspx • Microsoft Windows HPC Server Developers – General (英語) http://social.microsoft.com/Forums/ja-jp/windowshpcdevs/threads 10
  • 11. まとめ • 気軽にスパコン利用できる時代に入っている • スパコン性能を高めることは国際競争力の強化と関係がある • スパコンのクラウドサービスもある (IBM, 富士通, Amazon 等) • アキバで入手できるパーツでスパコン構築可能 • スパコンにおけるプログラミング習得は C / C++ 基本文法を理解しており、 並列化処理 OpenMP等の基礎構文がその上で知識構築が必要 • 並列化処理が苦手でも最適化対応する各種 GPGPU / CUDA オプション製品や パッケージが NVIDIA、サードパーティ各社、SorceForge から入手できる • GPU はコア間のメモリアクセス距離が物理的に近いため、CPU に対して GPU が並列演算性能が高い。またメニーコアで高速演算するにはパソコン 向け CPU ではなく、K コンピュータのように専用 CPU と内部結合を開発 せねばならない オフィスサイトウでは、InfiniBand や SSD を用いた大量のデータを 高速かつ確実に処理する手法構成を日々研究しています。 11 営業パートナーなどお気軽にご相談ください。 Twitter @yukio_saitoh