SlideShare ist ein Scribd-Unternehmen logo
1 von 19
CUDA & OpenCL
GPUコンピューティングって何?
薦田 登志矢
@toshiya_komoda
2015/02/24 1
自己紹介
• 2008 – 2014
– 東京大学大学院情報理工学研究科目で博士号取得
• 日本学術振興会特別研究員(2011-13)
– HPCシステムの低電力化
• 2014 –
– DeNAでエンジニアやってます
• Mobage Open Platform APIチーム所属
• 内外のゲーム開発者が利用するAPIを開発・運用
2015/02/24 2
大学院時代
GPUいじったり
MIPS プロセッサ
作ったり
電力測ってみたり…
海外の学会行ったり
2015/02/24 3
大学院時代
GPUいじったり
MIPS プロセッサ
作ったり
電力測ってみたり…
海外の学会行ったり
2015/02/24 4
GPUコンピューティング
• GPU
– 画像処理専用のコプロセッサ
– クライアントサイドでは利用が当たり前
• スマホ・PCに標準搭載
• ゲームでは高度な3D表現の実現に欠かせない
• 今日の話
– HPC・スパコン等サーバサイドでのGPUの利用
2015/02/24 5
なぜCPUじゃダメなのか
2015/02/24 6
スパコンの総消費電力
• システム大規模化に伴い総消費電力が増大
• 世界一のスパコンは17MW消費する (2014年11月)
電力供給系と冷却システムが建設費・運用費を圧迫.
List release
Averagepower
0
100
200
300
400
500
600
700
2007_11
2008_02
2008_06
2008_11
2009_06
2009_11
2010_06
2010_11
2011_06
2011_11
700
600
500
400
300
200
100
0
電力
(Kwatt)
年-月
07-11 07-6 08-11 08-6 09-11 09-6 09-11 10-6 10-11 11-6
性能1~500位のスパコンの平均消費電力の推移 (Data from Green 500 List)
2015/02/24 7
*Internet Data Centerも事情は同じ
• 節電のためにIDCを寒冷地に作ったりは有名
– 冷却システムのコストを下げるため
2015/02/24 8
Facebook スウェーデン さくら 石狩DC
高い電力効率を持つGPU
Haswell EP (CPU) Tesla K40 (GPU)
コア数 18コア 2880 コア
周波数 3.1 GHz 745Hz
消費電力 160W 235W
理論性能(単精度) 992 GFLOPS 4290 GFLOPS
GFLOPS/Watt 6.2 GFLOPS/W 18.3 GFLOPS/W
2015/02/24 9
並列処理に特化した構造
• 低周波数コアによる並列処理は電力効率が良い
– 電力は周波数に対して3乗で増大.
– 一方で並列に2つ並べる場合は線形で済む.
大きくて高周波
数のプロセッサ
低周波数でシンプ
ルなプロセッサ
電力効率↑
2015/02/24 10
CPU GPU
スパコン Top5
(1位, 2位はGPU型のアーキテクチャを採用.)
2015/02/24 11
AWS GPU Instance
2015/02/24 12
AWSでもGPUサーバはすでに利用可能.
GPUプログラミング
2015/02/24 13
CUDA SDK OpenCL SDK
Intel
Xeon Phi,
CPU
GPU
(AMD,NVIDIA
ARM)
FPGA
(Altera)NVIDIA GPU
基本的にはCUDA or OpenCLの二択
GPUプログラミング
2015/02/24 14
CUDA SDK OpenCL SDK
GPU
(AMD,NVIDIA
ARM)
FPGA
(Altera)NVIDIA GPU
基本的にはCUDA or OpenCLの二択
○ 書きやすく、 ライブラ
リ・
ツールがそろっている
× NVIDIA社のGPUで
しか動かない
○ いろいろなデバイス上で動作する
× 記法がよりめんどくさく、いろいろ
そろっていない
Intel
Xeon Phi,
CPU
プログラミングモデル
• ホスト – デバイス型
– CPU: データ転送およびGPUの制御
– GPU: 実際に処理を行う
2015/02/24 15
CPU
GPU
Memory
Main
Memory
GPU
Input
並列処理
output
カーネル関数
• C/C++の拡張記法で並列処理を記述
– CPU側のコードでカーネル関数を呼び出す
2015/02/24 16
CUDA : 配列の足し算を実現するカーネル関数
CUDA, OpenCL以外の方法
• ソフトウェアツールへの組み込み
– Photoshop, Matlab, R
• PyCUDA
– PythonからCUDAのカーネル関数を呼び出せる
• OpenACC
– C 言語に指示文を追加してGPUを利用
– ちな、自分のD論はこれを拡張してごにょごにょしたよって話
2015/02/24 17
最近の話題
• 自動車 : Audi Self-Piloted Car
– http://blogs.nvidia.com/blog/2015/01/06/audi-tegra-
x1/
• Deep Learning
– Facebook : Torch (Deep Learning Library)
• http://torch.ch/
• 検索サーバ
– Microsoft : Bing サーバでのFPGA利用
A Reconfigurable Fabric for Accelerating Large-Scale Datacenter Service,
ISCA 2014
2015/02/24 18
興味を持ったら
2015/02/24 19
https://developer.nvidia.com/cuda-zone

Weitere ähnliche Inhalte

Ähnlich wie CUDA & OpenCL GPUコンピューティングって何?

Open design computer project(boost)
Open design computer project(boost)Open design computer project(boost)
Open design computer project(boost)
Ito Takahiro
 
2013 11-09 デスクトップ・アプリの価値を高めるモダン化
2013 11-09 デスクトップ・アプリの価値を高めるモダン化2013 11-09 デスクトップ・アプリの価値を高めるモダン化
2013 11-09 デスクトップ・アプリの価値を高めるモダン化
Hiroyuki Mori
 

Ähnlich wie CUDA & OpenCL GPUコンピューティングって何? (20)

マイクロソフトのPower Platformが描く、広島の世界
マイクロソフトのPower Platformが描く、広島の世界マイクロソフトのPower Platformが描く、広島の世界
マイクロソフトのPower Platformが描く、広島の世界
 
Open design computer project(boost)
Open design computer project(boost)Open design computer project(boost)
Open design computer project(boost)
 
私とOSSの25年
私とOSSの25年私とOSSの25年
私とOSSの25年
 
DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術DRIVE CHARTを支えるAI技術
DRIVE CHARTを支えるAI技術
 
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティスGPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
GPU on OpenStack 〜GPUインターナルクラウドのベストプラクティス
 
SoftLayer最新動向と賢い利用方法
SoftLayer最新動向と賢い利用方法 SoftLayer最新動向と賢い利用方法
SoftLayer最新動向と賢い利用方法
 
2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」
2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」 2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」
2016年11月19日 AITCシニア技術者勉強会 第1回「Arduinoを使ってみる」
 
0 open capi_meetup20190225
0 open capi_meetup201902250 open capi_meetup20190225
0 open capi_meetup20190225
 
DSR 2014 Osaka セミナー資料:エンジニアリング領域におけるKELシンクライアントソリューションのご紹介
DSR 2014 Osaka セミナー資料:エンジニアリング領域におけるKELシンクライアントソリューションのご紹介DSR 2014 Osaka セミナー資料:エンジニアリング領域におけるKELシンクライアントソリューションのご紹介
DSR 2014 Osaka セミナー資料:エンジニアリング領域におけるKELシンクライアントソリューションのご紹介
 
サーバーからデスクトップへ広がる仮想化技術の活用法
サーバーからデスクトップへ広がる仮想化技術の活用法サーバーからデスクトップへ広がる仮想化技術の活用法
サーバーからデスクトップへ広がる仮想化技術の活用法
 
OSS光と闇
OSS光と闇OSS光と闇
OSS光と闇
 
Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)Open capi meetup20180409 (revised)
Open capi meetup20180409 (revised)
 
コンパレータを使ってみよう
コンパレータを使ってみようコンパレータを使ってみよう
コンパレータを使ってみよう
 
人前で話すことは “特別” ではない!~ 特別にしない方法について ~
人前で話すことは “特別” ではない!~ 特別にしない方法について ~人前で話すことは “特別” ではない!~ 特別にしない方法について ~
人前で話すことは “特別” ではない!~ 特別にしない方法について ~
 
機械学習環境にハマってみよう
機械学習環境にハマってみよう機械学習環境にハマってみよう
機械学習環境にハマってみよう
 
Introduction to NetOpsCoding
Introduction to NetOpsCodingIntroduction to NetOpsCoding
Introduction to NetOpsCoding
 
Cloud operator days tokyo 2020講演資料_少人数チームでの機械学習製品の効率的な開発と運用
Cloud operator days tokyo 2020講演資料_少人数チームでの機械学習製品の効率的な開発と運用Cloud operator days tokyo 2020講演資料_少人数チームでの機械学習製品の効率的な開発と運用
Cloud operator days tokyo 2020講演資料_少人数チームでの機械学習製品の効率的な開発と運用
 
Caffeのデータレイヤで夢が広がる話
Caffeのデータレイヤで夢が広がる話Caffeのデータレイヤで夢が広がる話
Caffeのデータレイヤで夢が広がる話
 
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
 
2013 11-09 デスクトップ・アプリの価値を高めるモダン化
2013 11-09 デスクトップ・アプリの価値を高めるモダン化2013 11-09 デスクトップ・アプリの価値を高めるモダン化
2013 11-09 デスクトップ・アプリの価値を高めるモダン化
 

Mehr von Toshiya Komoda (6)

5分で分かるselenium conference berlin 2017
5分で分かるselenium conference berlin 20175分で分かるselenium conference berlin 2017
5分で分かるselenium conference berlin 2017
 
Introduce Machine Learning into UI Tests
Introduce Machine Learning into UI TestsIntroduce Machine Learning into UI Tests
Introduce Machine Learning into UI Tests
 
selenimu commiter day 2017: Methods to Sustain Long Term Operations of E2E Au...
selenimu commiter day 2017: Methods to Sustain Long Term Operations of E2E Au...selenimu commiter day 2017: Methods to Sustain Long Term Operations of E2E Au...
selenimu commiter day 2017: Methods to Sustain Long Term Operations of E2E Au...
 
Micro12勉強会 20130303
Micro12勉強会 20130303Micro12勉強会 20130303
Micro12勉強会 20130303
 
20130126 sc12-reading
20130126 sc12-reading20130126 sc12-reading
20130126 sc12-reading
 
2012 1203-researchers-cafe
2012 1203-researchers-cafe2012 1203-researchers-cafe
2012 1203-researchers-cafe
 

Kürzlich hochgeladen

Kürzlich hochgeladen (11)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 

CUDA & OpenCL GPUコンピューティングって何?