20. 長距離相互作用 Ewald法
• Ewald法のよるポテンシャル
CMSI計算科学技術特論A
(1) (2) (3)
N N N NV V V V
(1)
0
erfc( | |)1
2 4 | |
i j i j
N
i ji j
Q Q L
V
L
n
r r n
r r n
′
2 22 2
(2)
3 2
00
1 exp( | | /4 )
cos sin
2 | |
i i i iN
i i
V Q Q
L
G
G
G r G r
G
2
(3)
04
i
N
i
Q
V
bookkeeping法
セルインデックス法
Gについてのループ分割 → PMEによる高速化
実空間での相互作用
LJと一緒に計算する
21. 2
2
(2)
3 2
00
3
00
| |
exp
1 4
exp( ) exp( )
2 | |
1
( ) ( ) ( )
2
i i j jN
i j
V Q i Q i
L
H S S
L
G
G
G
G r G r
G
G G G
2
2
2
exp
4
( )H
G
G
G
( ) exp( )i i
i
S Q i G G r
ˆ( ) ( ) exp( )S S i
u
G u G u
(2)
3
0
1 ˆ ˆˆ ( ) ( )
2
NV H S S
L
u
u u
逆格子ベクトルの項は
S(G)を毎ステップ計算しなければならない。
S(G)を格子点uにおける補間を用いて表現すると
S(G)の計算に補間法を利用(格子点で評価)
高速フーリエ変換(FFT)利用 O(NlogN)
Particle mesh Ewald(PME)法
となる。ここでS(u)はS(G)のuにおける重み因子。これにより
24. Multiple time step
• 同じMD計算のなかで変化の速いものと遅いものがある場
合には,速い変化のほうに対応した小さなΔtを選択しなけ
ればならない.
• Hに対する運動方程式とほかの重い原子に対する運動方
程式を区別して,異なったΔtで解くことができれば非常に
都合のよい(部分的にΔtを大きくできる)ことになる.この
考え方に基づいた方法がMultiple time step法である.
CMSI計算科学技術特論A
例
United atomのブチルアルコールのフレキシブルモデル
CH3-CH2-CH2-CH2-O-H
2fst
0.1fst
25. Multiple time step
• 時間発展演算子法により、重い(遅い)運動と軽
い(速い)運動とを分離して数値積分する。
• 時間発展演算子法
CMSI計算科学技術特論A
リウビル演算子 L
時間発展演算子
異なる自由度など2つの部分に分離できると
/ 2 / 2 3
e e e e O( )p pr
i t i ti t i t
t
L LL L
=
26. Multiple time step
• 時間発展演算子法により、重い(遅い)運動と
軽い(速い)運動とを分離して数値積分する。
CMSI計算科学技術特論A
リウビル演算子 L
時間発展演算子
/ 2 / 2
/ 2 2 2 / 2
e e e e
e e e e e
heavy r light heavy
heavy light light heavyr
i t i t i ti t
ni t i t t i t i ti t
L L L LL
L L L LL
27. On the fly による最適化
CMSI計算科学技術特論A
0 pol
U U U
pol
1
2
i i i i
i i
U
E μ μ μ
• 第一原理MD(Car-Parrinello法)
• 電荷揺らぎモデル(TIP4P-FQ、SPC-FQモデル)
• 分極モデル(点双極子モデル)
• 最適値を得るために繰り返し計算を必要する変数を含む
• 繰り返し計算を行わず、最適値近傍を動的に揺らがせる近似解で満足できる場合
• その変数に仮想的な慣性量、運動エネルギーを与えて運動方程式を解く。
• 繰り返し計算がなくなるため高速化が可能。
• 運動エネルギーの相当する分だけ最適値からずれて、誤差が生じる。
i ij i
E T μ
i i
μ E
2 2
1 1
1 1
,
2 2
N N
N N
i i
i i
L mr M U
r μ
,
N N i
i i
M L
μ
μ r μ E
分極モデル 拡張系のラグラジアン
粒子と双極子モーメントの自由度がある。
双極子モーメントの運動方程式
28. 高速化のために
遅い演算(除算と組み込み関数)
• 除算は他の四則演算より遅い。
• 組み込み関数も時間のかかる演算である。
• ホットスポット内ではできるだけこれらの演算を減らすように工夫
する。
CMSI計算科学技術特論A
do i=1,n
b(i)=a(i)/x
enddo
y=1.d0/x
do i=1,n
b(i)=a(i)*y
enddo
除算をループの
外へ移動
do i=1,n
x(i)=a(i)/b(i)/c(i)
enddo
do i=1,n
x(i)=a(i)/(b(i)*c(i))
enddo
除算を乗算に変更
do i=1,n
x(i)=a(i)/b(i)
y(i)=c(i)/d(i)
enddo
do i=1,n
tmp=1.d0/(b(i)*d(i))
x(i)=a(i)*d(i)*tmp
y(i)=c(i)*b(i)*tmp
enddo
通分の利用
35. 高速多重極展開法(FMM)
• 多極子モーメントを用いた多重極展開
CMSI計算科学技術特論A
2 2 2
1 1 1
2 cos
1 2 cos
i i i i i i
i
r r r r r r r
r
r r
1x
2 3
2 3
2 3 4
1 1
cos 3 cos 1 5 cos 3 cos
2 2
i i i
i i i i
i
r r r
r r r r r
2 31 1 3 5
1
2 8 161
x x x
x
原点0の周りに電荷Qiが分布
QiとQとの相互作用を
多重極展開で表す。
余弦定理
テイラー展開
36. 高速多重極展開法(FMM)
• QiとQとの相互作用の多極子モーメントを用いた表式
CMSI計算科学技術特論A
0
2
2
2 3
0
2
3 5
0
3 5
0
1
4
1 1
cos 3 cos 1
4 2
1 1 1 1
3
4 2
1
4
i
ii
i i
i i i
i
i
i
i i i i i i
i i
QQ
V
r
r r
Q Q
r r r
Q
Q Q Q r
r r r
Z
Q
r r r
r r r r r I r
r μ r Q r
2
3
2
i
i
i i
i
i
i i i
i
Z Q
Q
Q
r
μ r
Q r r I
1 1
cos
n
i
n i
i n
r
P
r r r
0
1
cos
4
n
i
i n i
i n
Q r
V Q P
r r
Legendre多項式を用いた表式
展開のしかた
・多極子モーメント
・Legendre多項式
・球面調和関数
等々
44. Hess et al. (2008)
DHFR in water
23,558 原子系
rc = 9.6 Å GROMACS
9 Å Desmond
9 Å NAMD
FFT : 64× 64×64
t = 1 fs
PCクラスタを用いたベンチマーク
: : Desmond (2008)
24,000 原子系 100~500並列 1~2 ms/step
(50~200 atoms / processors)
8コア(1ノード)の使用と比較して512コア(64ノード)で、すでに30%程度の並列化効率
CMSI計算科学技術特論A
45. ANTONのパフォーマンス (専用マシン)
DHFR 23,558 原子系 force error 1.5×10-4
Shaw et al. (2008)
512 ノード並列 14.5 s/day
1 ms / 70 days
24,000原子系
512並列
~6 s/step
400 MHz
CMSI計算科学技術特論A
46. Schulten et al. (2008)
NAMDのパフォーマンス on Blue Gene/L
IAPP 5,570 原子系
cutoff 12 Å t = 2 fs
ApoA1 92,224 原子系
cutoff 12 Å t = 1 fs
STMV 1,066,628 原子系
cutoff 12 Å t = 1 fs
1,000,000原子系
~20,000(40,000)並列
~15 ms/step
10 ms/step
(coprocessor mode)
(50 atoms / processors)
2 ms/step
対数プロット
CMSI計算科学技術特論A
47. i s
s i
i s
s i
s
s i
Q q
q
q
s
i s s
r
r r 局所展開
×
××
+
多極子展開
局所展開
・
・
・
MODYLAS
実質的に FFT free !並列化
・完全領域分割
・多階層隣接通信化
+ 周期境界条件下における
多極子に対するエワルド法
大きな通信はすべて隣接通信化
= 厳密計算
(精度は展開次数で制御)
長距離力の厳密計算
多極子展開
××
ii
××
ii
×
多極子展開
CMSI計算科学技術特論A
49. ベンチマークテスト MODYLAS
100 1000 10000 100000
0.1
1
10
100
1000
10000
1000 10000 100000 1000000
0.1
1
10
100
1000
10000
T/ms
Ncore
Nnode
acceleration
100 1000 10000 100000
0.1
1
10
100
1000
10000
1000 10000 100000 1000000
T/ms
Ncore
Nnode
The measured direct calculation time of the pairwise
additive forces(circle), the FMM calculation(triangle),
the intramolecular forces(diamond), and the
communication time(brown) per one MD step(Dt)
for the 10-million atomistic system, the PYP solution,
as a function of degree of parallelism, Nnode.
The measured overall calculation time
per one MD step(Dt) for the 10-million
atomistic system, the PYP solution, and
the acceleration ratio with respect to the
64-nodes calculation as a function of
degree of parallelism, Nnode.
pairwise additive forces
FMM calculation
intramolecular forces
communication time
PYP 水溶液、1000万原子系
CMSI計算科学技術特論A
52. 参考文献
MD全般
• D. Frenkel, B. Smit,“Understanding Molecular Simulation," Academic Press, San Diego(1996).
• 上田 顕,「コンピュータシミュレーション」,朝倉書店(1990).
• M. P. Allen, D. J. Tildesley,“ Computer Simulation of Liquids," Oxford Science, Oxford(1987).
• J. P. Hansen, I. R. McDonald, “Theory of Simple Liquids," Academic Press, London(1986).
• 岡崎 進, 吉井 範行, コンピュータ・シミュレーションの基礎(第2版), 化学同人(2011).
力学
• H. Goldstein,「ゴールドスタイン新版古典力学(上),(下)」(瀬川富士,矢野 忠,江沢康生 訳),
吉岡書店(1983).
数値積分
• G. J. Martyna, M. E. Tuckerman, D. J. Tobias, M. L. Klein, Mol. Phys., 87,1117(1996).
Particle mesh Ewald法
• T. Darden, D. York, L. Pedersen, J. Chem. Phys., 98,10089(1993).
FMM
• L. Greengard, V. Rokhlin, J. Comput. Phys., 73,325(1987).
SHAKE
• G. Ciccotti, J. P. Ryckaert, Comp. Phys. Rep., 4,345(1986).
• P. Gonnet, J. Comput. Phys. 220, 740(2007).
MODYLAS
• Y. Andoh, et al., J. Chem. Theory Comput. 9, 3201( 2013)
• Y. Andoh, et al., J.Chem. Phys. 141, 165101 (2014).
CMSI計算科学技術特論A