Performance of a Semi-Implicit,Semi-Lagrangian Dynamical Corefor High Resolution NWP overComplex Terrain
 
L.Bonaventura                 D.Cesari
C:\luca\Seminari\langen2002\Arpino.gif

MPI_Tr.jpg                                                     00005CCBAttachments                    B2722813:
Outline of discretization approach
Semi-implicit, semi-lagrangian two time leveldiscretization  (2d tests: Bonaventura JCP 2000)
Finite volume approach for the divergence
Weakly nonlinear system Ax+f(x)=b,  symmetricand well-conditioned for any orography
2nd order in time, 4th order in space SLadvection scheme
Improved interpolation at the boundary for SLadvection (joint work with  G.Rosatti, Universityof Trento)
Computational grid
C:\luca\seminari\preslm_z\lb_z.gif
C:\luca\seminari\preslm_z\cutcell.gif
Application to open channel flow
C:\luca\seminari\hct.gif
C:\luca\seminari\unif_h_linf.png
2D Gallus-Klemp lee wave test case
C:\luca\seminari\gk_hv.png
C:\luca\seminari\gk_vv.png
C:\luca\seminari\brig\gk500_vort.gif
Vorticity=O(10e-4)
3D linear lee waves
C:\luca\seminari\langen2002\prova5.gif
C:\luca\seminari\langen2002\siz_nhs2.gif
Setup of tests for comparison ofnumerical efficiency
180*180*40 =O(1.3e+6) gridpoints
dx=2 km, dz=300 m, dt=40 s
Some 1000 m high mountains
A -8 K temperature anomaly (cold bubble) on top ofeach mountain
IBM SP4 of CINECA (48 nodes with 16 CPUs each,1.5  Ghz for each CPU)
native xlf90 compiler and all standard optimizationsswitched on
Comparison against LokalModell of DWD
C:\luca\seminari\oro.png
C:\luca\seminari\brig\bolla1h.gif
Parallel run with 16 processors
TotalCPUtimefor 1hour
CPUtimesolver
COMMtime solver
CPU timeadvection
COMMtimeadvection
Fastest
/slowest
 ratio
SE
328 s
91 s
13.4 s
156 s
40.8 s
1.07
SIZ
207 s
119 s
13.4 s
65.4 s
7.4 s
1.02
Parallel run with 36 processors(3D lee wave test)
Total CPUtime for 1hour
CPU timesolver
COMM
timesolver
Fastest
/slowest
 ratio
SE
 88.95 s
 45.03 s
 11.95 s
1.4 s
SIZ
 56.40 s
 26.16 s
 5.12 s
 1.03 s
Comparison of speed up
C:\luca\seminari\brig\scalesiz2.bmp
Comparison with terrainfollowing semi-implicit LM
Difficulty of a fair comparison (different stoppingcriteria and implementation details)
Slower convergence of iterative solver for terrainfollowing semi-implicit
Residual  1%
of initialvalue
Residual0.1% ofinitial value
Residual0.01% ofinitial value
SI iterations
6
21
50
SIZ iterations
8
17
21
Conclusions
Semi-implicit, semi-lagrangian methodusing finite volume discretization of thedivergence and improved lowerboundary condition
Gain in efficiency over terrain followingcoordinates, good parallel performance
Development plans
Further testing (Boulder storm, Scania test)
ARPA-SMR: development of a full SI-SLNWP model in the framework of the COSMOconsortium adapting the LokalModell physics
MPI: test tube for numerical methods to beused in ICON, the new global nonhydrostaticdynamical core
C:\luca\seminari\h_test5_g5_day10_dt1800.gif