|
設計超級計算機的創新設計在於把複雜的工作細分為可以同時處理的工作並分配於不同的處理器。他們在進行特定的運算方面表現突出,但在處理一般工作時卻差強人意。他們的資料結構是經過精心設計來確保數據及指令及時送達——傳遞速度的細微差別可以導致運算能力的巨大差別。其輸入/輸出系統也有特殊設計來提供高頻寬,但是這裡的數據傳輸延遲卻並不重要——超級計算機並非數據交換機。4 P8 y% F, `6 Y& J7 {1 Q
! @$ S" R* u. [% g3 e根據阿姆達爾定律,超級計算機的設計都集中在減少軟體上的序列化、用硬體在瓶頸上加速。
! D, F! A! Q8 `* n$ j( C& d ? G4 S+ x0 Y9 q; I8 ?, [
[编辑] 挑戰與科技超級計算機常產生高熱,需要冷卻。冷卻是很大的通風空調[4]問題。1 D) v! S. j6 l
資訊傳送不能比光快。幾米的距離導致幾十奈秒的延誤,而克雷著名的環型設計保持了最短距離。
( P7 s& x2 G. ]* v' U6 [( W) E超級計算機在短時間耗用及生產大量數據,需要投入很多資源確保資訊妥善傳送及存取。
0 l S* Z) R7 o- Y( s因超級計算機而開發的科技:$ c- F. u0 Z6 s& j% d
' ^5 f8 i# p8 r( o矢量處理器 c( L) A, Q$ f8 Q1 {
水冷技術4 n; Y; x* H6 P! ]5 I" N
非均勻訪存模型(NUMA)
' m4 S) K- I$ V/ b[编辑] 處理器技術矢量處理因超級計算機而建立並用於高性能運算。矢量處理技術後來被用於普通電腦內的信號處理架構及單指令流多數據流(SIMD),例如:電視遊樂器、通用圖形處理器(GPGPU)等。[5]
" y4 a) z. j( }* P4 g6 S2 H, z; y/ q0 U
[编辑] 作業系統一般的超級電腦都使用Linux作業系統,但在講求絕對高效能的操作環境時,超級電腦開發人員會動用特別的輕量級核心(Light Weight Kernel- LWK),減少中斷請求、行程間通訊等開銷以提高效能。[6]6 c& L( ^2 `+ F. v1 P' H* f0 l
; Y$ K3 o& ?' A/ `輕量級核心包括 Cray XT3 的 Catamount[7], Cray XT4 的 CNL (Compute Node Linux)[8], 以及IBM藍色基因的 CNK (Compute Node Kernel)。[9]
. s8 k8 g" t' ^2 O) d; l- |
9 w4 O& {8 R. Y3 F% C5 U[编辑] 編程環境訊息傳遞介面 (MPI)及較舊的並列虛擬機器(PVM)常用於非共享內存系統(Distributed Memory System),而OpenMP常用於共享內存並行系統。[10] [11]
, G& [0 y( D- ] P0 M, g
# y( n4 p `3 |% x) Q% u傳統上Fortran的編譯器可以產生比C或C++更高效能目的碼,所以Fortran仍然被使用作科學編程。! {9 F* Y' Z; T9 M
9 \) N7 l$ W6 g[编辑] 優化編譯器超級電腦需要編譯器優化技術以產生優佳的目的碼,現今的優化編譯器都對向量化(Vectorization)、程式迴圈(Loop Optimization)、記憶體階層及數據局部性進行優化。[12] [13] [14]7 d- S1 @4 _7 J9 f3 x: x# e
1 [1 E5 v' v! h1 Y此外,優化編譯器都以高層次的中間表示(Intermediate Representation)優化程式 - 包括Open64編譯器的WHIRL、[15] IBM XL 編譯器的 Wcode。[16]
" q+ n3 @$ c& `, _/ E, Z2 ?+ C1 @0 ]: {4 o7 U J% P( \! V
[编辑] 數學函數庫超級電腦主要執行科學運算等擁有大量向量及矩陣浮點計算的程式,因此優佳化常用的數學函數會提高運算效能。BLAS函數庫使向量及矩陣浮點計算效能大大提高,[17] [18] 而優佳化數學函數庫則提高三角函數及平方根等數學運算。[19]6 E. j: x7 t4 {
" M5 y3 u9 }+ q' i
[编辑] 平行檔案系統平行檔案系統支援多客戶端節點、多伺檔案系統服器,以及支援平行I/O (如 MPI-IO、HDF5);現今流行的平行檔案系統包括Lustre和PVFS。[20]
) U; G7 D% d1 |$ C' @6 U, d O6 D( N G- B( y+ Y3 W& S
[编辑] 網路技術超級電腦節點之間的通信一般都需要使用高性能的網路介面,現今大多TOP500的超級電腦使用乙太網路(44.8%)及InfiniBand(41.8%)。 [21]
8 g/ K: z* d/ x1 Q P
* {9 g3 C3 P# T7 n, N7 }" ~傳統上InfiniBand比乙太網路有更高的頻寬,同時因作業系統呼叫省略(Operating System Bypass)而提供更低的延遲時間(latency);然而2011年思科系統開發VFIO技術於超級電腦和叢集應用,使一般的乙太網路介面也能提供低延遲時間,從而提升乙太網路在超級電腦的應用層面。[22] |
|