170 likes | 416 Views
以 64 位元北歐武夫電腦叢集 進行第一原理計算. 國立高雄應用科技大學 電機研究所 學生 : 王毓閔. Abstract. 本文主要介紹輔仁大學物理系奈米科學模擬研究室 (NSSL) 建置個人電腦叢集之經驗、心得,以及效能測試結果,並且介紹在此研究室的個人電腦叢集上安裝測試的第一原理計算程式與運算效能。最後計算了幾個半導體典型的 範例,驗證此計算平台之性能。. Outline. Introduction 第一原則計算 (first principles) -- 密度泛函理論 (DFT) 北歐武夫 (Beowulf) 個人電腦叢集建置 系統效能測試
E N D
以64位元北歐武夫電腦叢集進行第一原理計算 國立高雄應用科技大學 電機研究所 學生:王毓閔
Abstract 本文主要介紹輔仁大學物理系奈米科學模擬研究室(NSSL)建置個人電腦叢集之經驗、心得,以及效能測試結果,並且介紹在此研究室的個人電腦叢集上安裝測試的第一原理計算程式與運算效能。最後計算了幾個半導體典型的 範例,驗證此計算平台之性能。
Outline • Introduction • 第一原則計算(first principles) --密度泛函理論(DFT) • 北歐武夫(Beowulf) • 個人電腦叢集建置 • 系統效能測試 • CPU 運算效能(硬體架構) • 比較目前常用在連接叢集電腦的網路架構頻寬 • High-Performance Linpack (HPL) • NAS Parallel Benchmark (NPB) • 第一原理計算軟體測試(ABINIT and VASP) • 未來展望
Introduction • 奈米材料由於其微觀結構在如此小的尺度下,古典理論已不敷使 用,量子效應(Quantum effect)成為不可忽視的因素。 • 微觀結構對瞭解材料的電子結構、光學性質、溫度的影響、磁特 性、 機械特性..等,具有關鍵性的影響力。 • 在奈米科技研究上,數值模擬愈來愈受人重視。 • 模擬的計算量日趨龐大,我們可能會遇到記憶體不足、運算速率 慢,常常需要花費大量時間在電腦模擬上等問題。 • 購置高速運算效能的超級電腦。 • 向國家高速網路與計算中心(NCHC)申請使用帳號。 • 個人電腦叢集是一個既可以滿足高速運算的需求,又可以節省大量經費的解決方案,而且也不需要與其他使用者排隊等待執行程式。
第一原則計算 -- 密度泛函理論(Density Functional Theory, DFT ) 利用量子力學來研究電子體的微結構 • 理論與模型 • 數值計算法和執行程式 • 電腦
北歐武夫(Beowulf)電腦叢集http://www.beowulf.org/overview/index.html北歐武夫(Beowulf)電腦叢集http://www.beowulf.org/overview/index.html • 指利用一般市面上現有的商品化硬體設備,在一般電腦賣場都可以取得。 • 包括個人電腦及網路等相關產品所組成,所有的設備,包括軟硬體,都不是經過特殊設計;專門只為某特定廠商或某特定產品所生產。 • 1994年,NASA為了進行地球與太空科學研究計畫,而嘗試用低廉且易得的電腦相關零件,來組裝可支援平行計算的電腦系統,以應付該計畫所需處理的大量資訊處理與計算。 • 十六個Intel 100 MHz DX4 • 網路則為10Mbits/s Ethernet • 作業系統採用Linux,平行運算與資料傳輸用MPI • 組裝成一個Cluster,並取名為Beowulf(戰狼或北歐武夫)
Master內有兩張網卡,一張公用IP對外,另一張私有IP對內Master內有兩張網卡,一張公用IP對外,另一張私有IP對內 個人電腦叢集建置
系統效能測試 • 影響系統整體運算效能的因素有 : • CPU 運算效能(硬體架構) • 主記憶頻寬 • 訊息傳遞速度 • PCI 匯流速度 • 所解線性方程組大小與數學函式 庫(BLAS)的選擇
CPU 運算效能(硬體架構) • 實際上CPU 的內頻並不能反映出真正的效能,不同設計架構的CPU 在執行不同特性的程式時,會有不同的表現。 • 測試結果不能完全反映出所有應用程式真正的執行效率,但有一定的客觀性來反映運算的效能。
Gigabit目前產品漸趨成熟,且價格也較之前便宜許多,目前愈來愈普及化。Gigabit目前產品漸趨成熟,且價格也較之前便宜許多,目前愈來愈普及化。 極高速的網路設備, 但是價格極為昂貴。 比較目前常用在連接叢集電腦的網路架構頻寬
High-Performance Linpack (HPL) • HPL 藉由解一個大尺度的線性方程組 Ax = b ( A 是一個N × N 的矩陣)來量測效能,讓使用者依據自已的系統(如:記憶體容量等)調整所解的問題大小,對整個機器做最佳化,以能得到機器的最佳效能測試結果來做為評斷的依據。TOP500 list 也是使用HPL。 • Rmax:以HPL 所測得最大的效能 • Rpeak:為理論上的效能,即每個運算週期可執行的指令數 x 處理器真實內頻 x 處理器數量 • (IPC x Frequency x Number of processors) • Rpeak= 2HZ × 1.8GHz × 16 = 57.6Gflops • 與Formosa cluster相比,平行的效能並不算差 • BLAS (基本線性代數常式) • GOTO函式庫所測得的效能較ATLAS來得高,但未提供Athlon 64的函數庫。
NAS Parallel Benchmark (NPB) • NPB 由NASA 所開發,其為解流體力學的應用演化而來,共由八組程式所組成,這八組程式分別為:IS、FT、EP、MG、CG、LU、SP 及BT,現在已經被廣泛應用於平行電腦的效能測試比較。 顯示網路頻寬對本次 的測試結果影響很大 顯示網路頻寬對處理器 數量較多時,影響較大
第一原理計算軟體測試(ABINIT) • 能帶結構與態密度
第一原理計算軟體測試(VASP) • 矽晶體的態密度(Density of States): 半導體材料在單位體積內,所擁有的電洞或電子數
未來展望 • 個人電腦叢集帶給使用者的高效能與經濟效益成功地吸引許多人投入相關的研究。 • 北歐武夫電腦叢集已進入64位元時代,因此,能提升各種利用第一原理程式的模擬的時間與效能。