HLRN 為 HPC 帶來先進的性能

HLRN 選擇了英特爾? 至強? 鉑金 9200 處理器來滿足其對 HPC 工作負載日益多樣化的需求。

要點綜述
HLRN 超級計算機已被 100 多所大學和 120 多家研究機構所使用,以此探索科學研究的許多前沿領域,幫助開啟更美好的未來。經過詳細測試并找到最佳解決方案之后,選擇了英特爾最新的處理器技術來為下一代 HLRN 超級計算機提供支持。教授.廷根大學的 Ramin Yahyapour 教授解釋說:“對 HLRN 超級計算機的期望是為新實驗大幅提升計算機性能。“

挑戰
Ramin Yahyapour 教授說:“總體而言,科學正變得越來越需要大量計算和數據。這意味著科學家擁有更大的系統就有能力做得更好。這就是 HLRN 對科學研究至關重要的原因。”

HLRN 聲稱自己是一個非常苛刻的客戶 — HLRN 先前部署了 3 個超級計算機系統,因此擁有豐富的專業知識。教授.Zusu 研究所的 Alexander?Reinefeld?教授強調說:”我們期望所有基準性能測試應用程序都具有最高的性能。我們精心選擇了基準性能測試套件,這樣每個代碼都給系統的特定部分帶來了挑戰,比如 CPU、通信網絡和并行 I/O。我們并不是在尋求最佳的理論性能,而是需要真實的系統性能,這會使供應商為我們的應用程序優化基礎設施變得更加復雜。這就意味著我們選擇合適的處理器和正確的互連方式對于整體性能至關重要。”

與當今的大多數研究一樣,對計算機實際能力的更多需求源于這樣的現實,即各種各樣的模擬對于研究人員來說非常關鍵。更快的計算機主要用于增加模擬的大小和分辨率,以期找到新的發現。

“我們需要真實的系統性能……這就意味著我們選擇合適的處理器和正確的互連方式對于整體性能至關重要。”— Reinefeld 教授

解決方案
HLRN 購買了一臺新的超級計算機,其內核數量不足 25 萬個。英特爾? 至強? 鉑金 9200 處理器(來自第二代英特爾? 至強? 可擴展處理器家族)將作為”合適的處理器“為 HLRN 提供服務。對于“正確的互連方式”,HLRN 選擇了英特爾? Omni-Path 架構(英特爾? OPA)。該系統由 Atos(前身為 Bull Computing)打造,并將在物理上由柏林 Zuse 研究所 (ZIB) 和哥廷根大學分開使用。這些站點以前使用過這個拆分系統模型,并且在柏林與哥廷根之間部署了 170 多英里專用的冗余 10 千兆光纖電纜。

ZIB 的研究人員將 HLRN-IV 用于流體動力學,包括為飛機機翼開發湍流模型。

結果
HLRN 宣布新系統 HLRN-IV 的速度大約是以前系統的 6 倍,可提供 16 PetaFLOP/s 的性能。1研究人員的興奮顯而易見,而正在開展的研究清單也令人難以置信。教授 教授激動地說:“這是一個很棒的系統。我們的用戶將直接從這個功能更強大的系統中受益,而無需更改其代碼。第二代英特爾? 至強? 可擴展處理器的同類架構將提供真正的性能可移植性,這對于我們的研究人員來說是至關重要的一個方面,他們因此可以迅速地從更強大的新系統中受益。“

HLRN 的主要研究領域包括:

  • 地球系統科學— 其中包括氣候變化方面的研究。學科包括海洋、雨林、冰川、南極浮游植物(微藻)、礦物塵埃循環和平流層的動力學。
  • 流體動力學 - 其中包括用于船舶渦輪機、風力渦輪機和飛機機翼的湍流模型。這些模型因需要巨大的計算能力而臭名昭著 — HLRN-IV 將使大型系統能夠運行更細粒度的湍流模擬,例如穿過城市的風或穿過渦輪機葉片的風。通過對完整城市進行建模,可以研究新建筑如何改變風量以及影響城市內各種微氣候的其他因素。這可能會激發新的設計思路,從而改善城市生活。有些研究人員希望能夠理解這些思路,為未來的高升力商用飛機鋪平道路。另一些研究人員則希望通過研究固體散裝貨物(例如鐵礦石或鎳礦石)的液化來挽救生命和船只。由于未能妥善處理這一問題,在過去 10 年中,全球至少損失了 7 艘船。
  • 醫療保健 - 這是一個廣泛的研究領域,HLRN 研究人員希望能以多種方式提供幫助,其中包括改善家庭醫療服務。更好地了解疾病和疾病的治療,將對我們所有人產生影響。研究包括藥物功效、相互作用和副作用的模擬。巨大的計算能力可使這些領域的先鋒研究人員開始探索這些模擬的“個人醫學”方面,而不僅僅是對普通人群的平均影響。

在哥廷根大學,研究領域包括細胞和分子機器的合作項目。

跨多種研究的高性能
在科學界,HLRN 必須為其諸多研究人員提供所有類型的工作負載支持。因此,HLRN 系統需要具有通用系統的特性,但仍具有最高的性能。他們最終選擇沒有加速器。

“盡管我們在采購過程中考慮了包括 GPU 在內的加速器,但在系統中使用 GPU 或其他加速器時所獲得最高性能并沒有優勢。”— ZIB 超級計算主管 Thomas Steinke 博士

HLRN 的基準性能測試是開放的,其中包括可以利用 GPU 的基準性能測試。HLRN 發現,在考慮減少通用計算能力或所涉及的額外成本時,某些工作負載的性能優勢尚顯不足。基于第二代英特爾? 至強? 可擴展處理器的同類系統,證明了自己是滿足 HLRN 科學家和研究人員多樣化需求的最佳選擇。

擊敗阿姆達爾定律
Thomas Steinke 博士始終銘記阿姆達爾定律,特別強調將快速算法用于快速計算機。他認為:“由于第二代英特爾? 至強? 可擴展處理器具有較高的實際性能,所以與以前的多核架構相比,優化代碼以在節點上進行擴展的壓力減小了。“

第二代英特爾? 至強? 可擴展處理器家族為高性能計算 (HPC) 提供了出色的選擇,并幫助程序員應對阿姆達爾定律。

”我們的用戶將直接從這個功能更強大的系統中受益,而無需更改其代碼。”— Reinefeld 教授

AI 在 HPC 領域的未來
AI 和機器學習將影響 HLRN 研究的所有領域。人們感興趣的一個熱門領域是機器學習和 AI 技術與傳統模擬功能的融合。盡管已經獲得一些鼓舞人心的成果,但仍有許多工作要做。對算法的探索可能會帶給研究人員多個方向,而對靈活性的需求是 HLRN 選擇第二代英特爾? 至強? 可擴展處理器來支持其下一代研究的原因之一。

避免數據移動
Yahyapour 教授強調:“CPU 對于人工智能和機器學習非常有用。這是我們看到我們的研究人員有更多需求的一個領域。傳統上,研究人員并不多么忙于數據密集型工作,但是我們認為這是新系統的一個新趨勢,也將引起特別關注。”

事實證明,英特爾?高級矢量擴展 512 (英特爾? AVX-512 )是明智的選擇,它有助于提高 HLRN 的計算能力,并且通過添加英特爾? 深度學習加速(英特爾? DL Boost)來增強 AVX-512,從而為 HPC 應用的新領域提供出色的性能。

對于所有類型的算法,計算數據的能力決定了數據移動的規模。這代表了計算能力的提高,能源浪費的減少。一個雙贏的結果!

在探索新算法和新應用技術時,最重要的就是系統的靈活性。第二代英特爾? 至強? 可擴展處理器可提供高性能,以及應對未來挑戰所需的靈活性。

了解相關英特爾? 產品

英特爾? 至強? 可擴展處理器

借助英特爾? 至強? 可擴展處理器,您能夠推動可行洞察、依靠基于硬件的安全性,并部署動態服務交付。

了解更多

英特爾? 深度學習加速(英特爾? DL Boost)

英特爾? 至強? 可擴展處理器通過英特爾? 深度學習加速(英特爾 DL Boost),將嵌入式 AI 的性能提升到了新的水平。

了解更多 (英文)

英特爾? Omni-Path 架構(英特爾? OPA)

英特爾? Omni-Path 架構(英特爾? OPA )提供了可靠性、高性能和極高的可擴展性,同時降低了系統的總體擁有成本。

了解更多

通知和免責聲明

英特爾? 技術的特性和優勢取決于系統配置,并可能需要支持的硬件、軟件或服務激活。實際性能可能因系統配置的不同而有所差異。沒有任何計算機系統能夠保證絕對安全。請咨詢您的系統制造商或零售商,也可登錄 www.sgtmom.com 獲取更多信息。// 性能測試中使用的軟件和工作負載僅在英特爾? 微處理器上針對性能進行了優化。SYSmark 和 MobileMark 等性能測試使用特定的計算機系統、組件、軟件、操作和功能進行測量。上述任何要素的變動都有可能導致測試結果的變化。您應該查詢其他信息和性能測試,以幫助您對正在考慮購買的產品作出全面的評估,包括該產品在與其他產品結合使用時的性能表現。如欲了解更多完整信息,請訪問 www.sgtmom.com/benchmarks。// 性能結果基于配置中所規定日期的測試,可能無法反映所有公開的安全更新。有關詳細信息,請參見配置信息披露。沒有任何產品或組件能保證絕對安全。// 所描述的成本降低方案僅用作示例,表明某些基于英特爾? 的產品在特定環境和配置下會如何影響未來的成本,并節約成本。環境各不相同。英特爾不保證任何成本和成本的節約。// 英特爾并不控制或審核本文檔引用的第三方基準資料或網站。您應訪問引用的網站,確認參考資料準確無誤。// 在某些測試案例中,結果以英特爾內部分析或架構模擬或建模為基礎來評測或模擬,且僅供參考。您的系統硬件、軟件或配置的任何不同均可能會影響實際性能。

產品和性能信息

1

先前的 HLRN-III 系統由分別位于柏林楚澤研究所和漢諾威萊布尼茨大學 IT 服務部門 (LUIS) 的兩部分綜合設施組成,兩者通過一條專用于 HLRN 的 10GigE 光纖相互連接,以提供“單系統視圖”。計算節點分兩個階段交付,具體為:第一個階段包括兩臺 Cray XC30 計算機,每臺包含 744 個計算節點,總共 1488 個雙插槽英特爾? 至強? 處理器 E5-2695v2 以及 93 TB 主內存,通過采用 Dragonfly 拓撲的快速 Cray Aries 網絡相連接。第二個階段增加了 2064 個英特爾? 至強? 處理器 E5-2680 v3 計算節點,具有 85248 個計算核心。其中柏林有 1872 個計算節點,漢諾威有 1680 個計算節點,提供總計達 2.7 PetaFlops/s 的峰值性能和 222 TB 主內存擴展。

国产女人-国产V女人-女人自拍国产-国产女人ed2k-国产女人bt