HyperWorks - 安捷新科技

【行業焦點】GPU如何加速流體模擬分析？

【行業焦點】GPU如何加速流體模擬分析？

借助於GPU加速計算所提供的非凡應用程序性能，能將CFD程序計算密集部分的工作負載轉移到GPU，同時仍有CPU運行其餘程序代碼，這樣計算速度大大提升。

（一）流體模擬發展趨勢與計算需求

計算流體模擬力學，英文全稱Computational Fluid Dynamics，縮寫為CFD，興起於近50年來，是一門相對年輕的學科。它是數值數學和計算機科學結合的產物，通過空間離散和數值求解的思路，對流體力學的各類問題進行數值實驗、模擬和分析研究，以解決學習、科研或者工程設計中的問題。

作為一個強大的計算工具，CFD在產品研發的諸多環節發揮著重要作用，不僅具有低成本，還可以捕捉到實驗中難以採集的信息，此外，還能提供可控的環境因素和良好的複現性。從CFD的發展趨勢來看，一方面，CFD工具的發展呈現為準確度、自動化、易用性、應用性能的持續提升；另一方面，CFD也與熱學、電化學、聲學等學科不斷融合發展，CFD工具變得更加強大。

面對一個具體的工程問題，CFD工程師在應用CFD工具進行仿真分析時的基本流程，通常可以總結為五步：前處理、網格劃分、邊界條件加載、求解計算和後處理。但如何去平衡計算量（網格數量）和計算時間，對於很多CFD工程師都是個挑戰。

在實際解決問題的過程中，CFD工程師除了希望能選擇一款稱手的軟體工具外，當然也希望計算機的主頻越高越好，核心越多越好。但是，核心與計算速度並非線性關係，不會因為核心等比例增長。若想在單台電腦上發揮極限運算能力，還需要使用GPU加速，因為GPU加速通過協調處理器並行運算，能夠極大地提升計算能力，尤其適合多個項目同時進行，這樣獲得的時間收益較大。

（二）流體模擬為什麼要選擇GPU？

從1970年到今天，CFD始終向處理更高精確度、更複雜的幾何結構方向發展。但現階段，CFD軟件應用於復雜流體問題方面還有待拓展，受到的阻礙主要源自以下三個方面：

¶ 隱式算法的高內存要求

一些CFD分析工程師總是希望得到完美的殘差收斂曲線，以證明計算結果的可靠性，因此，他們會首選隱式算法，這意味著高內存的需求；

¶ CFD結果對網格的強依賴性

網格的合理設計和高質量生成是CFD計算的前提條件，是影響CFD計算結果的最主要的決定性因素之一，是CFD工作中人工工作量最大的部分，也是製約CFD工作效率的瓶頸問題之一。即使在CFD高度發達的國家，網格生成仍佔整個CFD計算任務全部人力時間的70%～80%。

¶ 工程流體仿真問題複雜多變

在流體力學模擬中，由於流體力學模擬是個複雜的過程，存在極端變形、自由液面以及物質運動交界面等問題，在應用網格數值模擬時，會出現網格扭曲導致計算不收斂或者產生很大的計算誤差，需要重新模擬，這使得計算成本大大增加。

從CFD的發展歷程看，CFD的每一步發展，都離不開計算機速度和內存的數量級提升。自1999年NVIDIA發布Geforce256圖形處理芯片以來，NVIDIA的顯卡芯片就開始以GPU稱呼，最早是輔助CPU進行圖形圖像的處理，將降低CPU的運算壓力，後來隨著GPU性能的不斷提升，其應用場景也不斷拓展。近年來，隨著移動計算、工業智能化的發展，GPU開始用於手機、平板電腦到無人機和機器人等平台的應用程序的加速，世界各地實驗室、高校、企業以及科研院的研究人員紛紛採用GPU獲得高性能計算支持，在工業領域，GPU也普遍用於仿真計算加速，尤其在汽車、航空航天、工業設備等多個高科技領域，更是掀起了新一輪的CFD應用熱潮。

那麼，CFD為何要選擇GPU加速呢？這是為了使CFD仿真發揮最大效用，CFD工程師往往需要快速得到計算結果。而藉助於GPU加速計算所提供的非凡應用程序性能，能將CFD程序計算密集部分的工作負載轉移到GPU，同時仍有CPU運行其餘程序代碼，這樣計算速度大大提升。另外，從計算性能來看，在CFD應用中單個GPU的性能遠遠優於CPU，基於GPU加速的CFD計算速度明顯加快，很多複雜的CFD難題得以解決，因此，越來越多的CFD工程師選擇GPU加速。

（三）流體模擬分析GPU選擇分享

CFD是一個計算需求強烈的領域，GPU的選擇將從根本上決定CFD分析過程的體驗。在CFD分析中，工程師前期花費的時間主要在模型建立和修改上，後期真正的分析時間消耗在計算機上，因此，選擇一款適合自身的CFD軟體和高性能建模工作站就顯得尤為重要。接下來小編軟體將選擇Altair的CFD工具，硬體將選擇NVIDIA RTX8000，通過一些案例模型進行實際評測，希望對大家選擇GPU時有所幫助。

¶ 評測案例一：基於Altair AcuSolve™軟體的GPU加速

■軟體環境介紹 —————————————————

Altair AcuSolve™是一款基於GLS-FEM算法的通用熱流體求解器，不但有快速良好的收斂速度，還能達到很高的求解精度，同時對網格有良好的相容性，特別方便於複雜模型網格的劃分，廣泛應用於汽車、流體機械和海洋平台等工業和科學應用問題的解決。值得一提的是，最新版本的AcuSolve，不僅通過GPU加速提高了3~4倍的計算速度，同時也支持核態沸騰、熱輻射、冷凝/蒸發多相流和流固耦合(FSI)等CFD難題的解決。

■硬體環境介紹 —————————————————

CPU採用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH；GPU選用NVIDIA RTX8000，它採用了NVIDIA Turing架構和NVIDIA RTX平台支持，對於追求以高穩健性、高精度為目標的CFD模擬分析帶來了卓越的計算性能體驗。

■測試模型 ———————————————————

在新能源汽車、醫療設備、軍工設備等大功率密度的應用場合，設備運行時會產生大量的熱損耗，為保證設備的安全運行，需要採用各種冷卻措施來對設備進行冷卻，水冷是其中一種方式。以新能源車的水冷板為例，其設計直接影電池的溫度均勻性，進而影響車輛的續航里程和安全性。本測試模型擁有網格數量4300萬，求解方程採用湍流+固體傳熱組合，湍流模型選擇基於SA一方程的模型，設置穩態迭代步為200步，分別採用無GPU和1塊GPU加速進行計算時間對比。

動力電池水冷板模型

■測試結果 ———————————————————

數據表明，無GPU加速時，水冷板分析的計算時間需要21小時；採用單塊NVIDIA RTX8000加速，水冷板分析的計算時間只需要4小時。由此可見，採用Altair AcuSolve進行水冷板模擬分析，並提供NVIDIA GPU的增強支持，計算速度與無GPU加速相比提高了4.25倍。顯然，這種方式對於CFD工程師快速探索水冷板的設計，並根據準確的計算結果做出決策非常有益。

計算時間對比

¶ 評測案例二：基於Altair nanoFluidX™軟體的GPU加速

■軟體環境介紹 —————————————————

Altair nanoFluidX™是一款基於粒子的流體動力學(SPH)模擬工具，用於預測運動軌跡複雜的幾何結構周圍的流體。以整車CFD模擬為例，傳統CFD方法需要建立網格耗時巨大，但Altair nanoFluidX基於粒子的特性，無需建立網格，還可基於GPU顯卡計算，非常有助於工程師獲得簡潔而高效的CFD解決方案。

■硬體環境介紹 —————————————————

CPU採用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH；GPU選用NVIDIA RTX8000和NVIDIA Tesla V100，由於Altair nanoFluidX採用的粒子方法，其計算是由一系列的流體粒子的相互作用完成，在計算中每個粒子所執行的計算是完全相同的，而在不同的數據上執行相同的程序，恰恰是GPU計算最擅長的。

整車涉水模型

■測試模型 ———————————————————

整車涉水分析是近年來新興的CFD模擬領域，主要研究汽車以一定速度涉水時，關鍵零部件的進水風險，如防火牆滲水，傳統的發動機進氣口進水，電動汽車電氣短路等問題。整車涉水模型往往需要消耗大量的計算資源和時間進行求解，以本次建立的整車涉水模型為例，擁有粒子數量為4100萬，設置車速為50公里/小時、瞬態物理時間為4秒，建立單相流模型，本次測試分別採用1塊NVIDIA RTX8000、2塊NVIDIA RTX800、4塊NVIDIA RTX8000和4塊V100加速，對比計算時間。

計算時間對比

■測試結果 ———————————————————

數據表明，採用1塊、2塊、4塊NVIDIA RTX8000加速，整車涉水分析分別需要花費48小時、28小時、13小時；採用4塊V100，則需要16個小時。從計算時間來看，採用4塊NVIDIA RTX8000加速，計算時間最少，與採用1塊NVIDIA RTX8000加速相比，計算速度提升了約2.7倍。計算結果也表明，採用基於GPU加速和Altair nanoFluidX的組合方式，允許CFD工程師在一個更可接受的短時間內研究類似整車涉水這樣的複雜流體問題。

¶ 評測案例三：基於Altair ultraFluidX™軟體的GPU加速

■軟體環境介紹 —————————————————

Altair ultraFluidX™專用於超快預測乘用車、輕型卡車、賽車和重型車輛的空氣動力特性的模擬分析，它基於格子玻爾茲曼（LBM）技術，無需建立網格，這大大縮短了建模時間，使得設計變得更加容易，同時保留了所有重要的幾何細節。

■硬體環境介紹 —————————————————

CPU採用單顆Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH；GPU選用NVIDIA RTX8000和NVIDIA Tesla V100，由於Altair ultraFluidX採用的LBM方法，非常適合大規模並行架構，而採用GPU加速，可以明顯提高吞吐量，達到Altair ultraFluidX的周轉時間，同時降低硬體和能源成本。

■測試模型 ———————————————————

對於車輛的早期開發優化，採用CFD手段無疑是最有效且最經濟的方法，但這類CFD分析往往是高內存和高計算資源消耗的典型代表，需要使用GPU來優化計算性能。以此次建立的汽車虛擬風洞模型為例，擁有格子數量1億6千萬，格子的最小尺寸為1.8mm，設置車速為140公里/小時、瞬態物理時間為2秒，分別採用2塊NVIDIA RTX8000、4塊NVIDIA RTX8000和4塊V100加速，對比計算時間。

汽車虛擬風洞模型

■測試結果 ———————————————————

數據表明，採用2塊、4塊NVIDIA RTX8000加速，模擬汽車虛擬風洞分別需要花費14小時、8小時；採用4塊V100，則需要8.4個小時。三種GPU加速中，採用4塊NVIDIA RTX8000加速，計算時間最少，與採用2塊NVIDIA RTX8000加速相比，計算速度提升了約0.75倍。計算結果也表明，基於GPU和Altair ultraFluidX的組合方式，可以明顯加速汽車虛擬風洞分析，有效縮短汽車開發週期。

計算時間對比

（四）總結

作為當前最重要的三大協處理加速技術之一，GPU已經成為數值分析的新寵，廣泛應用於各個領域。以流體模擬領域為例，隨著CFD分析對計算能力的要求日益增高，越來越多的CFD工程師傾向於採用GPU加速，例如借助NVIDIA RTX8000加速，能以遠低於傳統CPU解決方案的成本、空間和功耗，獲得無與倫比的計算性能。

同時，在渲染方面，利用NVIDIA RTX8000強大的運算能力，將流場和流體構件建立數學模型，並用數字化可視化的形式表現出來，可以獲得任意位置的結果值，這無疑也極大地提高了設計的精確性。e-works認為，優秀的計算性能和尖端的數值方法的組合，在更短的時間內研究複雜的流體問題，將成為未來CFD領域高效而主流的方式。

想了解更多 Altair nanoFluidX粒子流體、Altair ultraFluidX空氣動力學、Altair EDEM顆粒力學、Altair AcuSolve通用流體分析，歡迎聯絡我們申請試用或產品展示。

電話 : (02)2518-9060
郵件 : info@agilesim.com.tw

回前頁