效能優化
1. 開發環境容器化:因HPC用戶無root權限在HPC主機安裝軟體,需另尋有root權限的Linux電腦,製作開發環境的容器映像檔,此容器可移轉到HPC環境。
2. OpenACC加速運算:無需修改程式碼的整體結構,僅在程式碼中加入OpenACC的編譯器指示符,將CPU運算移轉到GPU運算。
3. 混合精度運算:深度學習的模型訓練程式加入自動混合精度,可加速模型運算速度,且維持模型精準度。
4. I/O瓶頸:由於資料從網路檔案系統存取會降低運算效能,可透過Nvidia DALI GPU加速、優先存放在計算節點的系統磁碟等技術來加速資料存取。
5. 效能分析:透過效能分析工具,如Intel VTune、Nvidia Nsight,將運算過程視覺化,找出效能瓶頸。
諮詢窗口:方先生 ybfang@niar.org.tw