::: 回首頁動態資訊焦點新聞

AI先期應用開發系統與TWGC (Taiwan GPU Cloud) 雲端GPU軟體服務上線--TWGC 版本0.5a發佈

2018.05.31

科技部推動人工智慧(AI),是以「小國大戰略」的思維,透過5大策略,打造由人才、技術、場域以及產業構築而成的AI創新生態圈。其五大策略為:建構AI主機、設立AI創新研究中心、打造智慧機器人創新基地、半導體射月計畫及社會參與之科技大擂台。

  建構AI主機無疑是這五大策略中的最基礎、也是最重要的研發服務,AI主機由科技部所屬國家實驗研究院轄下之國家高速網路與計算中心(簡稱國網中心)負責建置。為能提供先期AI測試的研發環境,國網中心優先建置AI先期應用開發系統,並已於106年底建置完成,合計21台GPU伺服器,且於107年一月起正式提供AI創新研究中心及業界(如AI Labs)之研究測試。

  為了簡化在雲端GPU平台上的人工智慧開發複雜度,國網中心推出TWGC (Taiwan GPU Cloud) 雲端GPU軟體服務,並配合不同的主機陸續上線,持續更新版本以增加功能來滿足開發人員需求。

  對於研究開發人員與資料專家而言,若想駕馭深度學習將面臨兩大問題。第一是將不可或缺的軟體元件堆疊在單一系統裡,包含深度學習架構、函式庫、操作系統與驅動程式;其次是如何取得最新 GPU 運算軟體與函式庫等,以便進行神經網路訓練。

  TWGC將可解決這兩個問題,藉由將 NVIDIA DGX-1 人工智慧超級電腦中的關鍵軟體元素以容器化(Container)技術建構。對研究開發人員而言,此軟體堆疊(Software Stack)套裝軟體,不但將更容易取得與使用,同時也將持續進行更新與優化,以發揮最大效能。

  為了解決硬體相容性方面的問題,TWGC目前提供研究開發人員利用搭載V100之DGX-1進行運算,未來將提供更新更快速之GPU運算資源,可從雲端進行深度學習,研究開發人員可省略軟體安裝與硬體建置時間。

  TWGC讓研究開發人員更加便利地進行深度學習訓練、實驗與部署,達到加速與簡化深度學習發展的目的。研究開發人員將能更輕易地設計出更精細複雜的神經網路、處理更多的資料,並加速疊代與產品上市的速度。

目前TWGC最新版本為0.5a,此版主要新增功能為:

  • 統一帳號(IAM)及預算管理(Billing)
  • 佈署 HPC 等級計算排程(Slurm)及檔案系統
  • 提供S3雲端儲存
  • 自定安全群組服務

* TWGC 0.5a版自發佈服務開始會與 TWGC 0.3 版并存,至下一版本 TWGC 0.5b 版發佈為止。

* 預計發佈的 TWGC 0.5b 版會整合現有的 TWGC 0.3 版機群及新建 P100 機群,以提供更多 GPU 運算資源給研究開發人員。下一版本的詳細發佈內容及時間容後公告。

詳細的注意事項,請前往https://twgc.nchc.org.tw/announce_01.aspx

並請查看TWGC 0.5a 版發佈通知 (TWGC Version 0.5a Release Notes)。