88
NVIDIA NVLink 成就世界上最快超級電腦 嶄新連接方式  較 PCIe 介面更具效率
文章索引: NVIDIA
本周美國能源署宣佈計劃打造兩部搭載 NVIDIA GPU 加速器的超級電腦,每秒運算速度將可達 100 petaflops , NVIDIA 並正為超級電腦開發 NVLink 技術的核心基礎,以更流暢方式連接系統的 CPU 和 GPU 處理器,可較現有的數據交換速度提高 5 至 12 倍。

現今大部份最快的超級電腦均採用 GPU 加速器支援,與僅有幾十個核心的 CPU 相比,單一 GPU 上搭載有數千個運算核心, GPU 可更快速處理巨量科學資料,速度約比 CPU 快 10 倍。雖然 GPU 的效能不斷提升,然而傳輸資料到 GPU 的連接卻沒有跟上,現今的超級電腦透過 PCI Express 技術將 GPU 連接到 CPU 上,然而其傳輸速度仍然不夠快。

NVIDIA 推出全球第一個高速 GPU 互聯技術 NVLink ,提供更快速的替代方案。 NVLink 可讓現今 GPU 和 CPU 之間的數據傳輸速度加快 5 至 12 倍,足以讓數據流暢地由 CPU 記憶體傳輸至 GPU 。除此之外, NVLink 讓 CPU 和 GPU 以嶄新的方式連接,能夠讓伺服器的設計更有彈性,比 PCI Express 更具能源效率。
Linux x86 架構執行 GPU 加速應用  NVIDIA PGI 編譯器登陸 IBM POWER 系統
文章索引: NVIDIA
NVIDIA 21 日宣佈針對 PGI 最佳化編譯器開發加強版,更可支援採用 IBM POWER CPU 系統中執行 Linux x86 架構 GPU 加速應用。 POWER 專用的 PGI 最佳化 Fortran 、 C 和 C++ 編譯器,可提供一個使用者介面、編程語言功能、平行運算編程功能,以及與 PGI Linux x86 編譯器相同的最佳化功能,並具備高頻寬 CAPI 連接埠和 NVLink GPU 互聯功能,讓開發人員可更輕鬆開發全新應用。

專為 IBM POWER 系統設計的 PGI 編譯器和工具,主要用作加速器專屬 OpenACC 指令,在 NVIDIA 最新的 GPU 加速器中針對 PGI 加速器原生 Fortran 2003 、 C11 和 C++11 的 OpenACC 功能提供完備支援,同時也支援統一記憶體。其 PGI CUDA Fortran 擴充功能,擁有與 Linux/x86 平台專用的 CUDA Fortran 相同的功能,為採用 GPU 加速的 POWER 系統原生 Fortran 編譯器提供高靈活性和 NVIDIA CUDA 編程模式的運算威力。

加強版 PGI 編譯器提供更快的 OpenMP 效能,較採用最新支援 AVX 的 Intel 和 AMD 多核心 64 位元處理器執行的 GCC 4.8 , PGI 編譯器針對最新 SPEC OMP 2012 效能評測套件平均可快 75% 效能。而且 Fortran 2003 、 C11 和 C++11 編譯器同樣具備所有 PGI 多核心最佳化功能,包括完備的迴圈最佳化功能、記憶體層級最佳化功能、 SIMD 向量化、加入行內函式、內部程序分析和最佳化、特性分析回饋等。
多兩倍效能及記憶體頻寬 比 CPU 高 10 倍 NVIDIA 旗艦級 Tesla K80 雙 GPU 加速器
文章索引: NVIDIA
NVIDIA 再為加速運算平台增添最新旗艦級產品,宣佈推出全新 Tesla K80 雙 GPU 加速器,專為機器學習、資料分析、科學和高效能運算 (HPC) 等廣泛應用而設,提供多 2 倍效能和記憶體頻寬,運算效能無法比擬。

全新 Tesla K80 雙 GPU 加速器是 Tesla 加速運算系列的旗艦級產品,特別針對大型科學探索和深入分析的頂尖運算平台,結合最快的 GPU 加速器、 CUDA 平行運算以及完整的軟體開發者、軟體商和資料中心系統 OEM 的產業體系支援。較上代 Tesla K40 GPU 加速器, Tesla K80 雙 GPU 加速器可提供將近兩倍的效能和雙倍記憶體頻寬,其效能更可比現今最快的 CPU 高 10 倍,並能在數百種複雜的數據分析和大型運算密集的科學運算應用中遠勝 CPU 的運算效能。

效能方面, Tesla K80 雙 GPU 加速器可透過一卡雙 GPU 提供雙倍傳輸量,內置 24GB GDDR5 記憶體,每顆 GPU 有 12GB 記憶體,比上代 Tesla K40 GPU 提供多兩倍記憶體處理更大的資料集分析。 Tesla K80 支援 480GB/s 記憶體頻寬,內建 4,992 CUDA 平行運算核心,可比僅用 CPU 運算提升高達 10 倍應用加速效能,加上採用動態 NVIDIA GPU Boost 技術,可根據個別應用靈活提升 GPU 時脈,而且更透過動態平行運算架構,讓用家可快速分析關聯式和動態的資料結構。
採用 NVIDIA Tesla  GPU + NVLink 傳輸介面 美國能源部打造兩部旗艦超級電腦
文章索引: NVIDIA
NVIDIA 於 17 日宣佈獲美國能源部採用旗下 NVIDIA Tesla GPU 加速晶片及 NVIDIA NVLink 高速 GPU 互連技術,並配合新一代 IBM POWER 伺服器,計劃打造兩部搭載 GPU 加速器的超級電腦,將帶來比現今最快強大系統高 3 倍效能,更接近「 Exascale 」等級運算目標,並預計於 2017 年安裝完畢。

超級電腦界多年來一直朝建構 「 Exascale 」系統的目標邁進,亦即每秒能進行 1 quintillion 次 、 10 億個 10 億或 10 的 18 次方的浮點運算,亦即 FLOPS 。一個 FLOP 相等於執行一次數學運算,像是把兩個數字相乘的運算作業。新超級電腦系統象徵著 IBM 與 NVIDIA 持續合作的第一個重大里程碑,並延續先前 OpenPOWER Foundation 的基礎,此開放研發團體創立宗旨為了高效能運算與企業資料中心顧客發展新一代的運算解決方案。

此項計劃其中之一大進步就是採用 NVIDIA NVLink 高速 GPU 互連技術,將整合到 NVIDIA 的 GPU 以及 IBM POWER CPU ,其核心將作為新系統的動力來源。 NVLink 讓 GPU 與 CPU 分享資料的速度比現今系統快 12 倍,最終讓未來超級電腦的速度比目前最快系統快上 50 至 100 倍。
Nexus 9 搭載 NVIDIA Tegra K1 晶片 為 Android 平台首款 64 位元運算方案
文章索引: NVIDIA
NVIDIA 於 21 日宣佈新推出的 Google Nexus 9 平板電腦,搭載 NVIDIA 旗下 192 個核心的 Tegra K1 超級晶片, Tegra K1 更是首款針對 Android 進行設計的 ARM 處理器,令 Nexus 9 可支援所有主流繪圖標準,包括新推出的 Lollipop Android Extension Pack 擴充套件,把頂級的繪圖功能於 Android 平台上盡情發揮,讓行動裝置執行遊戲的表現足以媲美 PC 與電腦遊戲。

Nexus 9 平板為首款搭載最新 5.0 版 Lollipop Android 作業系統的平板電腦,採用 192 個核心的 NVIDIA Tegra K1 晶片,搭載前置立體聲喇叭及 HTC 的 BoomSound 技術,提供 8.9 吋螢幕,支援 2048x1536 高解析度,配備 800 萬畫素主鏡頭與 160 萬畫素自拍鏡頭,並即將推出 LTE 版本。另外 Nexus 9 平板更可接上折疊式鍵盤外蓋,無論在家中、辦公室或外出亦能輕鬆執行輸入操作。

Google Nexus 9 平板電腦
88