如果問你英偉達是做什么的,你的第一反應(yīng)是否是顯卡?從“顯卡大廠”到“AI霸主”,英偉達已走過了27個年頭。該公司官網(wǎng)的“名片”為:GPU(圖形處理器)的發(fā)明者,也是人工智能計算的引領(lǐng)者。
12月15日—12月19日,英偉達為期5天的GTC中國線上大會正式召開,探索英偉達技術(shù)如何在AI、圖形計算、智慧醫(yī)療、機器人等領(lǐng)域帶來突破性進展,并為各行各業(yè)帶來變革。期間,英偉達各類產(chǎn)品線的技術(shù)專家在“閉門會議”上的發(fā)言都帶來了哪些干貨?
架構(gòu)創(chuàng)新助力計算效率提升
黃氏定律預(yù)測GPU將推動AI性能實現(xiàn)逐年翻倍,而黃氏定律的核心是架構(gòu)創(chuàng)新。“英偉達更多的是依靠架構(gòu)上的創(chuàng)新,從而使GPU發(fā)展速度和性能提升呈現(xiàn)幾倍、甚至幾十倍的結(jié)果。”英偉達區(qū)中國工程和解決方案高級總監(jiān)賴俊杰如是說道。
全新的英偉達 Ampere GPU架構(gòu)可以為AI、數(shù)據(jù)科學以及高性能計算等提供6倍的性能提升。而基于英偉達Ampere架構(gòu)的首款產(chǎn)品A100 Tensor Core GPU則是全球最大的7nm處理器,擁有超過540億個晶體管。
據(jù)賴俊杰介紹,英偉達A100結(jié)合了第三代Tensor Core、結(jié)構(gòu)化疏松技術(shù)、新的多實例GPU功能和第三代 NVLink 高速互聯(lián)技術(shù)等關(guān)鍵性技術(shù),使得A100能夠在各種規(guī)模的計算上提供前所未有的加速。
其中,英偉達第三代Tensor Core引入了TF32精度,一方面,它有足夠的動態(tài)范圍和精度,能夠保證網(wǎng)絡(luò)在訓(xùn)練的時候沒有任何精度損失; 另一方面,它能夠利用Tensor Core架構(gòu)大大加速神經(jīng)網(wǎng)絡(luò)相關(guān)的一些計算性能。
在剛剛過去的10月,英偉達發(fā)布了A100 80GB版本,與A100 GPU區(qū)別主要體現(xiàn)在內(nèi)存方面。據(jù)了解,A100 80GB的版本采用了HBM2e版本的內(nèi)存,并且它的容量能夠達到20GB,其顯存帶寬超過2TB。采用A100 80GB版本的DGX服務(wù)器,其顯存總?cè)萘靠梢赃_到640GB。
何為未來的網(wǎng)絡(luò)架構(gòu)
英偉達亞太區(qū)網(wǎng)絡(luò)市場開發(fā)高級總監(jiān)宋慶春指出,“英偉達剛剛發(fā)布的NDR InfiniBand產(chǎn)品充分體現(xiàn)了未來的網(wǎng)絡(luò)架構(gòu),即軟件定義、硬件加速、云原生、網(wǎng)絡(luò)計算的網(wǎng)絡(luò)。”
在NDR產(chǎn)品發(fā)布以后,世界上有了第一款400Gb/s的端到端網(wǎng)絡(luò)解決方案。而且在英偉達的NDR產(chǎn)品上面,實現(xiàn)了網(wǎng)絡(luò)通信中最難的 AllReduce和 All2All集合通信硬件卸載,解決了行業(yè)的痛點。
憑借NDR產(chǎn)品,可在3個Hop內(nèi)達到超過百萬臺的服務(wù)器互連,E級和Z級系統(tǒng)Ready,SHARP的網(wǎng)絡(luò)計算能力提升32倍。
“NDR是一個完全的SDN的網(wǎng)絡(luò),在網(wǎng)絡(luò)內(nèi)其所有的操作都可由軟件進行控制。同時,在管理上面實現(xiàn)了Cyber AI管理。將AI和網(wǎng)絡(luò)管理整合在一起,可以讓網(wǎng)絡(luò)管理員主動預(yù)防網(wǎng)絡(luò)故障、規(guī)避故障的發(fā)生,而不是等到網(wǎng)絡(luò)故障發(fā)生以后被動的找問題。”宋慶春說道。
據(jù)悉,英偉達上個月宣布推出英偉達 Mellanox 400G InfiniBand產(chǎn)品,其是第7代的InfiniBand產(chǎn)品,利用100Gb/s的PAM4 Serdes技術(shù), 實現(xiàn)了400Gb/s的單端口傳輸帶寬, 是上一代產(chǎn)品的兩倍, 同時通過添加更多、更強大的加速引擎,實現(xiàn)了更強大的計算和通信能力。
Jetson平臺助AI落地
Jetson是英偉達的自主機器平臺,截至目前,該平臺已在全球擁有70萬開發(fā)者,而且這個數(shù)字每一天還在增長當中。
對于Jetson受歡迎的原因,英偉達亞太區(qū)開發(fā)者發(fā)展總監(jiān)李銘指出,我們在Jetson平臺上一直致力于打造一套相對來說上手容易、而且功能豐富的SDK,也就是JetPack。
JetPack版本已經(jīng)從當初的JetPack 1.0到了現(xiàn)在的4.4版本,現(xiàn)在最新推出的4.4.1版本可以支持TS1、TS2、Nano等。
“Jetson的理念就是給大家一個非常合適、各種工具齊備的平臺。Jetson的算力選擇也非常豐富,這樣在產(chǎn)品化落地階段中,各個階段都可以幫到大家。”李銘表示。
英偉達在今年下半年推出的新品是Jetson Nano 2GB,把之前Nano產(chǎn)品向更加入門的方向又推進一步,適用于學生、教育工作者和機器人愛好者。其接口非常豐富,常規(guī)的USB、HDMI接口都有,且算力充沛,共有0.5T算力。
據(jù)悉,Jetson Nano 2GB 開發(fā)者套件由英偉達 JetPack SDK提供支持,英偉達JetPack SDK隨附英偉達容器運行時及完整的Linux軟件開發(fā)環(huán)境。因此,開發(fā)者可以將他們的 Jetson應(yīng)用程序及其所有依賴項打包到一個可以在任何部署環(huán)境下運作的容器中。它還由 英偉達CUDA-X加速計算堆棧提供支持。
標簽: 英偉達