英偉達掌舵人黃仁勛:人工智能計算的新紀元,就是要省錢!
英偉達掌舵人黃仁勛,在GTC2017上再掀京城“AI風云”。
本文引用地址:http://www.j9360.com/article/201709/364829.htm

▲ NVIDIA CEO 黃仁勛
上場后“老黃”直接開懟,終于說出了人們憋在心中許久的結論——摩爾定律已終結。

▲ 兩股力量推動計算領域的未來
但,NVIDIA的GPU計算為整個行業指出了前進的道路。
他指出,設計人員無法再創造出可以實現更高之靈系并行性的CPU架構;晶體管數每年增長50%,但CPU的性能每年僅增長10%。而NVIDIA的GPU彌補CPU的不足,加速處理高強度計算負載。
深度學習另一大“殺傷性武器”:CUDA
CUDA是一種革命性的計算架構,它將專用功能ASIC的性能與通用編程模型相結合,使開發人員實現多種算法。目前CUDA開發人員的數量在5年里增長了14倍超過60萬,下載量達到180萬。

▲ 適用于全球開發人員的NVIDIA AI
AI是NVIDIA CUDA GPU的“殺手級應用”,AI取得驚人進步。
阿里巴巴、百度和騰訊已在各自的云服務中采用NVIDIA Volta GPU。
華為、浪潮和聯想已采用NVIDIA基于HGX的GPU服務器。
此外,NVIDIA還在為全球開發員人配置強大AI工具,全力推進“統一架構”CUDA GPU計算。
AI推理是下一個巨大挑戰,重磅發布 TensorRT 3
AI推理平臺必須具備可編程性,高性能,且支持龐大和復雜的網絡。
隨著智能機器的爆發性增長,AI會將智能注入到2000萬臺云服務器、上億臺汽車和制造機器人中。所以,AI推理平臺必須可擴展,以解決海量計算的性能、功耗和成本需求。

▲ 宣布NVIDIA TensorRT 3
于是,老黃又來搞事了。
宣布NVIDIA TensorRT 3,全球首款可編程AI推理加速器。
TensorRT是一款適用于CUDA GPU的優化神經網絡編譯器,它可利用CUDA深度學習指令集創建運行時。從云、數據中心、PC、汽車到機器人,TensorRT皆能在NVIDIA全系列平臺便宜出最優運行時。

▲ 運行在 V100上的 TensorRT在處理圖像時可實現7ms的延時
運行的Volta上的TensorRT3在圖像分類方面,比最快的CPU還要快40倍,在語言翻譯方面則要快140倍。
搭配 Tesla V100 GPU 加速器的 TensorRT 每秒能夠識別多達 5700 張圖片,而如今所用的 CPU 則每秒僅能識別 140 張圖片。
AI城市是一個巨大的AI推理挑戰,它可能需要使用大約1000萬個Tesla V100 GPUs來監控10億臺攝像頭。

▲ NVIDIA AI城市-助力中國建設更智慧、更安全的城市
NVIDIA將攜手海康威視共建AI城市。此外,大華、華為和阿里巴巴都提供基于NVIDIA平臺的AI視頻解決方案。
AI另一重頭戲:自動駕駛汽車
NVIDIA DRIVE是一個為自動駕駛行業帶來變革的端到端平臺。NV自動駕駛計算機可以支持L3、L4和L5級。開放軟件棧包含從ASIL-D OS、深度學習、計算機視覺 SDK 到自動駕駛應用。

▲ 開放的自動駕駛計算平臺
DRIVE AV是NVIDIA開發的自動駕駛應用,環繞攝像頭、雷達和激光雷達的傳感數據融合。多種深度學習和計算機視覺將為L4和L5級別自動回家是技術提供所需的多樣性和冗余性。
目前,145家初創公司正在研制基于NVIDIA DRIVE的自動駕駛汽車、卡車、高清制圖及服務。
推全球首款自主機器處理器 Xavier
NVIDIA設計了全球首款自主機器的處理器,命名Xavier。

▲ 全球首款自主機器處理器
它是迄今為止最為復雜的片上系統,將于18年第一季度早期接觸合作伙伴提供,在第四季度全面推出。
京東X選擇 NVIDIA實現其自主機器,采用Jetson平臺。而Xavier將成為下一代Jetson的片上系統(SOC)。

▲ 最后,謝謝各位合作伙伴AND老板們的支持!
老黃Keynote總結:計算新紀元,就是要省錢!
NVIDIA Tesla V100AI平臺已經被中國領軍的IT公司采用,包括阿里巴巴、百度、騰訊、華為、浪潮和聯想。
業內首創的NVIDIA可編程推理加速平臺已被阿里巴巴、百度、騰訊、科大訊飛和京東采用。
NVIDIA AI城市平臺已被阿里巴巴、海康威視、大華和華為采用,以解決最大規模的AI和推理難題之一。
NVIDIA DRIVE——引領自動駕駛變革的開放平臺,已被145家自動駕駛初創公司采用。
NVIDIA“Xavier”——全球首款自主機器處理器將在第一季度發布樣片,并將揭開人工智能時代的新篇章。
評論