來源:新智元
ChatGPT爆火之后,谷歌和微軟兩巨頭的AI大戰戰火,已經燒到了新的領域——服務器芯片。
如今,AI和云計算都成了必爭之地,而芯片,也成為降低成本、贏得商業客戶的關鍵。
原本,亞馬遜、微軟、谷歌這類大廠,都是以軟件而聞名的,而現在,它們紛紛斥資數十億美元,用于芯片開發和生產。
各大科技巨頭研發的AI芯片
ChatGPT爆火,大廠開啟芯片爭霸賽
根據外媒TheInformation的報道以及其他來源,這三家大廠現在已經推出或計劃發布8款服務器和AI芯片,用于內部產品開發、云服務器租賃或者二者兼有。
「如果你能制造出針對AI進行優化的硅,那前方等待你的將是巨大的勝利」,研究公司Forrester的董事GlennO’Donnell這樣說。
付出這些巨大的努力,一定會得到回報嗎?
答案是,并不一定。
英特爾、AMD和英偉達可以從規模經濟中獲益,但對大型科技公司來說,情況遠非如此。
谷歌披露其超計算機速度、能耗效率高于英偉達A100芯片構建的同類系統:4月10日消息,谷歌本周披露其訓練人工智能模型使用的超級計算機的最新細節,其稱這些系統的速度和能耗效率均高于英偉達基于A100芯片的同類系統,其90%以上的人工智能訓練任務都通過谷歌擁有自主定制的TPU芯片完成。
目前,AI芯片主要包括GPU、FPGA、ASIC等。ASIC作為專用集成電路,廣泛應用于人工智能設備等領域,其根據終端功能又細分為TPU芯片、DPU芯片和NPU芯片等。資料顯示,ASIC在吞吐量、功耗、算力水平等單個方面都是最優秀的,其中,TPU比同時期的GPU或CPU平均提速15-30倍,能效比提升30-80倍。[2023/4/10 13:53:53]
它們還面臨著許多棘手的挑戰,比如需要聘請芯片設計師,還要說服開發者使用他們定制的芯片構建應用程序。
不過,大廠們已經在這一領域取得了令人矚目的進步。
根據公布的性能數據,亞馬遜的Graviton服務器芯片,以及亞馬遜和谷歌發布的AI專用芯片,在性能上已經可以和傳統的芯片廠商相媲美。
亞馬遜、微軟和谷歌為其數據中心開發的芯片,主要有這兩種:標準計算芯片和用于訓練和運行機器學習模型的專用芯片。正是后者,為ChatGPT之類的大語言模型提供了動力。
此前,蘋果成功地為iPhone,iPad和Mac開發了芯片,改善了一些AI任務的處理。這些大廠,或許正是跟蘋果學來的靈感。
外媒:英偉達最新顯卡驅動重新啟用挖礦限制程序:5月26日消息,在安裝英偉達最新的512.95驅動程序后,所有基于Windows的挖礦軟件都將恢復到被限制后的哈希率。報道稱這并沒有什么用,因為礦工可以重新裝回以前的512.77驅動程序,實現滿速挖礦。
據報道,YouTube用戶Juliano Caju確認了512.95驅動自帶挖礦鎖。他的RTX 3060卡使被限制為25 MH / s ETH哈希率,而此前破解后的哈希率為46 MH / s。
此前5月初消息,算力經紀商Nicehash新軟件已支持解鎖Nvidia顯卡的加密挖礦限制。(Videocardz)[2022/5/26 3:43:02]
在三家大廠中,亞馬遜是唯一一家在服務器中提供兩種芯片的云服務商,2015年收購的以色列芯片設計商AnnapurnaLabs,為這些工作奠定了基礎。
谷歌在2015年推出了一款用于AI工作負載的芯片,并正在開發一款標準服務器芯片,以提高谷歌云的服務器性能。
相比之下,微軟的芯片研發開始得較晚,是在2019年啟動的,而最近,微軟更加快了推出專為LLM設計的AI芯片的時間軸。
而ChatGPT的爆火,點燃了全世界用戶對于AI的興奮。這更促進了三家大廠的戰略轉型。
開發人員Sergei創建了一款能解鎖英偉達全部哈希率容量的應用程序:金色財經報道,PCGames消息,一種新的實用程序能夠通過修改BIOS來解鎖英偉達GeForce RTX 顯卡的全部哈希率容量。該工具由一位名叫 Sergei 的開發人員創建,它使卡無法用于游戲,但礦工可以利用不受限制的性能。新引入的修改可能會改變 GPU 挖礦的游戲規則,因為它將能夠將 RTX 3080 Ti 的挖礦能力提高 115 MH/s,礦工還需要安裝開發者上傳的顯卡驅動。(u.today)[2022/2/23 10:09:12]
ChatGPT運行在微軟的Azure云上,使用了上萬塊英偉達A100。無論是ChatGPT,還是其他整合進Bing和各種程序的OpenAI軟件,都需要如此多的算力,以至于微軟已經為開發AI的內部團隊分配了服務器硬件。
在亞馬遜,首席財務官BrianOlsavsky在上周的財報電話會議上告訴投資者,亞馬遜計劃將支出從零售業務轉移到AWS,部分原因是投資于支持ChatGPT所需的基礎設施。
在谷歌,負責制造張量處理單元的工程團隊已經轉移到谷歌云。據悉,云組織現在可以為TPU和在其上運行的軟件制定路線圖,希望讓云客戶租用更多TPU驅動的服務器。
英偉達Q2挖礦顯卡收入2.66億美元,低于預期的4億美元:顯卡制造商英偉達公布了今年二季度收益情況:Q2收入65億美元,凈利潤大約23.7億美元。盡管顯卡銷售帶動了營收增長,但是英偉達該季度挖礦顯卡業務未達4億美元營收預期,實際數據為2.66億美元。與去年同期相比,其數據中心和專業可視化平臺的收入分別增長了35%和156%,而游戲收入增長了85%。(Coindesk)[2021/8/19 22:24:38]
谷歌:為AI特調的TPUV4
早在2020年,谷歌就在自家的數據中心上部署了當時最強的AI芯片——TPUv4。
不過直到今年的4月4日,谷歌才首次公布了這臺AI超算的技術細節。
相比于TPUv3,TPUv4的性能要高出2.1倍,而在整合4096個芯片之后,超算的性能更是提升了10倍。
同時,谷歌還聲稱,自家芯片要比英偉達A100更快、更節能。對于規模相當的系統,TPUv4可以提供比英偉達A100強1.7倍的性能,同時在能效上也能提高1.9倍。
對于相似規模的系統,TPUv4在BERT上比A100快1.15倍,比IPU快大約4.3倍。對于ResNet,TPUv4分別快1.67倍和大約4.5倍。
礦工找到繞過“英偉達顯卡限制以太坊挖礦”的方法:3月10日消息,礦工找到一種使用自定義mod繞過“GeForce RTX 30系列顯卡限制以太坊挖礦”的方法。NVIDIA GeForce RTX 3060的傳輸速度約為40-45 MH / s,但是一旦在顯卡上開始挖掘,速度就會降至20-25 MH / s。該Mod有助于礦工釋放GeForce RTX 3060顯卡的全部散列潛力,最高可達50 MH / s。(WCCFtech)
此前消息,芯片巨頭英偉達(Nvidia)的高端顯卡RTX 3080 Ti和RTX 3070 Ti將配有以太坊挖礦限制功能,即顯卡算力不能全部用于挖礦。同時,英偉達未來生產的所有30系列高端顯卡,都將配置以太坊挖礦限制功能。[2021/3/10 18:32:57]
另外,谷歌曾暗示,它正在研發一款與NvidiaH100競爭的新TPU。谷歌研究員Jouppi在接受路透社采訪時表示,谷歌擁有「未來芯片的生產線」。
微軟:秘密武器雅典娜
不管怎么說,微軟在這場芯片紛爭中,依舊躍躍欲試。
此前有消息爆出,微軟秘密組建的300人團隊,在2019年時就開始研發一款名為「雅典娜」的定制芯片。
根據最初的計劃,「雅典娜」會使用臺積電的5nm工藝打造,預計可以將每顆芯片的成本降低1/3。
如果在明年能夠大面積實裝,微軟內部和OpenAI的團隊便可以借助「雅典娜」同時完成模型的訓練和推理。
這樣一來,就可以極大地緩解專用計算機緊缺的問題。
彭博社在上周的報道中,稱微軟的芯片部門已與AMD合作開發雅典娜芯片,這也導致AMD的股價在周四上漲了6.5%。
但一位知情者表示,AMD并未參與其中,而是在開發自己的GPU,與英偉達競爭,并且AMD一直在與微軟討論芯片的設計,因為微軟預計要購買這款GPU。
亞馬遜:已搶跑一個身位
而在與微軟和谷歌的芯片競賽中,亞馬遜似乎已經領先了一個身位。
在過去的十年中,亞馬遜在云計算服務方面,通過提供更加先進的技術和更低的價格,一直保持了對微軟和谷歌的競爭優勢。
而未來十年內,亞馬遜也有望通過自己內部開發的服務器芯片——Graviton,繼續在競爭中保持優勢。
作為最新一代的處理器,AWSGraviton3在計算性能上比上一代提高多達25%,浮點性能提高多達2倍。并支持DDR5內存,相比DDR4內存帶寬增加了50%。
針對機器學習工作負載,AWSGraviton3比上一代的性能高出多達3倍,并支持bfloat16。
基于Graviton3芯片的云服務在一些地區非常受歡迎,甚至于達到了供不應求的狀態。
亞馬遜另一方面的優勢還表現在,它是目前唯一一家在其服務器中提供標準計算芯片和AI專用芯片云供應商。
早在2019年,亞馬遜就推出了自己的AI推理芯片——Inferentia。
它可以讓客戶可以在云端低成本運行大規模機器學習推理應用程序,例如圖像識別、語音識別、自然語言處理、個性化和欺詐檢測。
而最新的Inferentia2更是在計算性能提高了3倍,加速器總內存擴大了4倍,吞吐量提高了4倍,延遲降低到1/10。
在初代Inferentia推出之后,亞馬遜又發布了其設計的主要用于AI訓練的定制芯片——Trainium。
它對深度學習訓練工作負載進行了優化,包括圖像分類、語義搜索、翻譯、語音識別、自然語言處理和推薦引擎等。
在一些情況下,芯片定制不僅僅可以把成本降低一個數量級,能耗減少到1/10,并且這些定制化的方案可以給客戶以更低的延遲提供更好的服務。
撼動英偉達的壟斷,沒那么容易
不過到目前為止,大多數的AI負載還是跑在GPU上的,而英偉達生產了其中的大部分芯片。
據此前報道,英偉達獨立GPU市場份額達80%,在高端GPU市場份額高達90%。
20年,全世界跑AI的云計算與數據中心,80.6%都由英偉達GPU驅動。21年,英偉達表示,全球前500個超算中,大約七成是由自家的芯片驅動。
而現在,就連運行ChatGPT的微軟數據中心用了上萬塊英偉達A100GPU。
一直以來,不管是成為頂流的ChatGPT,還是Bard、StableDiffusion等模型,背后都是由每個大約價值1萬美元的芯片英偉達A100提供算力。
不僅如此,A100目前已成為人工智能專業人士的「主力」。2022人工智能現狀報告還列出了使用A100超級計算機部分公司的名單。
顯而易見,英偉達已經壟斷了全球算力,憑借自家的芯片,一統江湖。
根據從業者的說法,相比于通用芯片,亞馬遜、谷歌和微軟一直在研發的專用集成電路芯片,在執行機器學習任務的速度更快,功耗更低。
O’Donnell董事在比較GPU和ASIC時,用了這樣一個比較:「平時開車,你可以用普銳斯,但如果你必須在山上用四輪驅動,用吉普牧馬人就會更合適。」
然而盡管已經做出了種種努力,但亞馬遜、谷歌和微軟都面臨著挑戰——如何說服開發者使用這些AI芯片呢?
現在,英偉達的GPU是占主導地位的,開發者早已熟悉其專有的編程語言CUDA,用于制作GPU驅動的應用程序。
如果換到亞馬遜、谷歌或微軟的定制芯片,就需要學習全新的軟件語言了,他們會愿意嗎?
原文作者:BerberJin原文標題:《Benchmark’sApproachtoCryptoTakesaPageFromWeb2.0》編譯:海爾斯曼.
1900/1/1 0:00:00據GamesBeat2月12日報道,區塊鏈和Play-to-Earn智庫SaladVentures完成1350萬美元私募融資.
1900/1/1 0:00:0012月27日,百度創始人、董事長兼CEO李彥宏在百度Create2021演講中表示,“人機共生”時代,中國將迎來AI黃金十年.
1900/1/1 0:00:00原文作者:0x?min&David?原文來源:TechFlowResearchOrdinals和BRC-20成功刮起“在比特幣上發行資產”的風潮,但顯然它可能并不是最后一個.
1900/1/1 0:00:00本文來源:新京報,原題《“區塊鏈”化解物業糾紛,新技術賦能城市治理》據報道,12月10日,北京高院召開新聞發布會,通報朝陽法院探索利用“區塊鏈”化解物業糾紛的訴源治理新路徑.
1900/1/1 0:00:00本文來源:證券日報·金融1號院,作者:李冰“感覺自己‘錦鯉附體’,非常高興能參與到此次數字人民幣的試點活動中。”消費者王先生興奮地對“金融1號院“說.
1900/1/1 0:00:00