在人工智能的熱潮中,不斷的有科技巨頭投入AI的芯片開發(fā)。
谷歌正在制造基于ARM架構(gòu)的定制CPU“Axion”,支持其數(shù)據(jù)中心的人工智能工作,讓云計算變得更便宜。在美國當?shù)貢r間的4月9日,谷歌官方在拉斯維加斯舉行的Cloud Next大會上表示,新處理器將于2024年晚些時候上市。
根據(jù)外媒路透社報道,基于ARM架構(gòu)的Axion CPU,性能比通用ARM芯片高30%,比英特爾和AMD生產(chǎn)的當前一代x86芯片高出50%。谷歌計劃“很快”使用Axion來支持谷歌云上的YouTube廣告等服務。
谷歌試圖減少對英特爾和英偉達等的依賴,追趕亞馬遜和微軟等競爭對手。亞馬遜在2018年推出了ARM芯片Graviton。就在谷歌宣布推出ARM處理器的幾個月前,微軟公布了為其云基礎設施設計的定制芯片。微軟已經(jīng)開發(fā)了人工智能定制芯片來訓練大模型,并為云和人工智能工作負載定制了基于ARM的CPU。
谷歌也在更新其TPU人工智能芯片,周二,谷歌TPU v5p芯片通過谷歌云服務上線。谷歌TPU芯片作為英偉達GPU的替代品用于人工智能加速任務,盡管開發(fā)者只能通過谷歌云平臺訪問它們而不能直接購買。
英特爾也公布了新的人工智能芯片細節(jié),以對抗英偉達的統(tǒng)治地位。當?shù)貢r間4月9日,Intel Vision 2024大會上,英特爾推出用于AI訓練和推理的Gaudi 3加速器,采用5納米工藝。Gaudi 3將帶來4倍的BF16 AI計算能力提升和1.5倍的內(nèi)存帶寬提升,預計可大幅縮短70億和130億參數(shù)Llama2模型以及1750億參數(shù)GPT-3模型的訓練時間。
英特爾表示,Gaudi 3芯片比英偉達上一代H100 GPU訓練特定大語言模型的速度快50%。在英特爾測試的一些模型上,它的推理速度比H100芯片更快。
英特爾在Meta開源的Llama模型和阿布扎比支持的Falcon模型上測試了該芯片。英特爾表示,Gaudi 3可以訓練或部署大模型,包括文生圖模型Stable Diffusion和Open AI旗下用于語音識別的Whisper模型等。這個芯片的功耗將更低。
路透社表示,Gaudi 3芯片預計今年第二季度向超微電腦(Supermicro)和惠普企業(yè)(Hewlett Packard Enterprise)等服務器制造商提供。
過去的一年中,英偉達憑借其GPU在人工智能芯片市場上占據(jù)約80%的份。今年3月,英偉達在其GTC大會上推出了H100的繼任者,即用于運行人工智能模型的新一代人工智能芯片B200和GB200。
玩家和粉絲買賬才是硬道理。
君の偽中國語本當上手
大伙真是不管多少歲都有一顆叛逆的心啊。