移動(dòng)端
方案網(wǎng)小程序
方案網(wǎng)手機(jī)端
加小編微信入群
發(fā)布成功
贊賞金額:
支付金額:5元
支付方式:
贊賞成功!
你的贊賞是對(duì)作者最大的肯定~?
近日,英特爾面向中國市場(chǎng)推出了AI芯片Habana Gaudi 2,Gaudi 2直接對(duì)標(biāo)英偉達(dá)GPU的100系列。英特爾公司執(zhí)行副總裁、數(shù)據(jù)中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera 表示,英特爾正在降低人工智能的準(zhǔn)入門檻,并強(qiáng)化客戶在云端通過網(wǎng)絡(luò)和智能邊緣部署這一關(guān)鍵業(yè)務(wù)技術(shù)的能力,Habana Gaudi 2雖然是定制版本,但性能沒有打折,網(wǎng)速和國際版相比從24個(gè)網(wǎng)口變成21個(gè)網(wǎng)口,整體性能基本一致。
Habana Gaudi2用于解決大規(guī)模語言模型、生成式AI模型的強(qiáng)算力需求問題,該芯片采用臺(tái)積電的7nm工藝,集成24個(gè)可編程的Tenor張量核心(TPC)、48MB SRAM緩存、21個(gè)10萬兆內(nèi)部互連以太網(wǎng)接口(ROCEv2 RDMA)、96GB HBM2E高帶寬內(nèi)存(總帶寬2.4TB/s)、多媒體引擎等,支持PCIe 4.0 x16,最高功耗800W。
AI大模型的市場(chǎng)需求強(qiáng)勁,英特爾接下來或?qū)?huì)把更多資源投入到AI加速芯片,也將在合法合規(guī)的情況下向中國推出針對(duì)本土市場(chǎng)的定制產(chǎn)品。英特爾的合作名單上有浪潮信息、新華三、超聚變等中國的主要服務(wù)器廠商,英特爾在發(fā)布會(huì)上帶來了浪潮基于Gaudi2的新一代 AI 服務(wù)器 NF5698G7,未來也將與新華三、超聚變等公司參與合作。
英特爾計(jì)劃在2025年把Gaudi的AI芯片和GPU路線圖合并,推出整合后的GPU產(chǎn)品,構(gòu)建可持續(xù)的軟件生態(tài)。
英偉達(dá)及時(shí)推出符合中國市場(chǎng)需求的簡化版A800和H800的AI芯片,雖然和A100和H100芯片相比,前者的性能有所減弱,但仍然能完成很多AI運(yùn)算任務(wù),根據(jù)TrendForce指出,目前和英偉達(dá)的H100、A100一樣,A800也已是AI相關(guān)計(jì)算應(yīng)用最為廣泛的主流產(chǎn)品。英偉達(dá)的AI芯片已經(jīng)在市場(chǎng)上占據(jù)主導(dǎo)地位。
與英偉達(dá)的AI芯片相比,英特爾的優(yōu)勢(shì)在哪里?英特爾認(rèn)為,Gaudi2的優(yōu)勢(shì)在于性價(jià)比。
在性能方面,這款中國定制版訓(xùn)練最主要的性能裁剪在于網(wǎng)絡(luò)端口。Gaudi2有21個(gè)百兆端口,而國際版有24個(gè)。不過,英特爾Habana Labs首席運(yùn)營官Eitan Medina表示,“從客戶使用情況來看,預(yù)計(jì)影響會(huì)非常小”。
Gaudi2的推出,為訓(xùn)練大模型提供了英偉達(dá)之外的替代方案。在此之前,英偉達(dá)的GPU芯片——A100與H100,幾乎壟斷了訓(xùn)練大模型的市場(chǎng)。供需的極度不平衡也讓GPU一芯難求。
相比英偉達(dá)GPU,Gaudi2最顯著的優(yōu)勢(shì)在于“更高的性價(jià)比”。英特爾表示,將致力于為中國用戶提供更高的深度學(xué)習(xí)性能和效率,從而成為大規(guī)模部署AI的更優(yōu)解。
目前,英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習(xí)加速器的浪潮信息AI服務(wù)器。此外,新華三與超聚變也是英特爾的合作伙伴。