Intel valmistelee vähätehoisia Gaudi 3 -siruja Kiinaa varten

Intel valmistelee vähätehoisia Gaudi 3 -siruja Kiinaa varten

Intel valmistelee pienemmän tehon Gaudi 3 -siruja China PlatoBlockchain Data Intelligencelle. Pystysuuntainen haku. Ai.

Intel aikoo tuoda markkinoille kaksi Kiinassa yksinoikeudellista mallia Gaudi 3 AI -kiihdyttimestään, ja ne tulevat olemaan huomattavasti vammautuneet sopimaan Yhdysvaltojen pakotteisiin.

Kahden Keski-Britanniassa myytäväksi hyväksytyn mallin olemassaolo on kuvattu yksityiskohtaisesti Intelin Gaudi 3 -raportti. HL-328:ksi ja HL-388:ksi kutsutut Kiinalle tehdyt prosessorit ovat OAM- ja PCIe-muotoisia, joista ensimmäinen lanseerataan kesäkuussa ja jälkimmäinen syyskuussa yhdessä muun PCIe-muototekijän Gaudi 3:n kanssa.

Kaiken kaikkiaan HL-328 ja HL-388 näyttävät enemmän tai vähemmän samalta kuin muut, ja niissä on sama 128 Gt HBM2e VRAM 3.7 Tt/s kaistanleveydellä, 96 Mt välimuisti, PCIe 5.0 x16 -liitäntä ja dekoodausstandardit.

Ainoa ero on lämpösuunnittelutehossa, joka on 450 wattia sekä OAM- että PCIe-korttimalleissa. Tämä on huomattava vähennys muihin malleihin verrattuna. Muun kuin Kiinan PCIe HL-338:n TDP on 600 wattia, ja OAM-muotokertoimen HL-325L ja HL-335 kantavat 900 wattia. Suhteellisen alhainen TDP China Gaudi 3 -malleissa johtuu oletettavasti siitä, että nestejäähdytteistä versiota ei ole.

Vaikka sitä ei ole nimenomaisesti mainittu julkaisussa, muutosten tekeminen oli lähes varmasti tarpeen Yhdysvaltain hallituksen vientivalvonta prosessoreihin, jotka kieltävät amerikkalaisia ​​yrityksiä viemästä siruja Kiinaan suorituskyvyn mukaan. 

Emme todellakaan voi tietää, mitä Intel on tehnyt Gaudi 3:n kanssa saadakseen sen yhteensopivaksi ja kuinka nopeasti nämä Kiinalle hyväksytyt sirut toimivat näillä muutoksilla, mutta joitakin vihjeitä on. HL-328 ja HL-388 käyttävät edelleen kahta meistiä, kuten muut Gaudi 3 -versiot, koska muistin ja välimuistin kokoonpano on muuttumaton. Kahden meistin käyttäminen yhden sijasta auttaa vähentämään suoritustiheyttä, jolloin siru saavuttaa 4,800 XNUMX kokonaisprosessointitehon (TPP) korkeamman vientirajan.

Tämä 4,800 150 TPP:n raja tarkoittaa, että yhdelläkään sirulla ei voi olla 16 TFLOPS tai enemmän 3-bittisellä suorituskyvyllä, ja koska Gaudi 1,835 voi tehdä jopa 16 XNUMX TFLOPS:ia BFXNUMX:lla, Intelin on leikattava suorituskykyä voimakkaasti. Tämä olisi saavutettava todella massiivisella ydinmäärän ja kellonopeuden leikkauksella tai jollain muulla suorituskykyä rajoittavalla menetelmällä.

Olemme pyytäneet Inteliltä selvitystä Kiinan yksinomaisista Gaudi 3 -malleista, emmekä ole vielä saaneet vastausta. Päivitämme, jos Intel paljastaa tietoja.

Voimme luultavasti odottaa, että HL-328 ja HL-388 toimivat samalla tavalla kuin Nvidian H20, piititaanin nopein GPU, joka on hyväksytty myyntiin Kiinassa. Siinä on 148 TFLOPS FB16- ja FP16-suorituskykyä, hieman alle 150 TFLOPS:n rajan.

Koska raakaydinsuorituskyky on suunnilleen sama Gaudi 20:n H3:n ja Kiinan mallien välillä, suurin ero tulee muistiin, jossa Intelillä on enemmän kapasiteettia mutta hieman vähemmän kaistanleveyttä, ja ohjelmistoon, joka on aina ollut myyntivaltti. Nvidia-siruille. ®

Aikaleima:

Lisää aiheesta Rekisteri