A Bing Chat annyira GPU-éhes, hogy a Microsoft bérelni fogja az Oracle-t

A Bing Chat annyira GPU-éhes, hogy a Microsoft bérelni fogja az Oracle-t

A Bing Chat annyira GPU-éhes, hogy a Microsoft bérbe adja az Oracle PlatoBlockchain Data Intelligence-jét. Függőleges keresés. Ai.

A Microsoft mesterséges intelligencia-szolgáltatásai iránti kereslet láthatóan olyan nagy – vagy Redmond erőforrásai annyira szűkösek –, hogy a szoftveróriás a kedden bejelentett többéves megállapodás részeként a Bing Search által használt gépi tanulási modellek egy részét az Oracle GPU-szuperfürtjére tervezi.

"Az Oracle-lel való együttműködésünk és az Oracle Cloud infrastruktúra, valamint a Microsoft Azure AI infrastruktúra használata kiterjeszti az ügyfelekhez való hozzáférést, és javítja számos keresési eredményenk sebességét" - magyarázta Divya Kumar, a Microsoft keresési és AI marketingcsapatának vezetője. a nyilatkozat.

A partnerség lényegében a következőkből áll: a Microsoftnak több számítási erőforrásra van szüksége ahhoz, hogy lépést tudjon tartani mesterségesintelligencia-szolgáltatásainak állítólagos „robbanásszerű növekedésével”, és az Oracle-nek történetesen több tízezer Nvidia A100 és H100 GPU bérelhető. Távol álljon tőlünk, hogy azt sugalljuk, a Larry-Ellison által alapított adatbázis-óriásnak nincs elegendő felhőalapú ügyfele a szilíciumkészletek fogyasztásához.

A Microsoft az elsők között integrálta a generatív AI chatbotot keresőmotorjába a indít a Bing Chatről februárban. Ma már mindannyian ismerik a gyakorlatot: üzeneteket, kéréseket vagy lekérdezéseket táplálhat be a Bing Chatbe, és az megpróbál információkat keresni, rossz verseket írni, képeket és egyéb tartalmakat generálni stb.

A szolgáltatást alátámasztó nagy nyelvi modellek nemcsak a GPU-k tömeges fürtjére van szükségük a betanításhoz, hanem a következtetésekhez – a modell működésbe hozásának folyamatához – a méretarányos futáshoz. Az Oracle GPU-készlete segít ebben a következtetési munkában.

A két felhőszolgáltató legújabb együttműködése kihasználja az Oracle Interconnect for Microsoft Azure előnyeit, amely lehetővé teszi az Azure-ban futó szolgáltatások interakcióját az Oracle Cloud Infrastructure (OCI) erőforrásaival. A két szuperhadtestnek van korábban a szolgáltatás segítségével lehetővé tette az ügyfelek számára, hogy az Azure-ban futó munkaterheléseket visszakapcsolják az OCI-adatbázisokhoz.

Ebben az esetben a Microsoft a rendszert az Azure Kubernetes Service mellett használja az Oracle GPU-csomópontjainak összehangolására, hogy lépést tartson a Bing mesterséges intelligencia-szolgáltatásai iránti kereslettel.

A StatCounter szerint 2023 októberében a Bingnek volt egy 3.1 százalék globális internetes keresési piaci részesedés minden platformon – ez a Google 91.6 százalékához képest, de az előző hónap 3 százalékához képest. Az asztali számítógépeken a Bing 9.1 százalékra, a táblagépeknél pedig 4.6 százalékra kúszott fel.

Lehet, hogy a StatCounter téved; talán a Microsoft csevegő keresője nem olyan megdöbbentően népszerű, mint ahogyan azt hiszik. Lehet, hogy a Microsoft csak azt akarja elérni, hogy a Bing úgy nézzen ki, mintha nagy kereslet lenne rá; Lehet, hogy Redmondnak tényleg szüksége van az extra számításra.

Az Oracle azt állítja, hogy felhő-szuperfürtjei, amelyeket feltehetően a Bing fog használni, mindegyik 32,768 100 Nvidia A16,384-ra vagy 100 XNUMX HXNUMX GPU-ra méretezhető egy rendkívül alacsony késleltetésű Remote Direct Memory Access (RDMA) hálózat segítségével. Ezt támogatja a petabájtnyi nagy teljesítményű fürt fájltároló, amelyet a párhuzamos alkalmazások támogatására terveztek.

A Microsoft nem közölte, hogy az Oracle GPU-csomópontjai közül hány darabra van szüksége mesterségesintelligencia-szolgáltatásaihoz és -alkalmazásaihoz, és nem is fogja megmondani. Egy szóvivő azt mondta nekünk: "Ezek nem olyan részletek, amelyeket a bejelentés részeként osztunk meg." Az Oracle-től is kértünk további információkat, és értesíteni fogjuk, ha bármit hallunk.

Nem ez az első alkalom, hogy az ellenségesek egymásnak támaszkodnak segítségért. Még szeptemberben az Oracle bejelentés adatbázisrendszereit a Microsoft Azure adatközpontjaiban helyezné el. Ebben az esetben az együttműködés célja az volt, hogy csökkentse az OCI-ban futó Oracle-adatbázisok és az Azure-beli munkaterhelések összekapcsolásához kapcsolódó késést. ®

Időbélyeg:

Még több A regisztráció