Májusban érkezik a Llama 3 – Aggódnia kell az OpenAI-nak? - Decrypt

Májusban érkezik a Llama 3 – Aggódnia kell az OpenAI-nak? – Dekódolás

Májusban érkezik a Llama 3 – Aggódnia kell az OpenAI-nak? - Decrypt PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Egy nagy horderejű londoni mesterségesintelligencia-eseményen a Meta vezetői kedden megadták az első hivatalos megerősítést és részleteket a Llama 3 küszöbön álló megjelenéséről, a vállalat nyílt forráskódú nagynyelvi modelljének várva várt következő iterációjáról.

"A következő hónapon belül, valójában kevesebben, remélhetőleg nagyon rövid időn belül, reméljük, hogy elkezdjük a következő generációs alapozómodellek, a Llama 3 piacra dobását" - jelentette be Nick Clegg, a Meta globális ügyekért felelős elnöke a Metában. AI Day London, jelentett TechCrunch.

Clegg elmondta, hogy a Llama 3 „számos különböző modellből áll, különböző képességekkel, különböző sokoldalúsággal”, amelyek bevezetése még ebben az évben kezdődik.

Amint elindul, a Llama 3 az várható az elérhető legfejlettebb nyílt forráskódú modell, amelynek fejlesztésébe a Meta sokat fektet. A modellt 140 milliárd paraméterrel képezték ki a Meta szerint, kétszer akkora kapacitással, mint a Llama 2. Mark Zuckerburg, a Meta vezérigazgatója ugratta néhány technikai részletet januárban.

„Hatalmas számítási infrastruktúrát építünk ki jövőbeli ütemtervünk támogatására, ideértve az idei év végére 350 100 H600-at – és összességében majdnem 100 4 HXNUMX-as számítási egyenértéket, ha más GPU-kat is beleszámítunk” – mondta Zuckerberg akkor. Ez a számítási teljesítmény lényegesen nagyobb, mint az OpenAI által a GPT-XNUMX betanítására használt mennyiség, ami volt becsült körülbelül 25,000 90 GPU-t igényel 100-XNUMX napon belül.

Zuckerberg is kiderült hogy a Meta AI-t, az AI-asszisztenst a Llama 3 hajtja.

Chris Cox, termékigazgató elmondta, hogy a Llama 3-at a Metában integrálni fogják.

„Az lesz a tervünk, hogy a Llama 3 több különböző terméket és élményt biztosítson az alkalmazáscsaládunkban” – mondta.

A nyílt forráskódú stratégia

A Llama 3 kiadásának hatása messze túlmutat a Metán, tekintettel a vállalat filozófiai elkötelezettségére, hogy nyílt forráskódú modellként fejlessze ki, ami egyértelmű ellentétben áll az olyan riválisok zárt, szabadalmaztatott megközelítésével, mint az OpenAI a ChatGPT-vel.

Nyelvi modelljeik nyílt forráskódú beszerzésével a Meta a nyílt mesterségesintelligencia-fejlesztés ökoszisztémáját kívánja ápolni, és a Llama családot a külső fejlesztők és kutatók által létrehozott sokféle eszköz és alkalmazás alapjaként pozicionálni.

"Nagyon fontos felismerni, hogy az innovációk mindig mások korábbi hozzájárulásaira épülnek, néha nagyon hasonlóakra" - üzente Yann LeCun, a Meta mesterséges intelligenciával foglalkozó kutatási vezetője a múlt hónapban. „Ezért olyan fontos a nyílt kutatás: mindenki számára gyorsabbá teszi a terület előrehaladását.”

Ezt nyitott szellemiség máris élénk közösséget szült, amely Llama körül tömörül. A mai legfejlettebb nyílt forráskódú nyelvi modellek közül néhány, mint pl Misztrál, Sólyom, és Beluga, a korábbi Llama 2 alapozó modell finomhangolásával készültek. E közösségi modellek közül több megfelelt vagy felülmúlta a GPT-3.5-öt bizonyos benchmarkokon.

A Llama-3, mint egy másik nyílt forráskódú alapmodell megjelenése valószínűleg megnyitja az utat az LLM-ek új generációja előtt, amely még magasabbra teszi a lécet az AI minősége és hatékonysága tekintetében.

Kihívás az OpenAI-dominanciára

A Llama 3 nyílt forráskódú előfeltétele óriási és többrétegű kihívás elé állítja az OpenAI jelenlegi piaci dominanciáját, és – kiterjesztve – más szabadalmaztatott modelleket is, mint például a Claude és a Gemini.

A nyílt forráskódú közösség hamarosan építhet a Llama 3-ra, és gyorsan megismétli azok változatait, hogy potenciálisan egyezik vagy haladja meg a GPT-4 képességeit– ahogy a GPT-3.5 ellen is tették. Az alacsonyabb képzési költségeknek köszönhetően, amelyek a közreműködők között oszlanak meg, a nyílt ökoszisztéma átugorhatja az OpenAI szabadalmaztatott modellfejlesztését, amely óriási számítási erőforrásokat és költségeket igényel.

Ha a nyílt forráskódú ajánlatok rendszeresen paritást érnek el a kereskedelmi ajánlatokkal, a vállalatok inkább az elérhetőbb és költséghatékonyabb ökoszisztémák felé fordulnak, mint a Llama, ahelyett, hogy az OpenAI-ra hagyatkoznának és fizetnének érte. Jelenleg a GPT-4 a legdrágább modell a piacon a tokenenkénti költséget tekintve.

Ezenkívül a nyílt forráskódú közösség egyre erősebbé válik, ahogy egyre többen vesznek részt benne. A Metának előnye származik abból, hogy hatalmas közösséget épít a modellre, finomhangolja, új technológiákat fejleszt és ingyenesen fejleszt. Ez megkönnyíti a Meta számára a modell jobb verzióinak kifejlesztését, miközben alternatív sémákon keresztül bevételt szerez belőle nagy iparágak általi kereskedelmi használatra történő engedélyezése.

Más szavakkal, a folyamatos tehetetlenség és a hálózati hatások megnehezíthetik az OpenAI szabadalmaztatott modelljei felhasználók és ügyfelek vonzását a jövőben.

Az biztos, hogy az OpenAI jelenleg erősen vezet a jövedelmezőség terén. Az Anthropic a legjobban teljesítő LLM-vel büszkélkedhet az AI-térben. A Llama 3 azonban a Meta újabb stratégiai csapása lesz, hogy felforgatja a generatív mesterséges intelligencia környezetet.

Természetesen sok múlik a Llama 3 valós teljesítményén és az elkövetkező évben történő alkalmazásán. De a nyílt forráskódú mesterséges intelligencia közösség meglehetősen aktív – és máris szereti a Llama-2-t. A dolgok nagyon érdekesek lesznek a következő néhány hónapban, különösen az OpenAI GPT-5 esetében közvetlenül a sarkon.

Szerkesztette Ryan Ozawa.

Maradjon naprakész a kriptográfiai hírekkel, és napi frissítéseket kaphat a postaládájában.

Időbélyeg:

Még több visszafejtése