Llama 3 vine în mai – Ar trebui să se îngrijoreze OpenAI? - Decriptează

Llama 3 vine în mai – Ar trebui să se îngrijoreze OpenAI? – Decriptează

Llama 3 Is Coming in May—Should OpenAI Be Worried? - Decrypt PlatoBlockchain Data Intelligence. Vertical Search. Ai.

La un eveniment AI de mare profil din Londra, directorii Meta au oferit marți prima confirmare oficială și detalii despre lansarea iminentă a Llama 3, următoarea iterație foarte așteptată a modelului de limbă mare open-source al companiei.

„În luna următoare, de fapt mai puțin, sperăm într-o perioadă foarte scurtă de timp, sperăm să începem să lansăm noua noastră suită de modele de fundație de ultimă generație, Llama 3”, a anunțat Nick Clegg, președintele pentru afaceri globale al Meta, la Meta. Ziua AI Londra, raportate TechCrunch.

Clegg a spus că Llama 3 constă dintr-un număr de modele diferite, cu capacități diferite, versatilități diferite, care vor începe să fie lansate în acest an.

Odată ce se lansează, Llama 3 este de aşteptat să fie cel mai avansat model open-source disponibil, Meta investind masiv în dezvoltarea sa. Modelul a fost antrenat cu 140 de miliarde de parametri, spune Meta, de două ori capacitatea lui Llama 2. CEO-ul Meta Mark Zuckerburg a avut dezlânat unele detalii tehnice din ianuarie.

„Clădim o infrastructură de calcul masivă pentru a susține viitoarea noastră foaie de parcurs, inclusiv 350 H100 până la sfârșitul acestui an și, în general, aproape 600 echivalente H100 de calcul dacă includeți alte GPU”, a spus Zuckerberg la acea vreme. Această cantitate de putere de calcul este semnificativ mai mare decât cea utilizată de OpenAI pentru a antrena GPT-4, care a fost estimativ pentru a necesita aproximativ 25,000 de GPU-uri în 90 până la 100 de zile.

Zuckerberg, de asemenea dezvăluit că Meta AI, asistentul său AI, este setat să fie alimentat de Llama 3.

Chris Cox, Chief Product Officer, a declarat că Llama 3 va fi integrat în Meta.

„Planul nostru va fi ca Llama 3 să alimenteze mai multe produse și experiențe diferite în familia noastră de aplicații”, a spus el.

Strategia open-source

Impactul lansării Llama 3 se extinde cu mult dincolo de Meta, având în vedere angajamentul filozofic al companiei de a-l dezvolta ca model open-source, în contrast clar cu abordarea închisă, proprietară, adoptată de rivali precum OpenAI cu ChatGPT.

Prin aprovizionarea cu modele de limbaj deschise, Meta își propune să cultive un ecosistem de dezvoltare deschisă a AI și să poziționeze familia Llama ca fundament pentru o gamă variată de instrumente și aplicații create de dezvoltatori și cercetători terți.

„Este foarte important să ne dăm seama că inovațiile se bazează întotdeauna pe contribuțiile anterioare ale altora, uneori foarte asemănătoare”, a scris luna trecută Yann LeCun, șeful de cercetare AI al Meta. „De aceea cercetarea deschisă este atât de importantă: face ca domeniul să avanseze mai repede pentru toată lumea.”

Acest etos deschis a generat deja o comunitate vibrantă care se adună în jurul lui Llama. Unele dintre cele mai avansate modele de limbaj open-source astăzi, cum ar fi Mistral, Şoim, și Beluga, sunt construite prin reglarea fină a modelului de fundație Llama 2 anterior. Câteva dintre aceste modele de comunitate s-au egalat sau au depășit performanța GPT-3.5 la anumite benchmark-uri.

Lansarea Llama-3 ca un alt model de bază open-source deschide probabil calea pentru o nouă generație de LLM-uri care va pune ștacheta și mai sus în ceea ce privește calitatea și eficiența în AI.

Provocarea dominației OpenAI

Premisa open-source a lui Llama 3 reprezintă o provocare formidabilă și cu mai multe straturi pentru dominația actuală a OpenAI pe piață și, prin extensie, pentru alte modele proprietare precum Claude și Gemini.

Comunitatea cu sursă deschisă va putea în curând să se bazeze pe Llama 3 și să-și repete rapid variațiile la potențial egalează sau depășește capacitățile GPT-4— exact așa cum au făcut împotriva GPT-3.5. Cu costuri mai mici de formare împărțite între participanți, ecosistemul deschis ar putea trece peste dezvoltarea modelului proprietar OpenAI, care necesită resurse și costuri de calcul imense.

În cazul în care ofertele open-source ating în mod regulat paritatea cu ofertele comerciale, întreprinderile ar putea gravita către ecosistemele mai accesibile și mai rentabile precum Llama, mai degrabă decât să se bazeze și să plătească pentru OpenAI. În prezent, GPT-4 este cel mai scump model de pe piață în ceea ce privește costul pe token.

Mai mult, comunitatea open-source devine mai puternică pe măsură ce mai mulți oameni se implică în ea. Meta beneficiază de a avea o comunitate imensă care se construiește pe deasupra modelului, de a-l ajusta, de a dezvolta noi tehnologii și de a-l îmbunătăți gratuit. Acest lucru face mai ușor pentru Meta să dezvolte versiuni mai bune ale modelului său, în timp ce îl monetizează prin scheme alternative precum acordându-l licențe pentru utilizare comercială de către industriile mari.

Cu alte cuvinte, inerția continuă și efectele de rețea ar putea îngreuna ca modelele brevetate OpenAI să atragă utilizatori și clienți în viitor.

Cu siguranță, OpenAI deține în prezent un lider puternic în ceea ce privește profitabilitatea. Anthropic se poate lăuda cu cel mai performant LLM în spațiul AI. Dar Llama 3 va reprezenta o altă lovitură strategică a Meta pentru a răsturna peisajul AI generativ.

Desigur, mult depinde de performanța și de adoptarea Llama 3 în lumea reală în anul următor. Dar comunitatea open-source AI este destul de activă – și iubește deja Llama-2. Lucrurile vor deveni foarte interesante în următoarele câteva luni, în special cu GPT-5 de la OpenAI chiar după colt.

Editat de Ryan Ozawa.

Fiți la curent cu știrile cripto, primiți actualizări zilnice în căsuța dvs. de e-mail.

Timestamp-ul:

Mai mult de la decriptaţi