Llama 3 llegará en mayo: ¿debería preocuparse OpenAI?

Reeditado por Platón

seguidores: 0

En un evento de IA de alto perfil en Londres, los ejecutivos de Meta proporcionaron el martes la primera confirmación oficial y detalles sobre el inminente lanzamiento de Llama 3, la muy esperada próxima versión del modelo de lenguaje grande de código abierto de la compañía.

"Dentro del próximo mes, en realidad menos, con suerte en un período de tiempo muy corto, esperamos comenzar a implementar nuestro nuevo conjunto de modelos básicos de próxima generación, Llama 3", anunció Nick Clegg, presidente de asuntos globales de Meta, en Meta. Día de la IA en Londres, reportaron TechCrunch.

Clegg dijo que Llama 3 consta de "varios modelos diferentes con diferentes capacidades, diferentes versatilidades" que comenzarán a implementarse a lo largo de este año.

Una vez que se lanza, Llama 3 está esperado ser el modelo de código abierto más avanzado disponible, y Meta invierte mucho en su desarrollo. El modelo fue entrenado con 140 mil millones de parámetros, dice Meta, el doble de la capacidad de Llama 2. El director ejecutivo de Meta, Mark Zuckerburg, había burlado algunos de los detalles técnicos en enero.

"Estamos construyendo una infraestructura informática masiva para respaldar nuestra hoja de ruta futura, incluidas 350 H100 para finales de este año y, en general, casi 600 equivalentes de computación H100 si se incluyen otras GPU", dijo Zuckerberg en ese momento. Esta cantidad de potencia informática es significativamente mayor que la utilizada por OpenAI para entrenar GPT-4, que fue estimado requerir alrededor de 25,000 GPU en 90 a 100 días.

Zuckerberg también revelado que Meta AI, su asistente de IA, funcionará con Llama 3.

Chris Cox, director de productos, dijo que Llama 3 se integrará en Meta.

"Nuestro plan será que Llama 3 impulse múltiples productos y experiencias diferentes en nuestra familia de aplicaciones", dijo.

La estrategia del código abierto

El impacto del lanzamiento de Llama 3 se extiende mucho más allá de Meta, dado el compromiso filosófico de la compañía de desarrollarlo como un modelo de código abierto, en claro contraste con el enfoque cerrado y propietario adoptado por rivales como OpenAI con ChatGPT.

Al abrir sus modelos de lenguaje, Meta tiene como objetivo fomentar un ecosistema de desarrollo de IA abierto y posicionar a la familia Llama como la base para una amplia gama de herramientas y aplicaciones creadas por desarrolladores e investigadores externos.

"Es muy importante darse cuenta de que las innovaciones siempre se basan en contribuciones previas de otros, a veces muy similares", tuiteó el mes pasado Yann LeCun, jefe de investigación de IA de Meta. "Por eso la investigación abierta es tan importante: hace que el campo avance más rápido para todos".

Desde la distancia, parece que las innovaciones surgen espontáneamente del vacío.
Pero es muy importante darse cuenta de que las innovaciones siempre se basan en contribuciones previas de otros, a veces muy similares.
Por eso la investigación abierta es tan importante: hace que el campo... https://t.co/JMvQD2h5OZ

- Yann LeCun (@ylecun) Marzo 20, 2024

Este espíritu abierto ya ha generado una comunidad vibrante que se une en torno a Llama. Algunos de los modelos de lenguaje de código abierto más avanzados en la actualidad, como Mistral, halcón, y Beluga, se construyen perfeccionando el modelo básico anterior de Llama 2. Varios de estos modelos comunitarios han igualado o superado a GPT-3.5 en ciertos puntos de referencia.

El lanzamiento de Llama-3 como otro modelo fundamental de código abierto probablemente allana el camino para una nueva generación de LLM que pondrá el listón aún más alto en términos de calidad y eficiencia en IA.

Desafiando el dominio de OpenAI

La premisa de código abierto de Llama 3 plantea un desafío formidable y de múltiples niveles para el actual dominio del mercado de OpenAI y, por extensión, para otros modelos propietarios como Claude y Gemini.

La comunidad de código abierto pronto podrá desarrollar Llama 3 e iterar rápidamente sus variaciones para potencialmente igualar o superar las capacidades de GPT-4—Tal como lo hicieron contra GPT-3.5. Con costos de capacitación más bajos compartidos entre los contribuyentes, el ecosistema abierto podría superar el desarrollo del modelo propietario de OpenAI, que requiere inmensos recursos y costos informáticos.

Si las ofertas de código abierto logran regularmente la paridad con las ofertas comerciales, las empresas pueden gravitar hacia ecosistemas más accesibles y rentables como Llama en lugar de depender de OpenAI y pagar por él. Actualmente, GPT-4 es el modelo más caro del mercado en términos de coste por token.

Además, la comunidad de código abierto se fortalece a medida que más personas se involucran en ella. Meta se beneficia de tener una enorme comunidad construida sobre el modelo, ajustándolo, desarrollando nuevas tecnologías y mejorándolo de forma gratuita. Esto facilita que Meta desarrolle mejores versiones de su modelo mientras lo monetiza a través de esquemas alternativos como licenciarlo para uso comercial por grandes industrias.

En otras palabras, la inercia continua y los efectos de la red podrían dificultar que los modelos propietarios de OpenAI atraigan usuarios y clientes en el futuro.

Sin duda, OpenAI actualmente tiene una fuerte ventaja en términos de rentabilidad. Anthropic puede presumir de tener el LLM de mejor rendimiento en el espacio de la IA. Pero Llama 3 representará otro golpe estratégico de Meta para cambiar radicalmente el panorama generativo de la IA.

Por supuesto, mucho depende del rendimiento y la adopción de Llama 3 en el mundo real durante el próximo año. Pero la comunidad de IA de código abierto es bastante activa y ya ama a Llama-2. Las cosas se pondrán muy interesantes en los próximos meses, especialmente con GPT-5 de OpenAI. Al doblar la esquina.

Editado por ryan ozawa.

Manténgase al tanto de las noticias criptográficas, obtenga actualizaciones diarias en su bandeja de entrada.

Distribución de relaciones públicas y contenido potenciado por SEO. Consiga amplificado hoy.
PlatoData.Network Vertical Generativo Ai. Empodérate. Accede Aquí.
PlatoAiStream. Inteligencia Web3. Conocimiento amplificado. Accede Aquí.
PlatoESG. Carbón, tecnología limpia, Energía, Ambiente, Solar, Gestión de residuos. Accede Aquí.
PlatoSalud. Inteligencia en Biotecnología y Ensayos Clínicos. Accede Aquí.
Fuente: https://decrypt.co/225814/llama-3-is-coming-in-may-should-openai-be-worried

Sello de tiempo: Abril 10, 2024

Sello de tiempo: 16 de junio de 2021

Llama 3 llegará en mayo: ¿debería preocuparse OpenAI? – Descifrar

Reeditado por Platón

La estrategia del código abierto

Desafiando el dominio de OpenAI

Manténgase al tanto de las noticias criptográficas, obtenga actualizaciones diarias en su bandeja de entrada.

Mas de Descifrar

Las CBDC podrían 'revolucionar los sistemas financieros globales': Informe

OCC, FDIC, Fed apuntan al equipo de políticas 'interagencial' sobre cripto

Filecoin Group otorga $ 5.8 millones a la Fundación de Libertad de Prensa de Edward Snowden

Core Scientific vendió más Bitcoin de lo que extrajo por segundo mes consecutivo

Bitfinex recupera USD 314 3.6 de los USD 2016 millones robados en el hackeo de Bitcoin de XNUMX – Decrypt

El Banco Central de China pide una represión más amplia de las criptomonedas

La inacción de la SEC en Spot Bitcoin ETF es un 'desastre completo y absoluto', dice Cameron Winklevoss – Decrypt

El precio de XRP aumenta un 17%, Stellar establece un máximo histórico

El mercado de predicción basado en Ethereum muestra una ola roja en los exámenes parciales de EE. UU.

El uso de energía de la red Tron coincide con el de 15 hogares de EE. UU.: informe de CCRI

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta