NVIDIA NIM microservicii acum se integrează cu Amazon SageMaker, permițându-vă să implementați modele de limbaj mari (LLM) de vârf în industrie și să optimizați performanța și costul modelului. Puteți implementa LLM-uri de ultimă generație în câteva minute în loc de zile folosind tehnologii precum NVIDIA TensorRT, NVIDIA TensorRT-LLM, și NVIDIA Triton Inference Server pe instanțele accelerate NVIDIA găzduite de SageMaker.
NIM, parte a NVIDIA AI Enterprise platforma software listată pe Piața AWS, este un set de microservicii de inferență care aduc aplicațiile dvs. puterea LLM-urilor de ultimă generație, oferind capabilități de procesare a limbajului natural (NLP) și înțelegere, indiferent dacă dezvoltați chatbot-uri, rezumați documente sau implementați alte NLP- aplicații alimentate. Puteți folosi containere NVIDIA preconstruite pentru a găzdui LLM-uri populare care sunt optimizate pentru anumite GPU-uri NVIDIA pentru implementare rapidă sau puteți utiliza instrumente NIM pentru a vă crea propriile containere.
În această postare, oferim o introducere la nivel înalt despre NIM și arătăm cum îl puteți utiliza cu SageMaker.
O introducere în NVIDIA NIM
NIM oferă motoare optimizate și pregenerate pentru o varietate de modele populare pentru inferență. Aceste microservicii acceptă o varietate de LLM-uri, cum ar fi Llama 2 (7B, 13B și 70B), Mistral-7B-Instruct, Mixtral-8x7B, NVIDIA Nemotron-3 22B Persona și Code Llama 70B, din cutie folosind pre- a construit motoare NVIDIA TensorRT adaptate pentru anumite GPU-uri NVIDIA pentru performanță și utilizare maximă. Aceste modele sunt organizate cu hiperparametrii optimi pentru performanța de găzduire a modelelor pentru implementarea cu ușurință a aplicațiilor.
Dacă modelul dvs. nu se află în setul de modele organizate de NVIDIA, NIM oferă utilități esențiale, cum ar fi Model Repo Generator, care facilitează crearea unui motor accelerat de TensorRT-LLM și a unui director de modele în format NIM printr-un fișier YAML simplu. În plus, un backend comunitar integrat al vLLM oferă suport pentru modele de ultimă oră și caracteristici emergente care este posibil să nu fi fost integrate perfect în stiva optimizată pentru TensorRT-LLM.
Pe lângă crearea de LLM-uri optimizate pentru inferență, NIM oferă tehnologii avansate de găzduire, cum ar fi tehnici de programare optimizate, cum ar fi loturile în timpul zborului, care pot descompune procesul general de generare a textului pentru un LLM în mai multe iterații ale modelului. Cu lotul în timpul zborului, în loc să așteptați ca întregul lot să se termine înainte de a trece la următorul set de solicitări, timpul de execuție NIM scoate imediat secvențele terminate din lot. Timpul de execuție începe apoi să ruleze solicitări noi în timp ce alte solicitări sunt încă în curs de desfășurare, valorificând cel mai bine instanțele de calcul și GPU-urile.
Implementarea NIM pe SageMaker
NIM se integrează cu SageMaker, permițându-vă să vă găzduiți LLM-urile cu performanță și optimizare a costurilor, beneficiind în același timp de capacitățile SageMaker. Când utilizați NIM pe SageMaker, puteți utiliza capabilități precum extinderea numărului de instanțe pentru a găzdui modelul dvs., efectuarea de implementări albastru/verde și evaluarea sarcinilor de lucru utilizând testarea umbră - toate cu cea mai bună observabilitate și monitorizare din clasă. Amazon CloudWatch.
Concluzie
Utilizarea NIM pentru a implementa LLM-uri optimizate poate fi o opțiune excelentă atât pentru performanță, cât și pentru cost. De asemenea, ajută la implementarea LLM-urilor fără efort. În viitor, NIM va permite, de asemenea, metode de personalizare de reglare fină eficientă a parametrilor (PEFT) precum LoRA și P-tuning. NIM intenționează, de asemenea, să aibă suport LLM prin suportul Triton Inference Server, TensorRT-LLM și backend-urile vLLM.
Vă încurajăm să aflați mai multe despre microservicii NVIDIA și despre cum să vă implementați LLM-urile folosind SageMaker și să încercați beneficiile disponibile pentru dvs. NIM este disponibil ca ofertă plătită ca parte a abonamentului software NVIDIA AI Enterprise disponibil pe AWS Marketplace.
În viitorul apropiat, vom posta un ghid aprofundat pentru NIM pe SageMaker.
Despre autori
James Park este arhitect de soluții la Amazon Web Services. El lucrează cu Amazon.com pentru a proiecta, construi și implementa soluții tehnologice pe AWS și are un interes deosebit pentru AI și învățarea automată. În timpul liber, îi place să caute noi culturi, experiențe noi și să fie la curent cu cele mai recente tendințe tehnologice. Îl puteți găsi pe LinkedIn.
Saurabh Trikande este Senior Product Manager pentru Amazon SageMaker Inference. Este pasionat de lucrul cu clienții și este motivat de obiectivul democratizării învățării automate. El se concentrează pe provocările de bază legate de implementarea de aplicații ML complexe, modele ML multi-locatari, optimizări ale costurilor și de a face implementarea modelelor de învățare profundă mai accesibilă. În timpul liber, lui Saurabh îi place să facă drumeții, să învețe despre tehnologii inovatoare, să urmeze TechCrunch și să petreacă timpul cu familia sa.
Qing Lan este inginer de dezvoltare software în AWS. El a lucrat la mai multe produse provocatoare în Amazon, inclusiv soluții de inferență ML de înaltă performanță și un sistem de înregistrare de înaltă performanță. Echipa Qing a lansat cu succes primul model cu miliard de parametri în Amazon Advertising, cu o latență foarte scăzută necesară. Qing are cunoștințe aprofundate despre optimizarea infrastructurii și accelerarea Deep Learning.
Nikhil Kulkarni este un dezvoltator de software cu AWS Machine Learning, concentrându-se pe a face sarcinile de lucru de învățare automată mai performante pe cloud și este co-creator al AWS Deep Learning Containers pentru instruire și inferență. Este pasionat de sistemele de Deep Learning distribuite. În afara serviciului, îi place să citească cărți, să se joace cu chitara și să facă pizza.
Harish Tummalacherla este inginer software cu echipa Deep Learning Performance la SageMaker. Lucrează la inginerie de performanță pentru a servi eficient modele de limbaj mari pe SageMaker. În timpul liber, îi place alergarea, ciclismul și schi alpinism.
Eliuth Triana Isaza este manager de relații cu dezvoltatori la NVIDIA, împuternicește AI MLOps, DevOps, oamenii de știință și experții tehnici AWS de la Amazon să stăpânească stiva de calcul NVIDIA pentru accelerarea și optimizarea modelelor Generative AI Foundation, de la curatarea datelor, instruirea GPU, inferența modelului și implementarea producției pe instanțele GPU AWS . În plus, Eliuth este un pasionat de ciclism montan, schior, tenis și poker.
Jiahong Liu este arhitect de soluții în echipa de furnizori de servicii cloud de la NVIDIA. El ajută clienții să adopte soluții de învățare automată și inteligență artificială care folosesc calcularea accelerată NVIDIA pentru a-și aborda provocările de formare și inferență. În timpul liber, îi place origami, proiecte de bricolaj și joacă baschet.
Kshitiz Gupta este arhitect de soluții la NVIDIA. Îi face plăcere să educe clienții din cloud despre tehnologiile GPU AI pe care le oferă NVIDIA și să-i ajute să-și accelereze învățarea automată și aplicațiile de deep learning. În afara serviciului, îi place să alerge, să facă drumeții și să urmărească fauna sălbatică.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/optimize-price-performance-of-llm-inference-on-nvidia-gpus-using-the-amazon-sagemaker-integration-with-nvidia-nim-microservices/
- :are
- :este
- :nu
- $UP
- 100
- 121
- 7
- a
- Despre Noi
- accelerat
- accelerarea
- accelerare
- accesibil
- plus
- adresa
- Adoptarea
- avansat
- Promovare
- AI
- permite
- Permiterea
- de asemenea
- Amazon
- Amazon SageMaker
- Amazon Web Services
- Amazon.com
- an
- și
- aplicatii
- SUNT
- AS
- asistarea
- asistă
- At
- disponibil
- AWS
- Învățare automată AWS
- Backend
- backend-uri
- Baschet
- dozare
- BE
- fost
- înainte
- începe
- beneficiind
- Beneficiile
- CEL MAI BUN
- Manuale
- atât
- Cutie
- Pauză
- aduce
- construi
- by
- CAN
- capacități
- provocări
- provocare
- chatbots
- clientii
- Cloud
- cod
- COM
- comunitate
- complex
- Calcula
- tehnica de calcul
- Containere
- Nucleu
- A costat
- crea
- Crearea
- creaţie
- culturi
- curator
- custozi
- clienţii care
- personalizare
- ultima generație
- de date
- Data
- Zi
- adânc
- învățare profundă
- democratizarea
- implementa
- Implementarea
- desfășurarea
- implementări
- Amenajări
- Dezvoltator
- în curs de dezvoltare
- Dezvoltare
- director
- distribuite
- diy
- documente
- jos
- uşura
- educarea
- eficient
- fără efort
- șmirghel
- împuternicirea
- încuraja
- Motor
- inginer
- Inginerie
- Motoare
- Afacere
- software pentru întreprinderi
- esenţial
- evaluarea
- Experiențe
- experți
- facilitează
- familie
- DESCRIERE
- Fișier
- Găsi
- termina
- First
- zbor
- se concentrează
- concentrându-se
- următor
- Pentru
- Fundație
- din
- În plus
- viitor
- generaţie
- generativ
- AI generativă
- generator
- scop
- GPU
- unități de procesare grafică
- mare
- ghida
- Avea
- he
- ajută
- Înalt
- la nivel înalt
- -l
- lui
- gazdă
- găzduit
- găzduire
- Cum
- Cum Pentru a
- http
- HTTPS
- imediat
- Punere în aplicare a
- in
- în profunzime
- Inclusiv
- lider în industrie
- Infrastructură
- inovatoare
- tehnologii inovatoare
- in schimb
- integra
- integrate
- integreaza
- integrare
- interes
- în
- Introducere
- IT
- iterații
- jpeg
- jpg
- cunoştinţe
- limbă
- mare
- Latență
- Ultimele
- a lansat
- AFLAȚI
- învăţare
- Pârghie
- ca
- listat
- Lamă
- LLM
- logare
- Jos
- maşină
- masina de învățare
- face
- Efectuarea
- manager
- maestru
- maxim
- Mai..
- Metode
- microservices
- minute
- ML
- MLOps
- model
- Modele
- Monitorizarea
- mai mult
- motivat
- Munte
- în mişcare
- multiplu
- Natural
- Procesarea limbajului natural
- În apropiere
- Nou
- următor
- nlp
- acum
- număr
- Nvidia
- of
- oferi
- oferind
- promoții
- on
- optimă
- optimizare
- optimizări
- Optimizați
- optimizate
- optimizarea
- Opțiune
- or
- Altele
- afară
- exterior
- global
- propriu
- plătit
- parte
- special
- pasionat
- performanță
- efectuarea
- Pizza
- Planurile
- platformă
- Plato
- Informații despre date Platon
- PlatoData
- player
- joc
- poker
- Popular
- Post
- putere
- proces
- prelucrare
- Produs
- manager de produs
- producere
- Produse
- Proiecte
- furniza
- furnizorul
- furnizează
- furnizarea
- Rapid
- mai degraba
- Citind
- legate de
- relaţii
- cereri de
- necesar
- funcţionare
- Runtime
- sagemaker
- SageMaker Inference
- scalare
- programare
- oamenii de stiinta
- perfect
- caută
- senior
- serverul
- serviciu
- Furnizor de servicii
- Servicii
- servire
- set
- câteva
- Umbră
- Arăta
- Software
- de dezvoltare de software
- Inginer Software
- soluţie
- soluţii
- tensiune
- specific
- Cheltuire
- stivui
- de ultimă oră
- ședere
- Încă
- simplu
- abonament
- Reușit
- astfel de
- a sustine
- De sprijin
- sistem
- sisteme
- adaptate
- echipă
- TechCrunch
- Tehnic
- tehnici de
- Tehnologii
- Tehnologia
- tenis
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- decât
- acea
- Viitorul
- lor
- Lor
- apoi
- Acestea
- acest
- Prin
- timp
- la
- Unelte
- Pregătire
- Tendinţe
- Triton
- încerca
- înţelegere
- utilizare
- folosind
- utilitati
- varietate
- foarte
- Aşteptare
- vizionarea
- we
- web
- servicii web
- cand
- dacă
- care
- în timp ce
- întreg
- voi
- cu
- Apartamente
- de lucru
- fabrică
- yaml
- Tu
- Ta
- zephyrnet