Lansert i 2021, Amazon SageMaker Canvas er en visuell pek-og-klikk-tjeneste for å bygge og distribuere modeller for maskinlæring (ML) uten å måtte skrive noen kode. Bruksklare grunnmodeller (FM) tilgjengelig i SageMaker Canvas gjør det mulig for kunder å bruke generativ AI for oppgaver som innholdsgenerering og oppsummering.
Vi er begeistret over å kunngjøre de siste oppdateringene til Amazon SageMaker Canvas, som bringer spennende nye generative AI-funksjoner til plattformen. Med støtte for Meta Llama 2- og Mistral.AI-modeller og lanseringen av strømmesvar, fortsetter SageMaker Canvas å styrke alle som ønsker å komme i gang med generativ AI uten å skrive en eneste linje med kode. I dette innlegget diskuterer vi disse oppdateringene og fordelene deres.
Vi introduserer Meta Llama 2 og Mistral-modellene
Llama 2 er en banebrytende fundamentmodell fra Meta som tilbyr forbedret skalerbarhet og allsidighet for et bredt spekter av generative AI-oppgaver. Brukere har rapportert at Llama 2 er i stand til å delta i meningsfulle og sammenhengende samtaler, generere nytt innhold og trekke ut svar fra eksisterende notater. Llama 2 er blant de toppmoderne store språkmodellene (LLM) som er tilgjengelig i dag for åpen kildekode-fellesskapet for å bygge sine egne AI-drevne applikasjoner.
Mistral.AI, en ledende fransk AI-start-up, har utviklet Mistral 7B, en kraftig språkmodell med 7.3 milliarder parametere. Mistral-modeller har blitt veldig godt mottatt av åpen kildekode-fellesskapet takket være bruken av Grouped-query-oppmerksomhet (GQA) for raskere inferens, noe som gjør den svært effektiv og yter sammenlignbar med modeller med to ganger eller tre ganger antallet parametere.
I dag er vi glade for å kunngjøre at SageMaker Canvas nå støtter tre Llama 2-modellvarianter og to Mistral 7B-varianter:
For å teste disse modellene, naviger til SageMaker Canvas Bruksklare modeller side, og velg deretter Generer, trekk ut og oppsummer innhold. Det er her du finner SageMaker Canvas GenAI-chatopplevelsen. Her kan du bruke hvilken som helst modell fra Amazon Bedrock eller SageMaker JumpStart ved å velge dem på rullegardinmenyen for modell.
I vårt tilfelle velger vi en av Llama 2-modellene. Nå kan du gi innspill eller spørsmål. Etter hvert som du sender innspillet, videresender SageMaker Canvas dine innspill til modellen.
Å velge hvilken av modellene som er tilgjengelige i SageMaker Canvas som passer best for ditt bruksområde, krever at du tar hensyn til informasjon om selve modellene: Llama-2-70B-chat-modellen er en større modell (70 milliarder parametere, sammenlignet med 13 milliarder med Llama-2-13B-chat ), noe som betyr at ytelsen generelt er høyere enn den mindre, på bekostning av en litt høyere ventetid og en økt kostnad per token. Mistral-7B har ytelser som kan sammenlignes med Llama-2-7B eller Llama-2-13B, men den er vert på Amazon SageMaker. Dette betyr at prismodellen er forskjellig, og går fra en dollar-per-token-prismodell til en dollar-per-time-modell. Dette kan være mer kostnadseffektivt med en betydelig mengde forespørsler per time og konsekvent bruk i stor skala. Alle modellene ovenfor kan fungere godt på en rekke bruksområder, så vårt forslag er å vurdere hvilken modell som best løser problemet ditt, med tanke på produksjon, gjennomstrømning og kostnadsavveininger.
Hvis du leter etter en enkel måte å sammenligne hvordan modeller oppfører seg på, tilbyr SageMaker Canvas denne muligheten i form av modellsammenligninger. Du kan velge opptil tre forskjellige modeller og sende samme forespørsel til dem alle samtidig. SageMaker Canvas vil da få svarene fra hver av modellene og vise dem i et side-ved-side chat-grensesnitt. For å gjøre dette, velg Sammenligne og velg andre modeller å sammenligne med, som vist nedenfor:
Vi introduserer responsstrømming: Interaksjoner i sanntid og forbedret ytelse
Et av de viktigste fremskrittene i denne utgivelsen er introduksjonen av strømmede svar. Streaming av svar gir en rikere opplevelse for brukeren og gjenspeiler bedre en chat-opplevelse. Med strømmesvar kan brukere motta umiddelbar tilbakemelding og sømløs integrasjon i chatbot-applikasjonene sine. Dette gir en mer interaktiv og responsiv opplevelse, og forbedrer den generelle ytelsen og brukertilfredsheten til chatboten. Evnen til å motta umiddelbare svar på en chat-lignende måte skaper en mer naturlig samtaleflyt og forbedrer brukeropplevelsen.
Med denne funksjonen kan du nå samhandle med AI-modellene dine i sanntid, motta øyeblikkelige svar og muliggjøre sømløs integrering i en rekke applikasjoner og arbeidsflyter. Alle modeller som kan spørres i SageMaker Canvas – fra Amazon Bedrock og SageMaker JumpStart – kan streame svar til brukeren.
Kom i gang i dag
Enten du bygger en chatbot, et anbefalingssystem eller en virtuell assistent, gir Llama 2- og Mistral-modellene kombinert med streamede svar forbedret ytelse og interaktivitet til prosjektene dine.
For å bruke de nyeste funksjonene til SageMaker Canvas, sørg for å slette og gjenskape appen. For å gjøre det, logg ut fra appen ved å velge Logg ut, og åpne deretter SageMaker Canvas igjen. Du bør se de nye modellene og nyte de siste utgivelsene. Ved å logge ut av SageMaker Canvas-applikasjonen frigjøres alle ressurser som brukes av arbeidsområdeforekomsten, og unngår derfor å pådra seg ekstra utilsiktede kostnader.
konklusjonen
For å komme i gang med de nye streamede svarene for Llama 2- og Mistral-modellene i SageMaker Canvas, besøk SageMaker-konsoll og utforske det intuitive grensesnittet. For å lære mer om hvordan SageMaker Canvas og generativ AI kan hjelpe deg med å nå forretningsmålene dine, se Gi bedriftsbrukerne mulighet til å trekke ut innsikt fra bedriftsdokumenter ved å bruke Amazon SageMaker Canvas og Generative AI og Overvinne vanlige kontaktsenterutfordringer med generativ AI og Amazon SageMaker Canvas.
Hvis du vil lære mer om SageMaker Canvas-funksjoner og dypdykk i andre ML-brukstilfeller, sjekk ut de andre postene som er tilgjengelige i SageMaker Canvas kategori fra AWS ML-bloggen. Vi gleder oss til å se de fantastiske AI-applikasjonene du vil lage med disse nye funksjonene!
Om forfatterne
Davide Gallitelli er en senior spesialistløsningsarkitekt for AI/ML. Han er basert i Brussel og jobber tett med kunder over hele verden som ønsker å ta i bruk Low-Code/No-Code Machine Learning-teknologier og Generativ AI. Han har vært utvikler siden han var veldig ung, og begynte å kode i en alder av 7. Han begynte å lære AI/ML på universitetet, og har forelsket seg i det siden den gang.
Dan Sinnreich er senior produktsjef hos AWS, og hjelper til med å demokratisere maskinlæring med lav kode/ikke kode. Før AWS bygde og kommersialiserte Dan enterprise SaaS-plattformer og tidsseriemodeller brukt av institusjonelle investorer for å håndtere risiko og konstruere optimale porteføljer. Utenom jobben kan han bli funnet å spille hockey, dykking og lese science fiction.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
- PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
- PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
- PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/announcing-support-for-llama-2-models-and-streaming-responses-in-amazon-sagemaker-canvas/
- : har
- :er
- :hvor
- $OPP
- 100
- 13
- 2021
- 7
- 70
- a
- evne
- Om oss
- ovenfor
- Logg inn
- Oppnå
- Ytterligere
- adoptere
- fremskritt
- en gang til
- mot
- alder
- AI
- AI-modeller
- AI-drevet
- AI / ML
- Alle
- tillater
- utrolig
- Amazon
- Amazon SageMaker
- Amazon SageMaker Canvas
- Amazon Web Services
- blant
- beløp
- an
- og
- Kunngjøre
- Kunngjøring
- svar
- noen
- app
- Søknad
- søknader
- ER
- rundt
- AS
- Assistent
- At
- oppmerksomhet
- tilgjengelig
- unngå
- AWS
- basert
- BE
- vært
- under
- Fordeler
- BEST
- Bedre
- større
- Milliarder
- Blogg
- bringe
- Brussel
- bygge
- Bygning
- bygget
- virksomhet
- by
- CAN
- lerret
- evner
- evne
- stand
- saken
- saker
- sentrum
- utfordringer
- avgifter
- chatte
- chatbot
- sjekk
- Velg
- velge
- tett
- kode
- SAMMENHENGENDE
- kombinert
- Felles
- samfunnet
- Selskapet
- sammenlign
- sammenligne
- sammenlignet
- sammenligninger
- vurderer
- konsistent
- konstruere
- kontakt
- kontakt senter
- innhold
- Innholdsgenerering
- fortsetter
- Samtale
- samtaler
- Kostnad
- skape
- skaper
- Kunder
- skjærekant
- dyp
- dypdykk
- demokrat
- utplasserings
- utviklet
- Utvikler
- forskjellig
- diskutere
- dykk
- dykking
- do
- dokumenter
- hver enkelt
- Effektiv
- effektiv
- bemyndige
- muliggjøre
- muliggjør
- engasjerende
- forbedret
- styrke
- nyte
- Enterprise
- evaluere
- alle
- opphisset
- spennende
- eksisterende
- erfaring
- utforske
- trekke ut
- Fallen
- raskere
- Trekk
- Egenskaper
- tilbakemelding
- Fiction
- Finn
- passer inn
- flyten
- Til
- skjema
- funnet
- Fundament
- Fransk
- fra
- genai
- generelt
- genererer
- generasjonen
- generative
- Generativ AI
- få
- globus
- Mål
- Ha
- he
- hjelpe
- hjelpe
- her.
- høyere
- svært
- vert
- time
- Hvordan
- Men
- HTTPS
- umiddelbar
- forbedret
- forbedrer
- in
- økt
- informasjon
- inngang
- innsikt
- f.eks
- instant
- institusjonell
- institusjonelle investorer
- integrering
- samhandle
- interaksjoner
- interaktiv
- interaktivitet
- Interface
- inn
- Introduksjon
- intuitiv
- Investorer
- IT
- DET ER
- jpg
- nøkkel
- Språk
- stor
- Ventetid
- siste
- Siste oppdateringer
- lansere
- ledende
- LÆRE
- læring
- linje
- Llama
- logg
- logging
- ser
- elsker
- maskin
- maskinlæring
- gjøre
- Making
- administrer
- leder
- måte
- meningsfylt
- midler
- Meny
- Meta
- ML
- modell
- modeller
- mer
- flytting
- fritt
- Naturlig
- Naviger
- Trenger
- Ny
- Merknader
- nå
- Antall
- of
- Tilbud
- on
- gang
- ONE
- åpen
- åpen kildekode
- optimal
- or
- Annen
- vår
- ut
- produksjon
- utenfor
- samlet
- egen
- side
- parametere
- for
- Utfør
- ytelse
- forestillinger
- utfører
- bilde
- plattform
- Plattformer
- plato
- Platon Data Intelligence
- PlatonData
- spiller
- porteføljer
- Post
- innlegg
- kraftig
- forrige
- prising
- prismodell
- Problem
- Produkt
- Produktsjef
- prosjekter
- gi
- gir
- spørring
- område
- Lesning
- ekte
- sanntids
- motta
- mottatt
- mottak
- Anbefaling
- referere
- Gjenspeiler
- slipp
- Utgivelser
- rapportert
- forespørsler
- Krever
- Ressurser
- svar
- svar
- responsive
- rikere
- Risiko
- SaaS
- sagemaker
- samme
- tilfredshet
- skalerbarhet
- Skala
- Vitenskap
- Science Fiction
- sømløs
- se
- velg
- velge
- send
- senior
- tjeneste
- Tjenester
- bør
- Vis
- vist
- signifikant
- siden
- enkelt
- mindre
- So
- Solutions
- løser
- kilde
- spesialist
- Oppstart
- startet
- Start
- state-of-the-art
- rett fram
- stream
- streames
- streaming
- slik
- oppsummere
- støtte
- Støtter
- sikker
- system
- Ta
- oppgaver
- Technologies
- test
- Takk
- Det
- De
- deres
- Dem
- seg
- deretter
- derfor
- Disse
- denne
- tre
- begeistret
- gjennomstrømning
- tid
- ganger
- til
- i dag
- token
- To ganger
- to
- ui
- universitet
- oppdateringer
- bruk
- bruke
- bruk sak
- brukt
- Bruker
- Brukererfaring
- Brukere
- ved hjelp av
- variasjon
- allsidighet
- veldig
- virtuelle
- virtuell assistent
- Besøk
- visuell
- vente
- ønsker
- ønsker
- var
- Vei..
- we
- web
- webtjenester
- VI VIL
- hvilken
- bred
- Bred rekkevidde
- vil
- med
- uten
- Arbeid
- arbeidsflyt
- virker
- skrive
- skriving
- Du
- Young
- Din
- zephyrnet