Bunu duyurmaktan heyecan duyuyoruz Amazon SageMaker Hızlı Başlangıç artık büyük dil modeli (LLM) çıkarım yanıtlarını aktarabiliyor. Belirteç akışı, LLM'lerin kullanımınıza veya görüntülemenize sunulmadan önce yanıt oluşturmayı bitirmesini beklemek yerine, model yanıt çıktısını oluşturulurken görmenize olanak tanır. SageMaker JumpStart'ın akış özelliği, son kullanıcı için düşük gecikme algısı yaratarak daha iyi kullanıcı deneyimine sahip uygulamalar oluşturmanıza yardımcı olabilir.
Bu yazıda, bir yanıtın nasıl dağıtılacağını ve yayınlanacağını açıklıyoruz. Falcon 7B Talimat modeli uç nokta.
Bu yazının yazıldığı sırada, SageMaker JumpStart'ta mevcut olan aşağıdaki LLM'ler akışı desteklemektedir:
- Mistral AI 7B, Mistral AI 7B Talimatı
- Falcon 180B, Falcon 180B Sohbet
- Falcon 40B, Falcon 40B Talimatı
- Falcon 7B, Falcon 7B Talimatı
- Rinna Japon GPT NeoX 4B Talimatı PPO
- Rinna Japon GPT NeoX 3.6B Talimatı PPO
SageMaker JumpStart'ta akışı destekleyen modeller listesindeki güncellemeleri kontrol etmek için şu adreste "huggingface-llm" ifadesini arayın. Önceden eğitilmiş Model Tablosu ile Yerleşik Algoritmalar.
kullanabileceğinizi unutmayın. akış özelliği of Amazon Adaçayı Yapıcı bölümünde açıklandığı gibi SageMaker TGI Deep Learning Container (DLC) kullanılarak dağıtılan herhangi bir model için kutudan çıktığı gibi barındırma Amazon SageMaker'da yeni Hugging Face LLM Inference kapsayıcılarının lansmanının duyurulması.
SageMaker'daki temel modelleri
SageMaker JumpStart, SageMaker'daki makine öğrenimi geliştirme iş akışınızda kullanabileceğiniz Hugging Face, PyTorch Hub ve TensorFlow Hub gibi popüler model merkezlerinden çeşitli modellere erişim sağlar. ML'deki son gelişmeler, olarak bilinen yeni bir model sınıfının ortaya çıkmasına neden oldu. temel modelleriGenellikle milyarlarca parametre üzerinde eğitilen ve metin özetleme, dijital sanat oluşturma ve dil çevirisi gibi çok çeşitli kullanım senaryolarına uyarlanabilen. Bu modellerin eğitimi pahalı olduğundan müşteriler, bu modelleri kendileri eğitmek yerine mevcut önceden eğitilmiş temel modellerini kullanmak ve gerektiğinde bunlara ince ayar yapmak ister. SageMaker, SageMaker konsolunda arasından seçim yapabileceğiniz seçilmiş bir model listesi sunar.
Artık SageMaker JumpStart'ta farklı model sağlayıcıların temel modellerini bulabilir ve temel modellerine hızlı bir şekilde başlamanıza olanak tanıyabilirsiniz. SageMaker JumpStart, farklı görevlere veya model sağlayıcılara dayalı temel modeller sunar ve model özelliklerini ve kullanım koşullarını kolayca inceleyebilirsiniz. Bu modelleri bir test kullanıcı arayüzü widget'ı kullanarak da deneyebilirsiniz. Geniş ölçekte bir temel modeli kullanmak istediğinizde, model sağlayıcıların önceden oluşturulmuş dizüstü bilgisayarlarını kullanarak bunu SageMaker'dan ayrılmadan yapabilirsiniz. Modeller AWS'de barındırıldığı ve dağıtıldığı için, modeli değerlendirmek veya geniş ölçekte kullanmak için kullanılan verilerinizin üçüncü taraflarla paylaşılmayacağına güvenirsiniz.
Jeton akışı
Belirteç akışı, çıkarım yanıtının model tarafından oluşturulurken döndürülmesine olanak tanır. Bu şekilde, tam yanıtı sağlamadan önce modelin bitmesini beklemek yerine, artan yanıtın oluşturulduğunu görebilirsiniz. Akış, son kullanıcının gecikme algısını azalttığı için daha iyi bir kullanıcı deneyimi sağlanmasına yardımcı olabilir. Çıktıyı oluşturulduğu anda görmeye başlayabilirsiniz ve bu nedenle çıktı, amaçlarınız açısından yararlı görünmüyorsa oluşturmayı erken durdurabilirsiniz. Akış, özellikle uzun süren sorgular için büyük bir fark yaratabilir çünkü çıktıları oluşturulduğu anda görmeye başlayabilirsiniz; bu, uçtan uca gecikme aynı kalsa bile daha düşük gecikme algısı yaratabilir.
Bu yazının yazıldığı an itibariyle, Hugging Face LLM'yi kullanan modeller için SageMaker JumpStart'ta akışı kullanabilirsiniz. Metin Oluşturma Çıkarımı DLC.
Buharlama Olmadan Yanıt | Akışla Yanıt |
Çözüme genel bakış
Bu yazı için SageMaker JumpStart akış yeteneğini sergilemek amacıyla Falcon 7B Instruct modelini kullanıyoruz.
SageMaker JumpStart'ta akışı destekleyen diğer modelleri bulmak için aşağıdaki kodu kullanabilirsiniz:
Akışı destekleyen aşağıdaki model kimliklerini alıyoruz:
Önkoşullar
Dizüstü bilgisayarı çalıştırmadan önce kurulum için gerekli bazı başlangıç adımları vardır. Aşağıdaki komutları çalıştırın:
Modeli dağıtın
İlk adım olarak, Falcon 7B Instruct modelini dağıtmak için SageMaker JumpStart'ı kullanın. Talimatların tamamı için bkz. TII'nin Falcon 180B temel modeli artık Amazon SageMaker JumpStart'ta mevcut. Aşağıdaki kodu kullanın:
Uç noktayı ve akış yanıtını sorgulama
Ardından, dağıtılan uç noktanızı çağırmak için bir veri yükü oluşturun. Daha da önemlisi, veri, anahtar/değer çiftini içermelidir "stream": True
. Bu, metin oluşturma çıkarım sunucusuna bir akış yanıtı oluşturmasını belirtir.
Uç noktayı sorgulamadan önce, bayt akışı yanıtını uç noktadan ayrıştırabilecek bir yineleyici oluşturmanız gerekir. Her belirtecin verileri yanıtta ayrı bir satır olarak sağlanır; böylece bu yineleyici, akış arabelleğinde her yeni satır tanımlandığında bir belirteç döndürür. Bu yineleyici minimal düzeyde tasarlanmıştır ve davranışını kullanım durumunuza göre ayarlamak isteyebilirsiniz; örneğin, bu yineleyici belirteç dizelerini döndürürken, satır verileri belirteç günlüğü olasılıkları gibi ilgi çekici olabilecek diğer bilgileri içerir.
Artık Boto3'ü kullanabilirsiniz invoke_endpoint_with_response_stream
Oluşturduğunuz uç noktadaki API'yi kullanın ve bir akış üzerinde yineleme yaparak akışı etkinleştirin. TokenIterator
örnek:
Boş belirtme end
parametresine print
işlevi, yeni satır karakterleri eklenmeden görsel bir akışı etkinleştirir. Bu, aşağıdaki çıktıyı üretir:
Akışı çalışırken ve müşterilerinize sağladığı deneyimi görmek için bu kodu bir dizüstü bilgisayarda veya Streamlit veya Gradio gibi diğer uygulamalarda kullanabilirsiniz.
Temizlemek
Son olarak, ek maliyetlere maruz kalmamak için konuşlandırılmış modelinizi ve uç noktanızı temizlemeyi unutmayın:
Sonuç
Bu yazıda size SageMaker JumpStart'ta yeni başlatılan akış özelliğini nasıl kullanacağınızı gösterdik. Daha iyi bir kullanıcı deneyimi için düşük gecikme gerektiren etkileşimli uygulamalar oluşturmak amacıyla jeton akışı özelliğini kullanacağınızı umuyoruz.
yazarlar hakkında
Rahna Çadha AWS'de Stratejik Hesaplar alanında Baş Çözüm Mimarı AI/ML'dir. Rachna, yapay zekanın etik ve sorumlu kullanımının gelecekte toplumu iyileştirebileceğine ve ekonomik ve sosyal refah getirebileceğine inanan bir iyimserdir. Rachna boş zamanlarında ailesiyle vakit geçirmeyi, yürüyüş yapmayı ve müzik dinlemeyi seviyor.
Doktor Kyle Ulrich Uygulamalı Bilim Adamıdır Amazon SageMaker yerleşik algoritmaları takım. Araştırma ilgi alanları arasında ölçeklenebilir makine öğrenimi algoritmaları, bilgisayar görüşü, zaman serileri, Bayes parametrik olmayanları ve Gauss süreçleri yer alır. Doktorası Duke Üniversitesi'ndendir ve NeurIPS, Cell ve Neuron'da yayınlanmış makaleleri vardır.
Ashish Khetan Amazon SageMaker yerleşik algoritmalarına sahip Kıdemli Uygulamalı Bilim Adamıdır ve makine öğrenimi algoritmalarının geliştirilmesine yardımcı olur. Doktora derecesini University of Illinois Urbana-Champaign'den almıştır. Makine öğrenimi ve istatistiksel çıkarım alanlarında aktif bir araştırmacıdır ve NeurIPS, ICML, ICLR, JMLR, ACL ve EMNLP konferanslarında birçok makale yayınlamıştır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/stream-large-language-model-responses-in-amazon-sagemaker-jumpstart/
- :vardır
- :dır-dir
- $UP
- 1
- 10
- 100
- 12
- 13
- 14
- 19
- 7
- 8
- a
- Hakkımızda
- erişim
- Hesaplar
- Action
- aktif
- eklemek
- Ek
- gelişmeler
- tavsiye
- AI
- AI / ML
- algoritmalar
- veriyor
- Ayrıca
- Amazon
- Amazon Adaçayı Yapıcı
- Amazon SageMaker Hızlı Başlangıç
- Amazon Web Servisleri
- an
- ve
- duyurmak
- herhangi
- api
- uygulamaları
- uygulamalı
- ARE
- Sanat
- AS
- At
- mevcut
- önlemek
- AWS
- merkezli
- Bayes
- BE
- Çünkü
- önce
- davranış
- olmak
- inanıyor
- Daha iyi
- Büyük
- milyarlarca
- vücut
- kutu
- getirmek
- tampon
- inşa etmek
- yerleşik
- fakat
- by
- CAN
- kabiliyet
- dava
- durumlarda
- Kategoriler
- özellikleri
- karakterler
- Kontrol
- Klinik
- sınıf
- çamça
- müşteri
- kod
- tamamlamak
- karmaşık
- bilgisayar
- Bilgisayar görüşü
- konferanslar
- konsolos
- kurmak
- içermek
- Konteyner
- Konteynerler
- içeren
- içerik
- maliyetler
- olabilir
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- Oluşturma
- CSS
- küratörlüğünü
- Müşteriler
- veri
- azalır
- derin
- derin öğrenme
- dağıtmak
- konuşlandırılmış
- tarif edilen
- Dizayn
- tasarlanmış
- tasarımcı
- Belirlemek
- geliştirmek
- Geliştirici
- gelişme
- fark
- farklı
- dijital
- dijital Sanat
- ekran
- do
- domain
- Alan Adı
- Dük
- Duke Üniversitesi
- her
- Erken
- kolayca
- Ekonomik
- etkinleştirmek
- etkinleştirme
- son uca
- Son nokta
- Motorlar
- sağlamak
- özellikle
- törel
- değerlendirilmesi
- Hatta
- örnek
- uyarılmış
- mevcut
- pahalı
- deneyim
- Yüz
- aile
- Özellikler(Hazırlık aşamasında)
- filtreler
- bulmak
- bitiş
- Ad
- takip etme
- İçin
- vakıf
- iskelet
- itibaren
- tam
- işlev
- gelecek
- genellikle
- oluşturmak
- oluşturulan
- üreten
- nesil
- almak
- verilmiş
- Goller
- var
- rehberlik
- Var
- he
- yardım et
- faydalı
- yardımcı olur
- onu
- onun
- umut
- ev sahipliği yaptı
- hosting
- Ne kadar
- Nasıl Yapılır
- HTML
- HTTPS
- merkez
- hub
- SarılmaYüz
- i
- tespit
- kimlikleri
- if
- Illinois
- ithalat
- önemlisi
- iyileştirmek
- in
- dahil
- Dahil olmak üzere
- gösterir
- bilgi
- ilk
- girişler
- kurmak
- örnek
- yerine
- talimatlar
- interaktif
- faiz
- ilgi alanları
- IT
- ONUN
- Japonca
- JavaScript
- json
- tutmak
- bilinen
- kyle
- dil
- büyük
- Gecikme
- başlatmak
- başlattı
- öğrenme
- ayrılma
- sevmek
- seviyor
- çizgi
- Liste
- Dinleme
- Yüksek Lisans
- log
- bakıyor
- Düşük
- alt
- makine
- makine öğrenme
- yapılmış
- korumak
- yapmak
- çok
- Mayıs..
- olabilir
- ML
- model
- modelleri
- Music
- isim
- gerek
- gerekli
- yeni
- yeni
- yok hayır
- defter
- şimdi
- of
- Teklifler
- on
- Online
- optimize
- or
- Diğer
- dışarı
- çıktı
- çıkışlar
- tekrar
- çift
- kâğıtlar
- parametre
- parametreler
- partiler
- algı
- doktora
- Platon
- Plato Veri Zekası
- PlatoVeri
- Popüler
- Çivi
- Predictor
- Anapara
- süreç
- Süreçler
- üretir
- uygun şekilde
- refah
- sağlanan
- sağlayan
- sağlayıcılar
- sağlar
- sağlama
- yayınlanan
- amaç
- amaçlı
- pytorch
- sorgular
- hızla
- menzil
- daha doğrusu
- son
- başvurmak
- düzenli
- hatırlamak
- gereklidir
- araştırma
- araştırmacı
- Kaynaklar
- yanıt
- yanıtları
- sorumlu
- dönüş
- İade
- yorum
- Yükselmek
- koşmak
- koşu
- sagemaker
- aynı
- ölçeklenebilir
- ölçek
- bilim adamı
- Ara
- Arama motorları
- görmek
- görme
- Aramak
- SELF
- kıdemli
- ayrı
- Dizi
- sunucu
- Hizmetler
- kurulum
- Paylaşılan
- meli
- vitrin
- gösterdi
- düzgünce
- So
- Sosyal Medya
- Toplum
- çözüm
- biraz
- Harcama
- başlama
- başladı
- istatistiksel
- adım
- Basamaklar
- dur
- Stratejik
- dere
- akış
- böyle
- destek
- Destek
- Görev
- görevleri
- takım
- şablonları
- tensorflow
- şartlar
- test
- metin
- göre
- o
- The
- Çizgi
- Onları
- kendilerini
- Orada.
- bu nedenle
- Bunlar
- Üçüncü
- üçüncü şahıslar
- Re-Tweet
- gerçi?
- İçinden
- zaman
- Zaman serisi
- için
- simge
- Tren
- eğitilmiş
- Çeviri
- gerçek
- Güven
- denemek
- Öğreticiler
- tipik
- ui
- üniversite
- Güncelleme
- Güncellemeler
- kullanım
- kullanım
- kullanım durumu
- Kullanılmış
- kullanıcı
- Kullanıcı Deneyimi
- kullanma
- kullanmak
- üzerinden
- vizyonumuz
- beklemek
- Bekleyen
- yürümek
- istemek
- Yol..
- we
- ağ
- web hizmetleri
- Web sitesi
- ne zaman
- olup olmadığını
- hangi
- süre
- DSÖ
- geniş
- irade
- ile
- içinde
- olmadan
- iş akışı
- çalışma
- yazı yazıyor
- Sen
- zefirnet