Bugün, artık toplu dönüşümleri gerçekleştirebileceğinizi duyurmanın heyecanını yaşıyoruz. Amazon SageMaker Hızlı Başlangıç Text2Text Üretimi için büyük dil modelleri (LLM'ler). Toplu dönüşümler, yanıtların gerçek zamanlı olması gerekmediği durumlarda kullanışlıdır ve bu nedenle toplu olarak büyük veri kümeleri için toplu olarak çıkarım yapabilirsiniz. Toplu dönüştürme için, toplu girişi bir veri kümesi ve önceden eğitilmiş bir model olarak alan ve veri kümesindeki her veri noktası için tahminler çıkaran bir toplu iş çalıştırılır. Kalıcı donanıma sahip gerçek zamanlı barındırılan uç noktaların aksine, toplu dönüştürme kümeleri iş tamamlandığında parçalandığından ve bu nedenle donanım yalnızca toplu iş süresince kullanıldığından, toplu dönüştürme uygun maliyetlidir.
Bazı kullanım durumlarında, gerçek zamanlı veya gerçek zamana yakın yanıtlar oluşturmak üzere toplu işleme için gerçek zamanlı çıkarım istekleri küçük gruplar halinde gruplandırılabilir. Örneğin, düşük gecikme süresi ve yüksek aktarım hızı ile sürekli bir veri akışını işlemeniz gerekiyorsa, her istek için ayrı ayrı gerçek zamanlı bir uç nokta çağırmak daha fazla kaynak gerektirir ve işleme seri olarak yapıldığından tüm istekleri işlemek daha uzun sürebilir. . Daha iyi bir yaklaşım, isteklerin bazılarını gruplamak ve isteklerinizi modelin bir ileri geçişinde işleyen ve istek için toplu yanıtı gerçek zamanlı veya neredeyse gerçek zamanlı olarak döndüren toplu çıkarım modunda gerçek zamanlı uç noktayı çağırmak olacaktır. . Yanıt gecikmesi, kaç isteği birlikte gruplandırdığınıza ve örnek bellek boyutuna bağlı olacaktır, bu nedenle gecikme ve aktarım hızı için iş gereksinimlerinize göre parti boyutunu ayarlayabilirsiniz. biz buna diyoruz gerçek zamanlı toplu çıkarım çünkü hala gerçek zamanlı yanıtlar sağlarken gruplama kavramını birleştiriyor. Gerçek zamanlı toplu çıkarımla, düşük gecikme süresi ile yüksek verim arasında bir denge kurarak büyük hacimli verileri zamanında ve verimli bir şekilde işlemenizi sağlar.
Text2Text Generation modelleri için hızlı başlangıç toplu dönüşümü, iş hacmini daha da artıran ve gecikmeyi en aza indiren ortam değişkenleri aracılığıyla toplu hiperparametreleri geçirmenize olanak tanır.
JumpStart, makine öğrenimine (ML) başlamanıza yardımcı olmak için çok çeşitli sorun türleri için önceden eğitilmiş, açık kaynaklı modeller sağlar. Dağıtımdan önce bu modelleri kademeli olarak eğitebilir ve ayarlayabilirsiniz. JumpStart ayrıca yaygın kullanım durumları için altyapıyı kuran çözüm şablonları ve makine öğrenimi için yürütülebilir örnek not defterleri sağlar. Amazon Adaçayı Yapıcı. Önceden eğitilmiş modellere, çözüm şablonlarına ve örneklere JumpStart giriş sayfasından erişebilirsiniz. Amazon SageMaker Stüdyosu. SageMaker Python SDK'yı kullanarak JumpStart modellerine de erişebilirsiniz.
Bu gönderide, son teknoloji önceden eğitilmiş cihazların nasıl kullanılacağını gösteriyoruz. text2text FLAN T5 modelleri Toplu dönüşüm ve gerçek zamanlı toplu çıkarım için Hugging Face'ten.
Çözüme genel bakış
Önceden eğitilmiş Text2Text FLAN T5 modellerinin toplu dönüşümünü gösteren not defteri Sarılma Yüz aşağıda mevcut GitHub deposu. Bu not defteri Hugging Face'ten alınan verileri kullanır cnn_dailymail SageMaker SDK kullanan bir metin özetleme görevi için veri kümesi.
Toplu dönüştürme ve gerçek zamanlı toplu çıkarım uygulamak için temel adımlar şunlardır:
- Önkoşulları ayarlayın.
- Önceden eğitilmiş bir model seçin.
- Model için yapıları alın.
- Toplu dönüştürme işi hiperparametrelerini belirtin.
- Toplu dönüştürme için verileri hazırlayın.
- Toplu dönüştürme işini çalıştırın.
- Özetlemeyi bir kullanarak değerlendirin ROUGE (Gisting Değerlendirmesi için Geri Çağırma Odaklı Yardımcı Çalışma) puanı.
- Gerçek zamanlı toplu çıkarım gerçekleştirin.
önkoşulları ayarla
Dizüstü bilgisayarı çalıştırmadan önce bazı ilk kurulum adımlarını tamamlamanız gerekir. AWS hizmetlerini sizin adınıza çalıştırma izinlerine sahip olması için SageMaker yürütme rolünü ayarlayalım:
Önceden eğitilmiş bir model seçin
Varsayılan model olarak huggingface-text2text-flan-t5-large modelini kullanıyoruz. İsteğe bağlı olarak, JumpStart'ta mevcut Text2Text modellerinin listesini alabilir ve tercih ettiğiniz modeli seçebilirsiniz. Bu yöntem, aynı not defterini kullanarak farklı model kimliklerini seçmenin basit bir yolunu sağlar. Gösterim amacıyla huggingface-text2text-flan-t5-large modelini kullanıyoruz:
Model için yapıtları alma
SageMaker ile önceden eğitilmiş model üzerinde, önce yeni bir veri kümesinde ince ayar yapmadan bile çıkarım yapabiliriz. almakla başlıyoruz deploy_image_uri
, deploy_source_uri
, ve model_uri
önceden eğitilmiş model için:
Toplu dönüştürme işi hiperparametrelerini belirtin
Toplu dönüştürme işine ortam değişkenleri olarak hiperparametrelerin herhangi bir alt kümesini iletebilirsiniz. Bu hiperparametreleri bir JSON yükünde de iletebilirsiniz. Ancak, aşağıdaki kodun gösterdiği gibi hiperparametreler için ortam değişkenleri ayarlıyorsanız, JSON satırları yükündeki bireysel örneklerden gelişmiş hiperparametreler kullanılmaz. Yükten hiperparametreler kullanmak istiyorsanız, hyper_params_dict
bunun yerine null olarak parametre.
Verileri toplu dönüştürme için hazırlama
Şimdi yüklemeye hazırız cnn_dailymail Hugging Face'ten veri kümesi:
Her bir veri girişinin üzerinden geçiyoruz ve gerekli formatta girdi verilerini oluşturuyoruz. biz bir yaratırız articles.jsonl
girdi yükü olarak özetlenmesi gereken makaleleri içeren bir test veri dosyası olarak dosyalayın. Bu dosyayı oluştururken, istemi ekliyoruz "Briefly summarize this text:"
her test giriş satırına. Her test girişi için farklı hiperparametrelere sahip olmak istiyorsanız, bu hiperparametreleri veri kümesini oluşturmanın bir parçası olarak ekleyebilirsiniz.
Biz yaratırız highlights.jsonl
test dosyasında saklanan her bir makalenin önemli noktalarını içeren temel gerçek dosyası olarak articles.jsonl
. Her iki test dosyasını da bir Amazon Basit Depolama Hizmeti (Amazon S3) paketi. Aşağıdaki koda bakın:
Toplu dönüştürme işini çalıştırın
Bir toplu dönüştürme işini başlattığınızda, SageMaker, seçilen örnek türüne bağlı olarak CPU veya GPU örnekleri de dahil olmak üzere, verileri işlemek için gerekli bilgi işlem kaynaklarını başlatır. Toplu dönüştürme işi sırasında SageMaker, bulut sunucuları, depolama ve ağ kaynakları dahil olmak üzere verileri işlemek için gereken bilgi işlem kaynaklarını otomatik olarak sağlar ve yönetir. Toplu dönüştürme işi tamamlandığında, bilgi işlem kaynakları SageMaker tarafından otomatik olarak temizlenir. Bu, iş sırasında kullanılan bulut sunucularının ve depolamanın durdurulup kaldırıldığı, böylece kaynakların serbest bırakıldığı ve maliyetin en aza indirildiği anlamına gelir. Aşağıdaki koda bakın:
Aşağıda örnek bir kayıt yer almaktadır. articles.jsonl
deneme dosyası Bu dosyadaki kaydın, eşleşen bir kimliğe sahip olduğunu unutmayın. predict.jsonl
Hugging Face Text2Text modelinden çıktı olarak özetlenmiş bir kaydı gösteren dosya kayıtları. Benzer şekilde, temel gerçek dosyası da veri kaydı için eşleşen bir kimliğe sahiptir. Test dosyası, temel gerçek dosyası ve çıktı dosyasındaki eşleşen kimlik, sonuçların kolay yorumlanması için girdi kayıtlarının çıktı kayıtlarıyla ilişkilendirilmesine olanak tanır.
Özetleme için sağlanan örnek giriş kaydı aşağıdadır:
Özetleme ile birlikte tahmin edilen çıktı aşağıdadır:
Model değerlendirme amaçları için temel gerçeği özetleme aşağıdadır:
Ardından, model değerlendirmesi için temel gerçeği ve tahmin edilen çıktıları kullanırız.
Modeli bir ROUGE puanı kullanarak değerlendirin¶
ROUGEveya Recall-Oriented Understudy for Gisting Evaluation, doğal dil işlemede otomatik özetleme ve makine çevirisini değerlendirmek için kullanılan bir metrik seti ve bir yazılım paketidir. Metrikler, otomatik olarak üretilen bir özeti veya çeviriyi bir referans (insan tarafından üretilen) özet veya çeviri veya bir dizi referansla karşılaştırır.
Aşağıdaki kodda, tahmin edilen ve orijinal özetleri ortak anahtar üzerinde birleştirerek birleştiririz. id
ve bunu ROUGE puanını hesaplamak için kullanın:
Gerçek zamanlı toplu çıkarım gerçekleştirin
Ardından, girişleri bir liste olarak sağlayarak uç noktada gerçek zamanlı toplu çıkarımı nasıl çalıştıracağınızı gösteriyoruz. Test veri kümesinden birkaç kayıt alıp bunları gerçek zamanlı bir son noktayı çağırmak için kullanmamız dışında öncekiyle aynı model kimliğini ve veri kümesini kullanıyoruz.
Aşağıdaki kod, gerçek zamanlı toplu çıkarım için gerçek zamanlı bir uç noktanın nasıl oluşturulacağını ve dağıtılacağını gösterir:
Ardından, girdi yükümüzü hazırlıyoruz. Bunun için daha önce hazırladığımız verileri kullanarak ilk 10 test girişini çıkartıyoruz ve metin girişlerini kullanmak istediğimiz hiperparametrelerle ekliyoruz. Bu yükü gerçek zamanlı olarak sağlıyoruz invoke_endpoint
. Yanıt yükü daha sonra bir yanıt listesi olarak döndürülür. Aşağıdaki koda bakın:
Temizlemek
Uç noktayı test ettikten sonra, ücret ödememek için SageMaker çıkarım uç noktasını ve modeli sildiğinizden emin olun.
Sonuç
Bu not defterinde, özetleme görevleri için Hugging Face Text2Text Oluşturucu modelini sergilemek üzere bir toplu dönüştürme gerçekleştirdik. Toplu dönüşüm, kalıcı bir uç nokta gerektirmeden büyük veri kümelerinden çıkarımlar elde etmede avantajlıdır. Sonuçların yorumlanmasına yardımcı olmak için girdi kayıtlarını çıkarımlarla ilişkilendirdik. Test verileri özetlemeyi model tarafından oluşturulan özetleme ile karşılaştırmak için ROUGE puanını kullandık.
Ek olarak, akış giriş verileri gibi senaryolar için gecikme ve verimlilik arasında bir denge elde etmek için küçük bir veri grubunu gerçek zamanlı bir uç noktaya gönderebileceğiniz gerçek zamanlı toplu çıkarımı gösterdik. Gerçek zamanlı toplu çıkarım, gerçek zamanlı istekler için verimi artırmaya yardımcı olur.
Bugün SageMaker'da Text2Text Generation modelleriyle toplu dönüştürmeyi deneyin ve görüşlerinizi bize bildirin!
yazarlar hakkında
Hemant Singh Amazon SageMaker JumpStart ve Amazon SageMaker yerleşik algoritmalarında deneyime sahip bir Makine Öğrenimi Mühendisidir. Master derecelerini Courant Institute of Mathematical Sciences'tan ve B.Tech'ten IIT Delhi'den almıştır. Doğal dil işleme, bilgisayar görüşü ve zaman serisi analizi alanlarında çok çeşitli makine öğrenimi problemleri üzerinde çalışma deneyimine sahiptir.
Rahna Çadha AWS'de Stratejik Hesaplarda Yapay Zeka/ML'nin Baş Çözüm Mimarıdır. Rachna, AI'nın etik ve sorumlu kullanımının gelecekte toplumu iyileştirebileceğine ve ekonomik ve sosyal refah getirebileceğine inanan bir iyimser. Rachna boş zamanlarında ailesiyle vakit geçirmeyi, yürüyüş yapmayı ve müzik dinlemeyi seviyor.
Ashish Khetan Amazon SageMaker yerleşik algoritmalarına sahip Kıdemli Uygulamalı Bilim Adamıdır ve makine öğrenimi algoritmalarının geliştirilmesine yardımcı olur. Doktora derecesini University of Illinois Urbana-Champaign'den almıştır. Makine öğrenimi ve istatistiksel çıkarım alanlarında aktif bir araştırmacıdır ve NeurIPS, ICML, ICLR, JMLR, ACL ve EMNLP konferanslarında birçok makale yayınlamıştır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoAiStream. Web3 Veri Zekası. Bilgi Genişletildi. Buradan Erişin.
- Adryenn Ashley ile Geleceği Basmak. Buradan Erişin.
- PREIPO® ile PRE-IPO Şirketlerinde Hisse Al ve Sat. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- :vardır
- :dır-dir
- :olumsuzluk
- :Neresi
- $UP
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- Yapabilmek
- Hakkımızda
- yukarıdaki
- kabul
- kabul edilen
- erişim
- Göre
- Hesaplar
- Başarmak
- Aldı
- karşısında
- eylemler
- aktif
- ileri
- avantajlı
- karşı
- AI
- AI / ML
- Yardım
- algoritmalar
- Türkiye
- iddia edilen
- veriyor
- Ayrıca
- Amazon
- Amazon Adaçayı Yapıcı
- Amazon SageMaker Hızlı Başlangıç
- Amazon Web Servisleri
- an
- analiz
- ve
- duyurmak
- herhangi
- api
- uygulamalı
- yaklaşım
- ARE
- etrafında
- göre
- mal
- AS
- At
- Denemeler
- yetki
- Otomatik
- otomatik olarak
- mevcut
- önlemek
- AWS
- Bakiye
- baz
- merkezli
- BE
- oldu
- Çünkü
- olur
- önce
- olmak
- Inanmak
- inanıyor
- Evin en küçüğü
- Daha iyi
- arasında
- vücut
- her ikisi de
- İki taraf da
- sınırları
- kısaca
- getirmek
- Getiriyor
- yerleşik
- iş
- fakat
- by
- çağrı
- CAN
- yapamam
- durumlarda
- Sebeb olmak
- yükler
- Klinik
- sınıf
- müşteri
- yakın
- CNN
- kod
- birleştirmek
- biçerdöverler
- birleştirme
- nasıl
- taahhütler
- taahhüt
- ortak
- karşılaştırmak
- tamamlamak
- hesaplamak
- bilgisayar
- Bilgisayar görüşü
- kavram
- Davranış
- konferanslar
- Konteyner
- devam etmek
- sürekli
- katkıda
- Ücret
- uygun maliyetli
- olabilir
- avukat
- zarar verici
- ülkeler
- Mahkeme
- yaratmak
- Oluşturma
- Suçları
- Ceza
- veri
- veri girişi
- veri kümeleri
- ölü
- karar
- Varsayılan
- Delhi
- göstermek
- gösterdi
- bölüm
- bağlı
- dağıtmak
- açılma
- tarif edilen
- Belirlemek
- geliştirmek
- gelişme
- farklılık
- farklılıkları
- farklı
- direkt
- çeşitli
- do
- liman işçisi
- domain
- yapılmış
- Dont
- Kapı
- aşağı
- süre
- sırasında
- her
- Daha erken
- Doğu
- kolay
- Ekonomik
- verimli
- çabaları
- uygun
- etkinleştirme
- son
- Son nokta
- mühendis
- sağlamak
- girer
- giriş
- çevre
- çağ
- törel
- değerlendirmek
- değerlendirilmesi
- değerlendirme
- Hatta
- kanıt
- örnek
- örnekler
- Dışında
- uyarılmış
- infaz
- deneyim
- çıkarmak
- Yüz
- inanç
- aile
- az
- fileto
- dosyalar
- Ad
- takip etme
- İçin
- Zorla
- yabancı
- resmi
- resmen
- biçim
- ileri
- kurucu
- itibaren
- tam
- daha fazla
- gelecek
- nesil
- jeneratör
- almak
- verir
- Go
- Goller
- Hükümetler
- GPU
- büyük
- Zemin
- grup
- donanım
- Var
- he
- yardım et
- yardımcı olur
- onu
- okuyun
- Yüksek
- özeti
- onun
- ev sahipliği yaptı
- Ne kadar
- Nasıl Yapılır
- Ancak
- HTML
- http
- HTTPS
- SarılmaYüz
- insan
- insan hakları
- İnsanlık
- ID
- kimlikleri
- if
- Illinois
- görüntü
- hemen
- uygulanması
- ithalat
- iyileştirmek
- in
- dahil
- Dahil olmak üzere
- Artırmak
- bağımsızlık
- bireysel
- Bireysel olarak
- bilgi
- Altyapı
- ilk
- adaletsizlik
- giriş
- girişler
- soruşturma
- örnek
- yerine
- Enstitü
- Uluslararası
- yorumlama
- içine
- araştırmak
- soruşturma
- Soruşturmalar
- Israil
- IT
- ONUN
- Ocak
- İş
- kaydol
- birleştirme
- jpg
- json
- yargıç
- Haziran
- yargı
- sadece
- Adalet
- anahtar
- Bilmek
- iniş
- dil
- büyük
- Soyad
- Gecikme
- sonra
- başlattı
- öğrenme
- sol
- izin
- hafifçe
- sevmek
- seviyor
- çizgi
- hatları
- bağlantılı
- bağlayıcı
- Liste
- Dinleme
- yük
- Uzun
- uzun
- Düşük
- makine
- makine öğrenme
- yapmak
- Yapımı
- yönetir
- tavır
- çok
- işaretlenmiş
- eşleşti
- uygun
- matematiksel
- Mayıs..
- anlamına geliyor
- üye
- Üyeler
- üyelik
- Bellek
- yöntem
- Metrikleri
- minimize
- ML
- Moda
- model
- modelleri
- Ay
- Daha
- hareket
- Music
- şart
- isim
- Doğal (Madenden)
- Doğal Dil İşleme
- gerekli
- gerek
- görüşmeler
- ne
- Hollanda
- ağ
- yeni
- haber
- haber bülteni
- defter
- şimdi
- nesne
- edinme
- of
- Office
- Resmi olarak
- on
- ONE
- bir tek
- açık
- açık kaynak
- açıldı
- karşı çıkmak
- karşı
- or
- orijinal
- OS
- bizim
- dışarı
- çıktı
- tekrar
- paket
- Kanal
- Filistin
- kâğıtlar
- parametre
- parametreler
- Bölüm
- Parti
- geçmek
- yol
- asfaltlama
- barış
- İnsanlar
- Yapmak
- izinleri
- Platon
- Plato Veri Zekası
- PlatoVeri
- Lütfen
- Nokta
- mümkün
- Çivi
- tahmin
- tahmin
- tahmin
- Tahminler
- Predictor
- tercihli
- Hazırlamak
- hazırlanmış
- önkoşullar
- başkan
- basınç
- asal
- Başbakan
- Anapara
- Sorun
- sorunlar
- süreç
- Süreçler
- işleme
- Üretilmiş
- refah
- sağlamak
- sağlanan
- sağlar
- sağlama
- yayınlanan
- amaçlı
- Python
- menzil
- hazır
- gerçek
- gerçek zaman
- kayıt
- kayıtlar
- referanslar
- ifade eder
- serbest
- çıkarıldı
- DEFALARCA
- rapor
- talep
- isteklerinizi
- gerektirir
- gereklidir
- Yer Alan Kurallar
- araştırmacı
- Kaynaklar
- yanıt
- yanıtları
- sorumlulukları
- sorumlu
- sonuç
- Sonuçlar
- dönüş
- İade
- yorum
- haklar
- Rol
- Roma
- SIRA
- koşmak
- s
- sagemaker
- SageMaker Çıkarımı
- Adı geçen
- aynı
- söz
- senaryolar
- BİLİMLERİ
- bilim adamı
- Gol
- sdk
- görmek
- arayan
- seçilmiş
- göndermek
- kıdemli
- Dizi
- Hizmetler
- set
- ayar
- kurulum
- Paylaşılan
- o
- meli
- şov
- vitrin
- Gösteriler
- Yüzler
- imzalı
- benzer şekilde
- Basit
- beri
- durum
- durumlar
- beden
- küçük
- So
- Sosyal Medya
- Toplum
- Yazılım
- çözüm
- Çözümler
- biraz
- konuşmak
- konuşma
- Harcama
- başlama
- başladı
- Eyalet
- Dışişleri bakanlığı
- state-of-the-art
- Açıklama
- Devletler
- istatistiksel
- adım
- Basamaklar
- Yine
- durdu
- hafızası
- mağaza
- saklı
- basit
- Stratejik
- dere
- akış
- şiddetle
- konu
- özetlemek
- ÖZET
- yaz
- destek
- Bizi daha iyi tanımak için
- alınan
- alır
- Görev
- görevleri
- teknoloji
- şablonları
- ülkelerle
- bölge
- test
- göre
- o
- The
- Bilgi
- Hollanda
- Devlet
- Dünya
- ve bazı Asya
- Onları
- sonra
- bu nedenle
- Bunlar
- onlar
- Re-Tweet
- Bu
- İçinden
- verim
- zaman
- Zaman serisi
- için
- bugün
- birlikte
- yırtık
- karşı
- Tren
- Dönüştürmek
- transformatör
- dönüşümler
- Çeviri
- gerçek
- Hakikat
- tip
- türleri
- baltalamak
- Birleşik
- USA
- Evrensel
- üniversite
- aksine
- Yükleme
- üzerine
- us
- kullanım
- Kullanılmış
- kullanma
- Başkan Yardımcısı
- vizyonumuz
- hacimleri
- W
- istemek
- savaş
- oldu
- İzle
- Yol..
- we
- ağ
- web hizmetleri
- Çarşamba
- karşılama
- memnuniyetle
- İYİ
- Ne
- ne zaman
- olup olmadığını
- hangi
- süre
- DSÖ
- geniş
- Geniş ürün yelpazesi
- irade
- ile
- içinde
- olmadan
- çalışma
- Dünya
- olur
- Sen
- zefirnet