Kasım 2022'de biz açıkladı AWS müşterilerinin metinden görüntüler oluşturabilmesi Kararlı Difüzyon modelleri Amazon SageMaker Hızlı Başlangıç. Bugün, JumpStart'taki Stable Difüzyon modelleriyle görüntülerin kalitesini yükseltmenize (görüntüleri kaliteden ödün vermeden yeniden boyutlandırmanıza) olanak tanıyan yeni bir özelliği duyuruyoruz. Düşük çözünürlüklü, bulanık ve pikselli bir görüntü, daha yumuşak, daha net ve daha ayrıntılı görünen yüksek çözünürlüklü bir görüntüye dönüştürülebilir. denilen bu süreç, yükseltme, hem gerçek görüntülere hem de tarafından oluşturulan görüntülere uygulanabilir. metinden görüntüye Kararlı Difüzyon modelleri. Bu, e-ticaret ve emlak gibi çeşitli sektörlerde ve ayrıca sanatçılar ve fotoğrafçılar için görüntü kalitesini artırmak için kullanılabilir. Ek olarak, yükseltme, yüksek çözünürlüklü ekranlarda görüntülendiğinde düşük çözünürlüklü görüntülerin görsel kalitesini iyileştirebilir.
Stable Diffusion, görüntüleri yükseltmek için bir AI algoritması kullanır ve bir görüntüdeki boşlukların manuel olarak doldurulmasını gerektirebilecek manuel çalışma ihtiyacını ortadan kaldırır. Milyonlarca görüntü üzerinde eğitilmiştir ve yüksek çözünürlüklü görüntüleri doğru bir şekilde tahmin edebilir, bu da geleneksel görüntü yükselticilere kıyasla ayrıntılarda önemli bir artış sağlar. Ek olarak, en yakın komşu gibi derin öğrenme olmayan tekniklerin aksine, Stable Diffusion, yükseltme sürecini yönlendirmek için bir metin istemi kullanarak görüntünün bağlamını dikkate alır.
Bu gönderide, Stable Diffusion üst ölçekleyici modeliyle çıkarımın nasıl dağıtılacağına ve çalıştırılacağına iki şekilde genel bir bakış sunuyoruz: JumpStart'ın kullanıcı arabirimi (UI) aracılığıyla Amazon SageMaker Stüdyosuve programlı olarak Hızlı Başlangıç API'leri içinde mevcut SageMaker Python SDK'sı.
Çözüme genel bakış
Aşağıdaki resimler, model tarafından gerçekleştirilen yükseltme örneklerini göstermektedir. Solda, model tarafından oluşturulan görüntünün boyutuna uyacak şekilde büyütülmüş orijinal düşük çözünürlüklü görüntü var. Sağda model tarafından oluşturulan görüntü var.
Oluşturulan ilk görüntü, düşük çözünürlüklü kedi görüntüsünün ve "beyaz bir kedi" isteminin sonucudur.
Oluşturulan ikinci görüntü, düşük çözünürlüklü kelebek görüntüsünün ve "yeşil yaprakta kelebek" isteminin sonucudur.
Kararlı Yayılma gibi büyük modelleri çalıştırmak, özel çıkarım betikleri gerektirir. Komut dosyasının, modelin ve istenen örneğin verimli bir şekilde birlikte çalıştığından emin olmak için uçtan uca testler yapmanız gerekir. JumpStart, güçlü bir şekilde test edilmiş kullanıma hazır komut dosyaları sağlayarak bu süreci basitleştirir. Bu komut dosyalarına Studio kullanıcı arabiriminden tek tıklamayla veya çok az kod satırıyla erişebilirsiniz. Hızlı Başlangıç API'leri.
Aşağıdaki bölümler, Studio kullanıcı arabirimini veya JumpStart API'lerini kullanarak modelin nasıl dağıtılacağına ve çıkarımın nasıl çalıştırılacağına ilişkin bir genel bakış sunar.
Bu modeli kullanarak şunları kabul ettiğinizi unutmayın: CreativeML Open RAIL++-M Lisansı.
Studio UI aracılığıyla JumpStart'a erişin
Bu bölümde, JumpStart modellerinin Studio kullanıcı arabirimi aracılığıyla nasıl eğitileceğini ve konuşlandırılacağını gösteriyoruz. Aşağıdaki video, JumpStart'ta önceden eğitilmiş Stable Diffusion upscaler modelinin nasıl bulunacağını ve konuşlandırılacağını gösterir. Model sayfası, model ve nasıl kullanılacağı hakkında değerli bilgiler içerir. Çıkarım için, düşük çıkarım gecikmesi için gereken GPU hızlandırmasını düşük bir fiyat noktasında sağladığından ml.p3.2xlarge bulut sunucusu türünü kullanıyoruz. SageMaker barındırma örneğini yapılandırdıktan sonra, Sürüş. Uç noktanın çalışır duruma gelmesi ve çıkarım isteklerine yanıt vermeye hazır hale gelmesi 5-10 dakika sürer.
Çıkarım yapma süresini hızlandırmak için JumpStart, yeni oluşturulan uç noktada çıkarımın nasıl çalıştırılacağını gösteren örnek bir not defteri sağlar. Not defterine Studio'da erişmek için Not Defterini Aç içinde Studio'dan Endpoint'i kullanın model bitiş noktası sayfasının bölümü.
JumpStart'ı SageMaker SDK ile programlı olarak kullanın
Önceden eğitilmiş bir modeli yalnızca birkaç tıklamayla etkileşimli olarak dağıtmak için JumpStart UI'yi kullanabilirsiniz. Ancak JumpStart modellerini, SageMaker Python SDK'ya entegre edilmiş API'leri kullanarak programlı olarak da kullanabilirsiniz.
Bu bölümde, tümü SageMaker Python SDK kullanarak JumpStart'ta önceden eğitilmiş uygun bir model seçiyoruz, bu modeli bir SageMaker uç noktasına dağıtıyoruz ve dağıtılan uç noktada çıkarım çalıştırıyoruz. Aşağıdaki örnekler kod parçacıklarını içerir. Bu demodaki tüm adımları içeren kodun tamamı için bkz. JumpStart'a Giriş – Bilgi istemi rehberliğinde görüntü kalitesini geliştirin örnek defter.
Önceden eğitilmiş modeli dağıtın
SageMaker, çeşitli derleme ve çalışma zamanı görevleri için Docker kapsayıcılarını kullanır. JumpStart, SageMaker Derin Öğrenme Kapsayıcıları (DLC'ler) çerçeveye özgüdür. İlk olarak, seçilen görev için eğitim ve çıkarımı işlemek için komut dosyalarının yanı sıra ek paketler getiriyoruz. Daha sonra önceden eğitilmiş model yapıtları, model_uris
, platforma esneklik sağlar. Bu, birden çok önceden eğitilmiş modelin tek bir çıkarım betiğiyle kullanılmasına izin verir. Aşağıdaki kod bu işlemi göstermektedir:
Ardından, bu kaynakları bir Adaçayı Yapıcı modeli bir uç noktayı örnekleyin ve dağıtın:
Modelimiz konuşlandırıldıktan sonra, ondan gerçek zamanlı olarak tahminler alabiliriz!
Girdi biçimi
Uç nokta, düşük çözünürlüklü bir görüntüyü ham RGB değerleri veya base64 kodlu bir görüntü olarak kabul eder. Çıkarım işleyicisi, görüntünün kodunu çözer. content_type
:
- İçin
content_type = “application/json”
, giriş yükü, ham RGB değerleri, bir metin istemi ve diğer isteğe bağlı parametreler içeren bir JSON sözlüğü olmalıdır - İçin
content_type = “application/json;jpeg”
, giriş yükü, base64 ile kodlanmış görüntü, bir metin istemi ve diğer isteğe bağlı parametreler içeren bir JSON sözlüğü olmalıdır
Çıkış biçimi
Aşağıdaki kod örnekleri, çıktıların nasıl göründüğüne dair bir fikir verir. Giriş formatına benzer şekilde uç nokta, görüntünün ham RGB değerleriyle veya base64 kodlu bir görüntüyle yanıt verebilir. Bu ayar ile belirtilebilir accept
iki değerden birine:
- İçin
accept = “application/json”
, uç nokta, görüntü için RGB değerleri içeren bir JSON sözlüğü döndürür - İçin
accept = “application/json;jpeg”
, uç nokta, base64.b64 kodlamasıyla kodlanmış baytlar olarak JPEG görüntüsüyle bir JSON sözlüğü döndürür
Ham RGB değerleriyle yükü göndermenin veya almanın, giriş yükü ve yanıt boyutu için varsayılan sınırları aşabileceğini unutmayın. Bu nedenle, base64 kodlu görüntüyü ayarlayarak kullanmanızı öneririz. content_type = “application/json;jpeg”
ve accept = “application/json;jpeg”
.
Aşağıdaki kod, örnek bir çıkarım isteğidir:
Uç nokta yanıtı, oluşturulan görüntüleri ve istemi içeren bir JSON nesnesidir:
desteklenen parametreler
Kararlı Difüzyon yükseltme modelleri, görüntü oluşturma için birçok parametreyi destekler:
- görüntü – Düşük çözünürlüklü bir görüntü.
- istemi – Görüntü üretimine rehberlik edecek bir bilgi istemi. Bir dizi veya dizi listesi olabilir.
- num_inference_steps (isteğe bağlı) – Görüntü oluşturma sırasında gürültü giderme adımlarının sayısı. Daha fazla adım, daha yüksek kaliteli görüntü sağlar. Belirtilmişse, pozitif bir tamsayı olmalıdır. Daha fazla çıkarım adımının daha uzun yanıt süresine yol açacağını unutmayın.
- rehberlik_ölçeği (isteğe bağlı) – Daha yüksek bir yönlendirme ölçeği, görüntü kalitesi pahasına istemle daha yakından ilişkili bir görüntüyle sonuçlanır. Belirtilmişse, bir kayan nokta olmalıdır.
guidance_scale<=1
dikkate alınmaz. - negatif_bilgi istemi (isteğe bağlı) – Bu, görüntü oluşturma işlemini bu istem karşısında yönlendirir. Belirtilmişse, bir dize veya dizeler listesi olmalı ve birlikte kullanılmalıdır.
guidance_scale
. Eğerguidance_scale
devre dışı, bu da devre dışı. Ayrıca, bilgi istemi bir dizgeler listesiyse, o zaman negatif_bilgi istemi de bir diziler listesi olmalıdır. - tohum (isteğe bağlı) – Bu, yeniden üretilebilirlik için rastgele durumu düzeltir. Belirtilmişse, bir tamsayı olmalıdır. Aynı tohumla aynı istemi her kullandığınızda, ortaya çıkan görüntü her zaman aynı olacaktır.
- noise_level (isteğe bağlı) – Bu, yükseltmeden önce gizli vektörlere gürültü ekler. Belirtilmişse, bir tamsayı olmalıdır.
Daha yüksek ve daha yüksek kaliteli görüntüler elde etmek için uç noktayı tekrar tekrar çağırarak bir görüntüyü yinelemeli olarak yükseltebilirsiniz.
Görüntü boyutu ve örnek türleri
Model tarafından oluşturulan görüntüler, orijinal düşük çözünürlüklü görüntünün boyutunun dört katına kadar olabilir. Ayrıca, modelin bellek gereksinimi (GPU belleği) oluşturulan görüntünün boyutuyla birlikte artar. Bu nedenle, zaten yüksek çözünürlüklü bir görüntünün ölçeğini yükseltiyorsanız veya görüntülerin ölçeğini yinelemeli olarak yükseltiyorsanız, büyük bir GPU belleğine sahip bir bulut sunucusu türü seçin. Örneğin ml.g5.2xlarge, daha önce kullandığımız ml.p3.2xlarge bulut sunucusu tipinden daha fazla GPU belleğine sahiptir. Farklı örnek türleri hakkında daha fazla bilgi için bkz. Amazon EC2 Bulut Sunucusu Türleri.
Görüntüleri parça parça yükseltme
Büyük görüntülerin ölçeğini yükseltirken bellek gereksinimlerini azaltmak için görüntüyü daha küçük bölümlere ayırabilirsiniz. fayansve her kutucuğu ayrı ayrı yükseltin. Döşemeler büyütüldükten sonra, son görüntüyü oluşturmak için birlikte karıştırılabilirler. Bu yöntem, modelin döşemenin içeriğini anlaması ve garip görüntüler oluşturmaktan kaçınması için istemin her döşemeye uyarlanmasını gerektirir. Bilgi isteminin stil kısmı, harmanlamayı kolaylaştırmak için tüm döşemeler için tutarlı kalmalıdır. Daha yüksek gürültü giderme ayarları kullanırken, modelin görüntüyü uyarlamak için daha fazla özgürlüğü olduğundan istemde daha belirgin olmak önemlidir. Döşeme yalnızca arka plan içerdiğinde veya resmin ana içeriğiyle doğrudan ilişkili olmadığında bu zor olabilir.
Sınırlamalar ve önyargı
Kararlı Difüzyon, yükseltmede etkileyici bir performansa sahip olsa da, çeşitli sınırlamalardan ve önyargılardan muzdariptir. Bunlar şunları içerir ancak bunlarla sınırlı değildir:
- Eğitim verileri bu özelliklere sahip yeterli sayıda resim içermediğinden, model doğru yüzler veya uzuvlar oluşturamayabilir.
- Model üzerinde eğitildi LAION-5B veri kümesiyetişkinlere uygun içeriğe sahip ve daha fazla değerlendirme yapılmadan ürün kullanımına uygun olmayabilecek
- Model İngilizce metin üzerine eğitildiğinden, model İngilizce dışındaki dillerde iyi çalışmayabilir.
- Model, resimler içinde iyi metin oluşturamıyor
Sınırlamalar ve yanlılık hakkında daha fazla bilgi için bkz. Kararlı Difüzyon üst ölçekleyici model kartı.
Temizlemek
Not defterini çalıştırmayı bitirdikten sonra, faturalandırmanın durdurulmasını sağlamak için süreçte oluşturulan tüm kaynakları sildiğinizden emin olun. Uç noktayı temizleme kodu, ilişkili defter.
Sonuç
Bu yazıda, JumpStart kullanarak önceden eğitilmiş bir Stable Diffusion upscaler modelinin nasıl devreye alınacağını gösterdik. Bu gönderide kod parçacıklarını gösterdik; bu demodaki tüm adımları içeren tam kod şu adreste mevcuttur: JumpStart'a Giriş – Bilgi istemi rehberliğinde görüntü kalitesini geliştirin örnek defter. Çözümü kendi başınıza deneyin ve yorumlarınızı bize gönderin.
Model ve nasıl çalıştığı hakkında daha fazla bilgi edinmek için aşağıdaki kaynaklara bakın:
JumpStart hakkında daha fazla bilgi edinmek için aşağıdaki blog gönderilerine göz atın:
Yazarlar Hakkında
Dr.Vivek Madan Amazon SageMaker JumpStart ekibinde Uygulamalı Bilim Adamıdır. Doktorasını Urbana-Champaign'deki Illinois Üniversitesi'nden aldı ve Georgia Tech'de Doktora Sonrası Araştırmacıydı. Makine öğrenimi ve algoritma tasarımında aktif bir araştırmacıdır ve EMNLP, ICLR, COLT, FOCS ve SODA konferanslarında makaleler yayınlamıştır.
heiko hotz Doğal Dil İşleme (NLP), Büyük Dil Modelleri (LLM'ler) ve Üretken Yapay Zeka konularına özel odaklanan Yapay Zeka ve Makine Öğrenimi için Kıdemli Çözüm Mimarıdır. Bu görevden önce, Amazon'un AB Müşteri Hizmetleri için Veri Bilimi Başkanıydı. Heiko, müşterilerimizin AWS'deki AI/ML yolculuklarında başarılı olmalarına yardımcı olur ve Sigorta, Finansal Hizmetler, Medya ve Eğlence, Sağlık Hizmetleri, Kamu Hizmetleri ve Üretim dahil olmak üzere birçok sektörden kuruluşlarla çalışmıştır. Heiko boş zamanlarında mümkün olduğunca çok seyahat eder.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/upscale-images-with-stable-diffusion-in-amazon-sagemaker-jumpstart/
- 100
- 2022
- 7
- a
- Hakkımızda
- hızlandırmak
- Kabul et
- Kabul eder
- erişim
- Hesap
- doğru
- tam olarak
- elde
- aktif
- uyarlamak
- Ek
- Ayrıca
- Ekler
- Yetişkin
- Sonra
- karşı
- AI
- AI ve Makine Öğrenimi
- AI / ML
- algoritma
- Türkiye
- veriyor
- zaten
- her zaman
- Amazon
- Amazon Adaçayı Yapıcı
- Amazon SageMaker Hızlı Başlangıç
- ve
- duyurmak
- api
- API'ler
- uygulamalı
- uygun
- Sanatçılar
- ilişkili
- otomatik olarak
- mevcut
- AWS
- arka fon
- merkezli
- Çünkü
- önce
- olmak
- önyargı
- fatura
- karıştırma
- Blog
- Blog Yazıları
- mola
- inşa etmek
- denilen
- Alabilirsin
- KEDİ
- zor
- Kontrol
- Klinik
- sınıf
- Daha net
- yakından
- kod
- yorumlar
- karşılaştırıldığında
- konferanslar
- tutarlı
- Konteyner
- Konteynerler
- içeren
- içerik
- bağlam
- dönüştürülmüş
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- Oluşturma
- görenek
- müşteri
- Müşteri Hizmetleri
- Müşteriler
- veri
- veri bilimi
- azaltmak
- derin
- derin öğrenme
- Varsayılan
- göstermek
- dağıtmak
- konuşlandırılmış
- Dizayn
- ayrıntı
- detaylı
- farklı
- Yayılma
- direkt olarak
- özürlü
- liman işçisi
- Değil
- sırasında
- her
- Daha erken
- kolay
- e-ticaret
- verimli biçimde
- ya
- ortadan
- son uca
- Son nokta
- İngilizce
- sağlamak
- Entertainment
- giriş
- arazi
- EU
- örnek
- örnekler
- yüzler
- Özellikler(Hazırlık aşamasında)
- Getirildi
- az
- fileto
- son
- mali
- finansal hizmetler
- bulmak
- Ad
- uygun
- Esneklik
- Şamandıra
- odak
- takip etme
- biçim
- Freedom
- itibaren
- tam
- daha fazla
- Ayrıca
- oluşturmak
- oluşturulan
- nesil
- üretken
- üretken yapay zeka
- almak
- Vermek
- belirti
- Tercih Etmenizin
- GPU
- Yeşil
- Büyür
- rehberlik
- Rehberler
- sap
- baş
- sağlık
- yükseklik
- yardımcı olur
- yüksek çözünürlük
- daha yüksek
- vurmak
- hosting
- Ne kadar
- Nasıl Yapılır
- Ancak
- HTML
- HTTPS
- Illinois
- görüntü
- görüntüleri
- önemli
- etkileyici
- iyileştirmek
- in
- dahil
- Dahil olmak üzere
- Artırmak
- Bireysel olarak
- Endüstri
- bilgi
- giriş
- örnek
- sigorta
- entegre
- arayüzey
- IT
- seyahat
- json
- bilinen
- dil
- Diller
- büyük
- Gecikme
- öncülük etmek
- ÖĞRENİN
- öğrenme
- Lets
- sınırlamaları
- Sınırlı
- sınırları
- hatları
- Liste
- uzun
- Bakın
- gibi görünmek
- kaybetme
- Düşük
- makine
- makine öğrenme
- Ana
- yapmak
- Manuel
- el işi
- el ile
- üretim
- çok
- Maç
- medya
- Bellek
- yöntem
- milyonlarca
- dakika
- ML
- model
- modelleri
- Daha
- çoklu
- Doğal (Madenden)
- Doğal Dil İşleme
- gerek
- yeni
- nlp
- Gürültü
- defter
- Kasım
- numara
- nesne
- ONE
- açık
- sipariş
- organizasyonlar
- orijinal
- Diğer
- genel bakış
- kendi
- paketler
- kâğıtlar
- parametreler
- Bölüm
- performans
- resim
- parça
- platform
- Platon
- Plato Veri Zekası
- PlatoVeri
- Nokta
- pozitif
- mümkün
- Çivi
- Mesajlar
- güçler
- tahmin
- Tahminler
- Predictor
- mevcut
- fiyat
- Önceki
- süreç
- işleme
- PLATFORM
- sağlamak
- sağlar
- sağlama
- yayınlanan
- Python
- kalite
- Rastgele
- Çiğ
- hazır
- gerçek
- gayrimenkul
- alma
- tavsiye etmek
- ilgili
- kalmak
- DEFALARCA
- talep
- isteklerinizi
- gerektirir
- gereklilik
- Yer Alan Kurallar
- gerektirir
- araştırmacı
- çözüm
- Kaynaklar
- Yanıtlamak
- yanıt
- sonuç
- Ortaya çıkan
- Sonuçlar
- dönüş
- İade
- RGB
- Rol
- koşmak
- koşu
- sagemaker
- aynı
- ölçek
- Bilim
- bilim adamı
- ekranlar
- scriptler
- sdk
- İkinci
- Bölüm
- bölümler
- tohum
- seçilmiş
- gönderme
- kıdemli
- hizmet
- Hizmetler
- ayar
- ayarlar
- birkaç
- meli
- şov
- Gösteriler
- önemli
- benzer şekilde
- tek
- beden
- daha küçük
- pürüzsüz
- So
- çözüm
- Çözümler
- özel
- özel
- Belirtilen
- kararlı
- Eyalet
- Basamaklar
- durdu
- stüdyo
- stil
- başarılı
- böyle
- Çekiyor
- yeterli
- destek
- Bizi daha iyi tanımak için
- alır
- Görev
- görevleri
- takım
- teknoloji
- teknikleri
- testleri
- The
- ve bazı Asya
- bu nedenle
- İçinden
- zaman
- zamanlar
- için
- bugün
- birlikte
- geleneksel
- Tren
- eğitilmiş
- Eğitim
- seyahatleriniz
- türleri
- ui
- anlamak
- üniversite
- us
- kullanım
- kullanıcı
- Kullanıcı Arayüzü
- kamu hizmetleri
- kullanır
- Değerli
- Değerler
- çeşitli
- üzerinden
- Video
- yolları
- Ne
- hangi
- beyaz
- irade
- içinde
- olmadan
- İş
- birlikte çalışmak
- işlenmiş
- çalışır
- Sen
- zefirnet