Son gelişmelerle birlikte üretken yapay zeka, belirli iş sorunlarını çözmek için farklı sektörlerde üretken yapay zekanın nasıl kullanılacağına dair birçok tartışma var. Generative AI, konuşmalar, hikayeler, resimler, videolar ve müzik dahil olmak üzere yeni içerik ve fikirler oluşturabilen bir AI türüdür. Hepsi, çok büyük miktarda veri üzerinde önceden eğitilmiş ve yaygın olarak adlandırılan çok büyük modellerle desteklenir. temel modeller (FM'ler). Bu FM'ler, blog gönderileri yazmak, resimler oluşturmak, matematik problemleri çözmek, diyalog kurmak ve bir belgeye dayalı olarak soruları yanıtlamak gibi birden çok alanı kapsayan çok çeşitli görevleri gerçekleştirebilir. FM'lerin boyutu ve genel amaçlı doğası, onları tipik olarak duyarlılık için metin analizi, görüntüleri sınıflandırma ve trendleri tahmin etme gibi belirli görevleri yerine getiren geleneksel makine öğrenimi modellerinden farklı kılar.
Kuruluşlar bu FM'lerin gücünü kullanmak isterken, FM tabanlı çözümlerin kendi korunan ortamlarında çalışmasını da isterler. Küresel finansal hizmetler, sağlık hizmetleri ve yaşam bilimleri gibi yoğun şekilde düzenlenmiş alanlarda faaliyet gösteren kuruluşların, ortamlarını VPC'lerinde çalıştırmak için işitsel ve uyumluluk gereksinimleri vardır. Aslında, çoğu zaman, hem giriş hem de çıkışta istenmeyen herhangi bir trafiğe maruz kalmamak için bu ortamlarda doğrudan internet erişimi bile devre dışı bırakılır.
Amazon SageMaker Hızlı Başlangıç algoritmalar, modeller ve makine öğrenimi çözümleri sunan bir makine öğrenimi merkezidir. SageMaker JumpStart ile makine öğrenimi uygulayıcıları, giderek artan en iyi performans gösteren açık kaynak FM'ler listesinden seçim yapabilir. Ayrıca, bu modelleri kendi başınıza dağıtma yeteneği de sağlar. Sanal Özel Bulut (VPC).
Bu gönderide, bir dağıtımı devreye almak için JumpStart'ın nasıl kullanılacağını gösteriyoruz. Tart-T5 XXL modeli internet bağlantısı olmayan bir VPC'de. Aşağıdaki konuları tartışıyoruz:
- İnternet erişimi olmayan bir VPC'de SageMaker JumpStart kullanılarak bir temel model nasıl dağıtılır
- VPC modunda SageMaker JumpStart modelleri aracılığıyla FM dağıtmanın avantajları
- Temel modellerin dağıtımını JumpStart aracılığıyla özelleştirmenin alternatif yolları
JumpStart, FLAN-T5 XXL dışında, çeşitli görevler için birçok farklı temel modeli sunar. Tam liste için göz atın Amazon SageMaker JumpStart'ı kullanmaya başlarken.
Çözüme genel bakış
Çözümün bir parçası olarak aşağıdaki adımları ele alıyoruz:
- İnternet bağlantısı olmayan bir VPC kurun.
- Kurmak Amazon SageMaker Stüdyosu oluşturduğumuz VPC'yi kullanarak.
- İnternet erişimi olmayan VPC'de JumpStart'ı kullanarak üretken AI Flan T5-XXL temel modelini dağıtın.
Aşağıdaki, çözümün bir mimari diyagramıdır.
Bu çözümü uygulamak için farklı adımlardan geçelim.
Önkoşullar
Bu gönderiyi takip etmek için aşağıdakilere ihtiyacınız var:
İnternet bağlantısı olmayan bir VPC kurun
Yeni bir CloudFormation yığını oluşturun kullanarak 01_networking.yaml şablon. Bu şablon, yeni bir VPC oluşturur ve internet bağlantısı olmayan iki Erişilebilirlik Alanında iki özel alt ağ ekler. Daha sonra erişim için ağ geçidi VPC uç noktalarını dağıtır Amazon Basit Depolama Hizmeti (Amazon S3) ve VPC'deki kaynakların AWS hizmetlerine bağlanmasına izin vermek için SageMaker ve diğer birkaç hizmet için arayüz VPC uç noktaları AWS Özel Bağlantı.
gibi bir yığın adı sağlayın. No-Internet
, ve yığın oluşturma işlemini tamamlayın.
CloudFormation şablonu, bu gönderideki adımları uygularken maliyetleri azaltmak için yalnızca bir alt ağda arayüz VPC uç noktaları oluşturduğundan, bu çözüm yüksek düzeyde kullanılabilir değildir.
VPC'yi kullanarak Studio'yu kurun
Kullanarak başka bir CloudFormation yığını oluşturun 02_sagemaker_studio.yaml, bir Studio alanı, Studio kullanıcı profili ve IAM rolleri gibi destekleyici kaynaklar oluşturur. Yığın için bir ad seçin; bu gönderi için adı kullanıyoruz SageMaker-Studio-VPC-No-Internet
. Daha önce oluşturduğunuz VPC yığınının adını girin (No-Internet
) olarak CoreNetworkingStackName
parametre ve diğer her şeyi varsayılan olarak bırakın.
AWS CloudFormation, yığın oluşturmanın tamamlandığını bildirene kadar bekleyin. Studio etki alanının SageMaker konsolunda kullanılabilir olduğunu onaylayabilirsiniz.
Studio etki alanı kullanıcısının internet erişimi olmadığını doğrulamak için, SageMaker konsolunu kullanarak Studio'yu başlatın. Seçin fileto, yeni, ve terminal, ardından bir internet kaynağına erişmeyi deneyin. Aşağıdaki ekran görüntüsünde gösterildiği gibi, terminal kaynağı beklemeye devam edecek ve sonunda zaman aşımına uğrayacaktır.
Bu, Studio'nun internet erişimi olmayan bir VPC'de çalıştığını kanıtlar.
Üretken AI temel modeli Flan T5-XXL'i JumpStart kullanarak devreye alın
Bu modeli API aracılığıyla olduğu kadar Studio aracılığıyla da dağıtabiliriz. JumpStart, Studio'dan erişilebilen bir SageMaker not defteri aracılığıyla modeli dağıtmak için tüm kodu sağlar. Bu gönderi için, Studio'nun bu özelliğini sergiliyoruz.
- Studio hoş geldiniz sayfasında, HızlıBaşlangıç Önceden oluşturulmuş ve otomatikleştirilmiş çözümler altında.
- Aşağıdan Flan-T5 XXL modelini seçin Temel Modelleri.
- Varsayılan olarak, Sürüş sekmesi. Genişletin Dağıtım Yapılandırması değiştirmek için bölüm
hosting instance
veendpoint name
veya herhangi bir ek etiket ekleyin. değiştirmek için bir seçenek de vardırS3 bucket location
uç noktayı oluşturmak için model yapısının depolanacağı yer. Bu gönderi için her şeyi varsayılan değerlerinde bırakıyoruz. Tahmin yapmak için uç noktayı çağırırken kullanılacak uç nokta adını not edin.
- genişletmek Güvenlik Ayarları belirtebileceğiniz bölümdür.
IAM role
bitiş noktası oluşturmak için. Ayrıca belirtebilirsinizVPC configurations
sağlayaraksubnets
vesecurity groups
. Alt ağ kimlikleri ve güvenlik grubu kimlikleri, AWS CloudFormation konsolundaki VPC yığınının Çıktılar sekmesinden bulunabilir. SageMaker JumpStart, bu yapılandırmanın bir parçası olarak en az iki alt ağ gerektirir. Alt ağlar ve güvenlik grupları, model kabına ve model kapsayıcısından erişimi kontrol eder.
NOT: SageMaker JumpStart modelinin VPC'de dağıtılıp dağıtılmadığına bakılmaksızın, model her zaman model kapsayıcısını izole eden ağ izolasyon modunda çalışır, böylece model kapsayıcısına gelen veya giden ağ araması yapılamaz. Bir VPC kullandığımız için SageMaker, belirlediğimiz VPC aracılığıyla model yapıtını indirir. Model kapsayıcısını ağ izolasyonunda çalıştırmak, SageMaker uç noktanızın çıkarım isteklerine yanıt vermesini engellemez. Model kapsayıcının yanında bir sunucu işlemi çalışır ve ona çıkarım isteklerini iletir, ancak model kapsayıcının ağ erişimi yoktur.
- Klinik Sürüş modeli dağıtmak için. Devam eden uç nokta oluşturma işleminin gerçek zamanlıya yakın durumunu görebiliriz. Uç nokta oluşturma işleminin tamamlanması 5-10 dakika sürebilir.
Alanın değerini gözlemleyin Model veri konumu bu sayfada. Tüm SageMaker JumpStart modelleri, SageMaker tarafından yönetilen bir S3 klasöründe barındırılır (s3://jumpstart-cache-prod-{region}
). Bu nedenle, JumpStart'tan hangi modelin seçildiğine bakılmaksızın, model herkesin erişebileceği SageMaker JumpStart S3 kovasından dağıtılır ve modeli indirmek için trafik hiçbir zaman genel model hayvanat bahçesi API'lerine gitmez. Doğrudan internet erişimi olmayan bir VPC'de uç nokta oluştururken bile model uç noktası oluşturmanın başarılı bir şekilde başlamasının nedeni budur.
Model yapıtı ayrıca herhangi bir özel model hayvanat bahçesine veya kendi S3 kovanıza kopyalanarak model kaynak konumunu daha fazla kontrol edebilir ve güvenli hale getirebilir. Modeli kullanarak yerel olarak indirmek için aşağıdaki komutu kullanabilirsiniz. AWS Komut Satırı Arayüzü (AWS CLI):
aws s3 cp s3://jumpstart-cache-prod-eu-west-1/huggingface-infer/prepack/v1.0.2/infer-prepack-huggingface-text2text-flan-t5-xxl.tar.gz .
- Birkaç dakika sonra uç nokta başarıyla oluşturulur ve durumu şu şekilde gösterir: Serviste. Seçin
Open Notebook
içindeUse Endpoint from Studio
bölüm. Bu, uç noktayı hızlı bir şekilde test etmek için JumpStart deneyiminin bir parçası olarak sağlanan örnek bir not defteridir.
- Not defterinde, görüntüyü şu şekilde seçin: Veri Bilimi 3.0 ve çekirdek olarak Python 3. Çekirdek hazır olduğunda, uç noktada tahminler yapmak için not defteri hücrelerini çalıştırabilirsiniz. Dizüstü bilgisayarın kullandığını unutmayın. invoke_endpoint() API'den gelen Python için AWS SDK'sı tahminler yapmak için. Alternatif olarak, SageMaker Python SDK'nın tahmini() Aynı sonuca ulaşmak için kullanılan yöntem.
Bu, internet erişimi olmayan bir VPC içinde JumpStart kullanarak Flan-T5 XXL modelini dağıtma adımlarını tamamlar.
SageMaker JumpStart modellerini VPC modunda devreye almanın avantajları
Aşağıdakiler, SageMaker JumpStart modellerini VPC modunda konuşlandırmanın avantajlarından bazılarıdır:
- SageMaker JumpStart, modelleri halka açık bir model hayvanat bahçesinden indirmediği için, tamamen kilitli ortamlarda ve internet erişiminin olmadığı yerlerde kullanılabilir.
- Ağ erişimi SageMaker JumpStart modelleri için sınırlandırılabileceğinden ve kapsam daraltılabileceğinden, bu, ekiplerin ortamın güvenlik duruşunu iyileştirmesine yardımcı olur.
- VPC sınırları nedeniyle uç noktaya erişim, ekstra bir güvenlik katmanı ekleyen alt ağlar ve güvenlik grupları aracılığıyla da sınırlandırılabilir.
Temel modellerin dağıtımını SageMaker JumpStart aracılığıyla özelleştirmenin alternatif yolları
Bu bölümde, modeli devreye almanın bazı alternatif yollarını paylaşıyoruz.
Tercih ettiğiniz IDE'den SageMaker JumpStart API'lerini kullanın
SageMaker JumpStart tarafından sağlanan modeller, Studio'ya erişmenizi gerektirmez. sayesinde herhangi bir IDE'den SageMaker uç noktalarına dağıtabilirsiniz. Hızlı Başlangıç API'leri. Bu gönderide daha önce açıklanan Studio kurulum adımını atlayabilir ve modeli dağıtmak için JumpStart API'lerini kullanabilirsiniz. Bu API'ler, VPC yapılandırmalarının da sağlanabileceği argümanlar sağlar. API'ler, SageMaker Python SDK'sı kendisi. Daha fazla bilgi için bkz. Önceden eğitilmiş modeller.
SageMaker Studio'dan SageMaker JumpStart tarafından sağlanan not defterlerini kullanın
SageMaker JumpStart, modeli doğrudan dağıtmak için not defterleri de sağlar. Model detay sayfasında, Not defterini aç uç noktayı dağıtma kodunu içeren örnek bir not defteri açmak için. not defteri kullanır SageMaker JumpStart Endüstri API'leri modelleri listelemenize ve filtrelemenize, yapıları almanıza ve uç noktaları dağıtmanıza ve sorgulamanıza olanak tanır. Not defteri kodunu kullanım durumunuza özel gereksinimlerinize göre de düzenleyebilirsiniz.
Kaynakları temizleme
Check out TEMİZLEME.md Bu gönderinin bir parçası olarak oluşturulan Studio, VPC ve diğer kaynakları silmeye yönelik ayrıntılı adımları bulmak için dosya.
Sorun giderme
CloudFormation yığınlarını oluştururken herhangi bir sorunla karşılaşırsanız, bkz. CloudFormation'da Sorun Giderme.
Sonuç
Büyük dil modellerinden güç alan üretken yapay zeka, insanların bilgilerden içgörü elde etme ve bunları uygulama şeklini değiştiriyor. Bununla birlikte, yoğun şekilde düzenlenmiş alanlarda faaliyet gösteren kuruluşların, üretken yapay zeka yeteneklerini, daha hızlı yenilik yapmalarına izin verecek ve aynı zamanda bu tür yeteneklere erişim modellerini basitleştirecek şekilde kullanmaları gerekmektedir.
Üretken yapay zeka yeteneklerini mevcut ortamınıza entegre ederken internet erişimi olmayan kendi VPC'nizde tutmaya devam etmek için bu gönderide sağlanan yaklaşımı denemenizi öneririz. SageMaker JumpStart temel modelleri hakkında daha fazla bilgi için aşağıdakilere göz atın:
yazarlar hakkında
vikeş pandey AWS'de Makine Öğrenimi Uzmanı Çözüm Mimarıdır ve finans sektöründeki müşterilerin üretken yapay zeka ve makine öğrenimi üzerinde çözümler tasarlamasına ve oluşturmasına yardımcı olur. Vikesh, iş dışında farklı mutfakları denemekten ve açık hava sporları yapmaktan hoşlanıyor.
Mehran Nikoo AWS'de Kıdemli Çözümler Mimarı, Birleşik Krallık'taki Dijital Yerli işletmelerle birlikte çalışıyor ve hedeflerine ulaşmalarına yardımcı oluyor. Yazılım mühendisliği deneyimini makine öğrenimine uygulama konusunda tutkulu, uçtan uca makine öğrenimi ve MLOps uygulamalarında uzmandır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. Otomotiv / EV'ler, karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- Blok Ofsetleri. Çevre Dengeleme Sahipliğini Modernleştirme. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/use-generative-ai-foundation-models-in-vpc-mode-with-no-internet-connectivity-using-amazon-sagemaker-jumpstart/
- :vardır
- :dır-dir
- :olumsuzluk
- :Neresi
- $UP
- 100
- 7
- a
- kabiliyet
- Hakkımızda
- erişim
- ulaşılabilir
- erişme
- Başarmak
- kazanmak
- karşısında
- eklemek
- Ek
- Ekler
- gelişmeler
- avantajları
- AI
- algoritmalar
- Türkiye
- izin vermek
- veriyor
- boyunca
- yanında
- Ayrıca
- her zaman
- Amazon
- Amazon Adaçayı Yapıcı
- Amazon SageMaker Hızlı Başlangıç
- Amazon Web Servisleri
- tutarları
- an
- analiz
- ve
- Başka
- herhangi
- api
- API'ler
- Tamam
- Uygulanması
- yaklaşım
- mimari
- ARE
- argümanlar
- AS
- At
- Otomatik
- kullanılabilirliği
- mevcut
- önlemek
- AWS
- AWS CloudFormation
- arka çıkılmış
- merkezli
- BE
- Çünkü
- İYİ
- Blog
- Blog Yazıları
- her ikisi de
- sınırları
- inşa etmek
- iş
- işletmeler
- fakat
- by
- aramalar
- CAN
- yetenekleri
- kabiliyet
- Hücreler
- değişiklik
- değiştirme
- Kontrol
- Klinik
- bulut
- kod
- çoğunlukla
- tamamlamak
- uyma
- yapılandırma
- Onaylamak
- Sosyal medya
- bağ
- Bağlantı
- konsolos
- Konteyner
- içerik
- kontrol
- konuşmaları
- maliyetler
- olabilir
- kapak
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- oluşturur
- Oluşturma
- oluşturma
- Müşteriler
- özelleştirmek
- veri
- Varsayılan
- göstermek
- dağıtmak
- konuşlandırılmış
- dağıtma
- açılma
- dağıtır
- Dizayn
- ayrıntı
- detaylı
- Diyalog
- farklı
- dijital
- direkt
- direkt olarak
- özürlü
- tartışmak
- tartışılan
- tartışmalar
- belge
- Değil
- domain
- etki
- Dont
- aşağı
- indir
- indirme
- Daha erken
- başka
- gömmek
- teşvik etmek
- son uca
- Son nokta
- çekici
- Mühendislik
- çevre
- ortamları
- Hatta
- sonunda
- her şey
- mevcut
- Genişletmek
- deneyim
- Maruz kalma
- ekstra
- gerçek
- Daha hızlı
- az
- alan
- fileto
- filtre
- mali
- finans endüstrileri
- finansal hizmetler
- bulmak
- takip et
- takip etme
- İçin
- bulundu
- vakıf
- itibaren
- tamamen
- daha fazla
- geçit
- genel amaçlı
- üreten
- üretken
- üretken yapay zeka
- Küresel
- küresel finans
- Goller
- Goes
- grup
- Grubun
- Büyüyen
- olay
- Var
- he
- sağlık
- ağır şekilde
- yardım
- yardımcı olur
- büyük ölçüde
- onun
- ev sahipliği yaptı
- Ne kadar
- Nasıl Yapılır
- Ancak
- HTML
- http
- HTTPS
- merkez
- fikirler
- kimlikleri
- görüntü
- görüntüleri
- uygulamak
- iyileştirmek
- in
- Dahil olmak üzere
- Endüstri
- sanayi
- bilgi
- yenilik yapmak
- içeride
- anlayışlar
- arayüzey
- Internet
- internet erişimi
- internet bağlantısı
- bakılmaksızın
- izolasyon
- sorunlar
- IT
- ONUN
- kendisi
- jpg
- tutmak
- koruma
- dil
- büyük
- tabaka
- öğrenme
- en az
- Ayrılmak
- hayat
- Yaşam Bilimleri
- sevmek
- Sınırlı
- çizgi
- Liste
- lokal olarak
- yer
- bakıyor
- Çok
- makine
- makine öğrenme
- yapılmış
- yapmak
- Yapımı
- yönetilen
- matematik
- Mayıs..
- yöntem
- dakika
- ML
- MLO'lar
- Moda
- model
- modelleri
- Daha
- çoklu
- Music
- isim
- yerli
- Tabiat
- gerek
- ağ
- asla
- yeni
- yok hayır
- defter
- of
- teklif
- on
- ONE
- bir tek
- açık
- açık kaynak
- açılır
- işletme
- seçenek
- or
- organizasyonlar
- Diğer
- bizim
- dışarı
- dışında
- kendi
- Kanal
- parametre
- Bölüm
- tutkulu
- desen
- İnsanlar
- başına
- Yapmak
- icra
- seçilmiş
- Platon
- Plato Veri Zekası
- PlatoVeri
- oynama
- Çivi
- Mesajlar
- güç kelimesini seçerim
- powered
- uygulamalar
- tahmin
- Tahminler
- Predictor
- tercihli
- önlemek
- özel
- sorunlar
- süreç
- Profil
- Ilerleme
- korumalı
- kanıtlıyor
- sağlamak
- sağlanan
- sağlar
- sağlama
- halka açık
- alenen
- Python
- Sorular
- hızla
- menzil
- Okuma
- hazır
- son
- azaltmak
- Referans
- düzenlenmekte olan
- Raporlar
- isteklerinizi
- gerektirir
- gereklidir
- Yer Alan Kurallar
- gerektirir
- kaynak
- Kaynaklar
- yanıt
- sonuç
- rolleri
- koşmak
- koşu
- ishal
- sagemaker
- aynı
- Bilim
- BİLİMLERİ
- sdk
- Bölüm
- güvenli
- güvenlik
- görmek
- kıdemli
- duygu
- Hizmetler
- kurulum
- paylaş
- vitrin
- gösterilen
- Gösteriler
- Basit
- beden
- So
- Yazılım
- yazılım Mühendisliği
- çözüm
- Çözümler
- ÇÖZMEK
- Çözme
- biraz
- Kaynak
- alanlarda
- karış
- uzman
- uzmanlaşmış
- özel
- Belirtilen
- Spor
- yığın
- Yığınları
- başladı
- Durum
- adım
- Basamaklar
- Yine
- hafızası
- saklı
- hikayeler
- stüdyo
- alt
- altağlar
- Başarılı olarak
- böyle
- Verilen
- Destek
- Bizi daha iyi tanımak için
- görevleri
- takım
- şablon
- terminal
- test
- Teşekkür
- o
- The
- UK
- ve bazı Asya
- Onları
- sonra
- Orada.
- bu nedenle
- Bunlar
- onlar
- Re-Tweet
- İçinden
- zaman
- zamanlar
- için
- Konular
- geleneksel
- trafik
- Trendler
- denemek
- iki
- tip
- tipik
- Uk
- altında
- kadar
- kullanım
- Kullanılmış
- kullanıcı
- kullanım
- kullanma
- değer
- Değerler
- çeşitli
- Geniş
- doğrulamak
- çok
- üzerinden
- Videolar
- Bekleyen
- istemek
- Yol..
- yolları
- we
- ağ
- web hizmetleri
- karşılama
- İYİ
- ne zaman
- olup olmadığını
- hangi
- süre
- neden
- geniş
- Geniş ürün yelpazesi
- Vikipedi
- irade
- ile
- içinde
- İş
- çalışma
- yazı yazıyor
- tatlım
- Sen
- zefirnet
- bölgeleri
- ZOO