Derin öğrenmedeki son gelişmeler, bazıları halihazırda 3 milyar parametreyi aşan GPT-100, BLOOM ve OPT gibi giderek daha büyük modellerin ortaya çıkmasına yol açmıştır. Daha büyük modeller daha güçlü olma eğiliminde olsa da, bu tür modellerin eğitimi önemli hesaplama kaynakları gerektirir. FSDP ve DeepSpeed gibi gelişmiş dağıtılmış eğitim kitaplıklarının kullanılmasıyla bile, eğitim işlerinin her seferinde birkaç hafta veya ay boyunca yüzlerce hızlandırıcı cihaz gerektirmesi yaygın bir durumdur.
2022'nin sonlarında AWS, şu özelliklerin genel kullanılabilirliğini duyurdu: Amazon EC2 Trn1 bulut sunucuları tarafından desteklenmektedir AWS Eğitimi— bulutta derin öğrenme modellerini eğitmek için yüksek performanslı, uygun maliyetli ve büyük ölçüde ölçeklenebilir bir platform sağlamak üzere optimize edilmiş amaca yönelik bir makine öğrenimi (ML) hızlandırıcı. Trn1 bulut sunucuları, bulut sunucusu başına 16 adede kadar Trainium hızlandırıcıyla çeşitli boyutlarda (aşağıdaki tabloya bakın) mevcuttur.
Örnek Boyutu | Trainium Hızlandırıcıları | Hızlandırıcı Belleği (GB) | vCPU'lar | Örnek Belleği (GiB) | Ağ Bant Genişliği (Gbps) |
trn1.2xlarge | 1 | 32 | 8 | 32 | 12.5 kadar |
trn1.32xlarge | 16 | 512 | 128 | 512 | 800 |
trn1n.32xlarge (çok yakında) | 16 | 512 | 128 | 512 | 1600 |
Trn1 bulut sunucuları, daha küçük eğitim işleri için bağımsız örnekler olarak veya on binlerce Trainium hızlandırıcısında dağıtılmış eğitimi destekleyen yüksek düzeyde ölçeklenebilir ultrakümelerde konuşlandırılabilir. Tüm Trn1 bulut sunucuları bağımsız yapılandırmayı desteklerken, Trn1 ultrakümeleri trn1.32xlarge veya trn1n.32xlarge bulut sunucuları gerektirir. Bir ultrakümede birden çok Trn1 bulut sunucusu, belirli bir AWS Erişilebilirlik Alanında aynı yerde bulunur ve toplu bilgi işlem işlemleri için örnek başına 800 Gb/sn bloke olmayan ağ bant genişliği sağlayan yüksek hızlı, düşük gecikmeli, Elastik Yapı Adaptörü (EFA) ağ iletişimi ile bağlanır . 1'ün başlarında kullanıma sunulacak olan trn32n.2023xlarge bulut sunucusu tipi, bu bant genişliğini bulut sunucusu başına 1600 Gb/sn'ye çıkaracak.
Birçok kurumsal müşteri, derin öğrenme iş yüklerini bulutta kapsayıcı düzenleme için fiili standart olan Kubernetes'i kullanarak devreye almayı tercih ediyor. AWS müşterileri genellikle bu iş yüklerini Amazon Elastik Kubernetes Hizmeti (Amazon EKS). Amazon EKS, Kubernetes kümelerinin oluşturulmasını, yapılandırılmasını, yaşam döngüsünü ve izlenmesini basitleştirirken yukarı akış Kubernetes'in tam esnekliğini sunmaya devam eden yönetilen bir Kubernetes hizmetidir.
Bugün, Amazon EKS ve EC2 Trn1 bulut sunucularını kullanan dağıtılmış eğitim işleri için resmi desteği duyurmaktan heyecan duyuyoruz. Bu duyuru ile artık Trn1 bulut sunucularının sunduğu fiyat-performans, ölçeklenebilirlik ve kullanım kolaylığından tam olarak yararlanırken Amazon EKS içinde büyük ölçekli kapsayıcılı eğitim işlerini kolayca yürütebilirsiniz.
Bu duyurunun yanı sıra, Amazon EKS ve Trn1 bulut sunucularını kullanarak çok eşgörünümlü dağıtılmış bir eğitim işini (BERT 1. aşama ön eğitim) çalıştırmak için gereken adımlar konusunda size yol gösteren ayrıntılı bir öğretici de yayınlıyoruz. Bu gönderide, çözüm mimarisi hakkında bilgi edinecek ve eğitimdeki birkaç önemli adımı gözden geçireceksiniz. Bakın resmi eğitim deposu eksiksiz uçtan uca iş akışı için.
Devam etmek için, aşağıdakiler gibi temel AWS hizmetleri hakkında geniş bir aşinalık Amazon Elastik Bilgi İşlem Bulutu (Amazon EC2) ve Amazon EKS ima edilmiştir ve derin öğrenme ve PyTorch ile ilgili temel aşinalık yardımcı olacaktır.
Çözüm mimarisi
Aşağıdaki şemada çözüm mimarisi gösterilmektedir.
Çözüm aşağıdaki ana bileşenlerden oluşur:
- Bir EKS kümesi
- trn1.32xlarge örneklerinden oluşan bir EKS düğüm grubu
- The AWS Nöron SDK
- Neuron ve EFA için EKS eklentileri
- An Amazon Elastik Konteyner Kayıt Defteri (Amazon ECR) Deposu
- Bir eğitim kapsayıcı görüntüsü
- An Lustre için Amazon FSx Dosya sistemi
- Bir Volcano toplu zamanlayıcı ve etcd sunucusu
- TorchX evrensel iş başlatıcı
- Trainium için TorchX DDP modülü
Çözümün merkezinde, size bir EKS hizmet uç noktası aracılığıyla temel Kubernetes yönetim işlevselliği sağlayan bir EKS kümesi bulunur. Amazon EKS'nin avantajlarından biri, hizmetin kontrol düzlemini yüke göre aktif olarak izlemesi ve ölçeklendirmesidir, bu da dağıtılmış eğitim gibi büyük iş yükleri için yüksek performans sağlar. EKS kümesinin içinde, aynı Erişilebilirlik Alanında bulunan iki veya daha fazla trn1.32xlarge Trainium tabanlı bulut sunucusundan oluşan bir düğüm grubu bulunur.
Neuron SDK, Trainium hızlandırıcılarının avantajlarına erişmenizi sağlayan sürücü, derleyici, çalışma zamanı, çerçeve entegrasyonu (örneğin, PyTorch Neuron) ve kullanıcı araçlarını sağlayan yazılım yığınıdır. Neuron aygıt sürücüsü doğrudan EKS düğümlerinde (Trn1 bulut sunucuları) çalışır ve düğümlerde başlatılan eğitim kapsayıcılarından Trainium yongalarına erişim sağlar. Dağıtılmış eğitim için gerekli olan Trainium çiplerine ve EFA ağ oluşturma cihazlarına erişim sağlamak için EKS kümesi içinde Neuron ve EFA eklentileri kurulur.
Eğitim kapsayıcısı görüntülerini depolamak için bir ECR deposu kullanılır. Bu görüntüler, Neuron SDK'yı (doğrudan Trn1 örneklerinde çalışan Neuron sürücüsü hariç), PyTorch eğitim komut dosyasını ve gerekli bağımlılıkları içerir. EKS kümesinde bir eğitim işi başlatıldığında, kapsayıcı görüntüleri önce Amazon ECR'den EKS düğümlerine çekilir ve daha sonra görüntülerden PyTorch çalışan kapsayıcıları başlatılır.
Paylaşılan depolama, trn1.32xlarge bulut sunucularıyla aynı Erişilebilirlik Alanında bulunan yüksek performanslı bir FSx for Luster dosya sistemi kullanılarak sağlanır. FSx for Luster dosya sisteminin oluşturulması ve EKS kümesine eklenmesine şu aracılık eder: Luster CSI sürücüsü için Amazon FSx. Bu çözümde, paylaşılan depolama, eğitim veri kümesini ve eğitim sürecinde oluşturulan tüm günlükleri veya yapıtları depolamak için kullanılır.
Çözüm kullanır TorchX evrensel iş başlatıcı Amazon EKS içinde dağıtılmış eğitim işlerini başlatmak için. TorchX'in iki önemli bağımlılığı vardır: Volcano toplu zamanlayıcı ve etcd sunucusu. Volcano, eğitim işlerinin planlanmasını ve kuyruğa alınmasını üstlenirken, etcd sunucusu, TorchElastic tarafından iş başlatma sırasında senkronizasyon ve akran keşfi için kullanılan bir anahtar/değer deposudur.
TorchX kullanılarak bir eğitim işi başlatıldığında, başlatma komutu, genel eğitim işini yapılandırmak ve ardından PyTorch çalışan bölmelerinin her birinde uygun torchrun komutlarını çalıştırmak için Trainium için sağlanan TorchX dağıtılmış DDP modülünü kullanır. Bir iş çalışırken, standart Kubernetes araçları (kubectl gibi) veya TensorBoard gibi standart makine öğrenimi araç setleri kullanılarak izlenebilir.
Çözüme genel bakış
Bu çözümün önemli adımlarına bir göz atalım. Bu genel bakış boyunca, TorchX ve EKS Kullanarak Trainium'da Çok Düğümlü PyTorch Nöron Eğitimi İşi Başlatın GitHub'da öğretici.
EKS kümesi oluşturma
Trn1 bulut sunucularına sahip Amazon EKS'de dağıtılmış eğitim işlerine başlamak için önce şu bölümde ana hatlarıyla belirtildiği gibi bir EKS kümesi oluşturursunuz: GitHub'da öğretici. Küme oluşturma, aşağıdakiler gibi standart araçlar kullanılarak gerçekleştirilebilir: eksctl
ve AWS CloudFormation.
EKS düğüm grubu oluşturma
Ardından, desteklenen bir Bölgede iki veya daha fazla trn1.32xlarge örneği içeren bir EKS düğüm grubu oluşturmamız gerekiyor. Eğitimde, AWS CloudFormation, Trainium'a özgü bir EC2 başlatma şablonu oluşturmak için kullanılırBu, Trn1 bulut sunucularının dağıtılmış eğitimi desteklemek için gereken uygun bir Amazon Makine Görüntüsü (AMI) ve doğru EFA ağ yapılandırması ile başlatılmasını sağlar. AMI ayrıca Trainium hızlandırıcı yongaları için destek sağlayan Neuron aygıt sürücüsünü de içerir. İle eksctl
Amazon EKS yönetim aracıyla, yeni oluşturulan başlatma şablonuna başvuran temel bir YAML bildirimini kullanarak kolayca bir Trainium düğüm grubu oluşturabilirsiniz. Örneğin:
Önceki bildirimde, EKS kümesinde Trn1 örneklerinin kullanımına izin verecek şekilde birkaç öznitelik yapılandırılmıştır. Öncelikle, metadata.region
Trn1 örneklerini destekleyen Bölgelerden birine ayarlanmıştır (şu anda us-east-1
ve us-west-2
). Ardından, erişilebilirlik bölgeleri için Amazon EKS, iki Erişilebilirlik Alanının belirtilmesini gerektirir. Bu Erişilebilirlik Alanlarından biri Trn1 bulut sunucularının kullanımını desteklemelidir, diğeri ise rastgele seçilebilir. Öğretici nasıl yapılacağını gösterir AWS hesabınızda hangi Erişilebilirlik Alanlarının Trn1 bulut sunucularına izin vereceğini belirleyin. Aynı Trn1 destekli Erişilebilirlik Alanı da şu şekilde belirtilmelidir: availabiltyZones
EKS düğüm grubuyla ilişkili öznitelik. efaEnabled
ayarlandı true
dağıtılmış eğitim için gerekli olan uygun EFA ağ yapılandırmasıyla düğümleri yapılandırmak için. Son olarak, launchTemplate.id
düğüm grubuyla ilişkili öznitelik, önceki bir adımda AWS CloudFormation aracılığıyla oluşturulan EC2 başlatma şablonuna işaret eder.
CloudFormation şablonunu zaten uyguladığınızı ve eksctl
yönetim aracı, aşağıdaki kodu çalıştırarak Trainium özellikli bir EKS düğüm grubu oluşturabilirsiniz:
Trainium ve EFA cihazları için Kubernetes eklentilerini kurun
Düğüm grubu oluşturulduktan sonraki adım, Trainium hızlandırıcıları (Neuron eklentisi aracılığıyla) ve EFA cihazları (EFA eklentisi aracılığıyla) için destek sağlayan Kubernetes eklentilerini kurmaktır. Bu eklentiler, standart kullanılarak kolayca kümeye kurulabilir. kubectl
eğitimde gösterildiği gibi yönetim aracı.
Dağıtılmış eğitim işlerini başlatmak üzere TorchX evrensel PyTorch başlatıcısını kullanmak için iki ön koşul gereklidir: Volcano toplu zamanlayıcı ve etcd sunucusu. Neuron ve EFA eklentileri gibi, kubectl
Volcano ve etcd sunucusunu EKS kümesine yüklemek için araç.
Paylaşılan depolamayı EKS kümesine ekleyin
Öğreticide, çeşitli EKS çalışan bölmeleri tarafından erişilebilen yüksek performanslı bir paylaşılan dosya sistemi sağlamak için Luster için FSx kullanılmıştır. Bu paylaşılan depolama alanı, eğitim veri kümesinin yanı sıra eğitim süreci sırasında oluşturulan tüm yapıtları ve günlükleri barındırmak için kullanılır. Öğretici, paylaşılan depolamanın nasıl oluşturulacağını ve kümeye nasıl ekleneceğini açıklar. Luster CSI sürücüsü için Amazon FSx.
Bir eğitim kapsayıcısı görüntüsü oluşturun
Ardından, herhangi bir bağımlılıkla birlikte PyTorch eğitim betiğini içeren bir eğitim kapsayıcı görüntüsü oluşturmamız gerekiyor. Öğreticide, yazılım bağımlılıklarıyla birlikte BERT ön eğitim betiğini içeren örnek bir Dockerfile yer almaktadır. Dockerfile, eğitim kapsayıcısı görüntüsünü oluşturmak için kullanılır ve ardından görüntü, kümede bir eğitim işi başlatıldığında PyTorch çalışanlarının görüntüyü çekebileceği bir ECR deposuna gönderilir.
Eğitim verilerini ayarlayın
Bir eğitim işini başlatmadan önce, eğitim verileri ilk olarak FSx for Lustre üzerindeki paylaşılan depolama birimine kopyalanır. Eğitim, paylaşılan depolama birimine erişimi olan geçici bir Kubernetes bölmesinin nasıl oluşturulacağını ana hatlarıyla belirtir ve standart Linux kabuk komutlarını kullanarak eğitim veri kümesini indirmek ve çıkarmak için bölmede nasıl oturum açılacağını gösterir.
Çeşitli altyapı ve yazılım önkoşulları yürürlükte olduğundan, artık çözümün Trainium yönlerine odaklanabiliriz.
Modelinizi önceden derleyin
Neuron SDK, adı verilen bir entegrasyon katmanı aracılığıyla PyTorch'u destekler. PyTorch Nöron. Varsayılan olarak PyTorch Neuron, bir eğitim işi içindeki çeşitli sinir ağı hesaplama grafiklerinin eğitim sürecinde karşılaşıldıkça derlendiği tam zamanında derleme ile çalışır. Daha büyük modeller için sağlananları kullanmak daha uygun olabilir. neuron_parallel_compile
eğitim zamanında grafik derlemesini önlemek için çeşitli hesaplama grafiklerini önceden derlemek ve önbelleğe almak için araç. Eğitim işini EKS kümesinde başlatmadan önce, öğretici, TorchX aracılığıyla bir ön derleme işinin ilk olarak nasıl başlatılacağını gösterir. neuron_parallel_compile
alet. Ön derleme işinin tamamlanmasının ardından, Neuron derleyicisi tüm nöral ağ hesaplama grafiklerini tanımlamış ve derlemiş olacak ve bunları gerçek BERT ön eğitim işi sırasında daha sonra kullanmak üzere paylaşılan depolama biriminde önbelleğe almış olacaktır.
Dağıtılmış eğitim işini başlatın
Ön derleme tamamlandıktan sonra TorchX, bulut sunucusu başına 64 çalışan olmak üzere iki trn1.32xlarge bulut sunucusunda 32 çalışanlı dağıtılmış bir eğitim işi başlatmak için kullanılır. Her trn32xlarge örneği 1.32 Trainium hızlandırıcısı içerdiğinden ve her hızlandırıcı 16 tane sağladığından, bulut sunucusu başına 2 çalışan kullanıyoruz. Nöron Çekirdekleri. Her NeuronCore'a benzersiz olarak erişilebilir PyTorch XLA cihazı eğitim komut dosyasında. Öğreticiden örnek bir TorchX başlatma komutu aşağıdaki koda benzer:
Önceki TorchX komutundaki çeşitli komut satırı argümanları, öğreticide ayrıntılı olarak açıklanmıştır. Ancak, eğitim işini yapılandırmada en önemli olan aşağıdaki argümanlardır:
- -cfg kuyruğu=deneme – Eğitim işi için kullanılacak Volcano sırasını belirtir
- -cfg resim_repo – TorchX kapsayıcı görüntüleri için kullanılacak ECR deposunu belirtir
- –script_args – PyTorch eğitim betiğine iletilmesi gereken argümanları belirtir
- –nnodes ve –nproc_per_node – Eğitim işi için kullanılacak örnek ve örnek başına çalışan sayısı
- -senaryo – Eğitim kapsayıcısı içinde başlatılacak PyTorch eğitim komut dosyasının adı
- –Görüntü – Amazon ECR'deki eğitim kapsayıcısı görüntüsüne giden yol
- –bf16 – BF16 veri türünün etkinleştirilip etkinleştirilmeyeceği
Eğitim işini izleyin
Eğitim işi başlatıldıktan sonra işin izlenebileceği çeşitli yollar vardır. Öğretici, kullanarak komut satırında temel eğitim betiği ölçümlerinin nasıl izleneceğini gösterir. kubectl
, TensorBoard'da eğitim betiği ilerlemesinin görsel olarak nasıl izleneceği (aşağıdaki ekran görüntüsüne bakın) ve Trainium hızlandırıcı kullanımının neuron-top
Neuron SDK'dan araç.
Ortamı temizleyin veya yeniden kullanın
Eğitim işi tamamlandığında, küme yeniden kullanılabilir veya ek eğitim işleri için yeniden yapılandırılabilir. Örneğin, EKS düğüm grubu kullanılarak hızla ölçeklendirilebilir. eksctl
Ek Trn1 örnekleri gerektiren eğitim işlerini desteklemek için komut. Benzer şekilde, sağlanan Dockerfile ve TorchX başlatma komutları, ek derin öğrenme modellerini ve eğitim topolojilerini dağıtmayı desteklemek için kolayca değiştirilebilir.
Küme artık gerekli değilse öğretici, EKS altyapısını ve ilgili kaynakları kaldırmak için gereken tüm adımları da içerir.
Sonuç
Bu gönderide, Trn1 bulut sunucularının ve Amazon EKS'nin derin öğrenme modellerinin yüksek performanslı, uygun maliyetli ve büyük ölçüde ölçeklenebilir dağıtılmış eğitimi için nasıl yönetilen bir platform sağladığını inceledik. Ayrıca, Trn1 bulut sunucuları kullanılarak Amazon EKS'de gerçek dünyada çok eşgörünümlü dağıtılmış bir eğitim işinin nasıl yürütüleceğini gösteren kapsamlı bir öğretici paylaştık ve çözümdeki birkaç temel adımı ve bileşeni vurguladık. Bu eğitici içerik, diğer modellere ve iş yüklerine kolayca uyarlanabilir ve size AWS'de derin öğrenme modellerinin dağıtılmış eğitimi için temel bir çözüm sağlar.
Trainium destekli Trn1 bulut sunucularını kullanmaya nasıl başlayacağınız hakkında daha fazla bilgi edinmek için bkz. Nöron belgeleri.
Yazarlar Hakkında
Scott Perry AWS'de Annapurna ML hızlandırıcı ekibinde bir Çözüm Mimarıdır. Kanada'da yerleşik olarak, müşterilerin AWS Inferentia ve AWS Trainium kullanarak derin öğrenme eğitimi ve çıkarım iş yüklerini devreye almasına ve optimize etmesine yardımcı oluyor. İlgi alanları arasında büyük dil modelleri, derin pekiştirmeli öğrenme, Nesnelerin İnterneti ve genomik yer alır.
Lorea Arrizabalaga Birleşik Krallık Kamu Sektörüne uyumlu bir Çözüm Mimarıdır ve müşterilerin Amazon SageMaker ile makine öğrenimi çözümleri tasarlamasına yardımcı olur. Ayrıca donanım hızlandırmaya adanmış Teknik Alan Topluluğunun bir parçasıdır ve AWS Inferentia ile AWS Trainium iş yüklerinin test edilmesi ve karşılaştırılmasına yardımcı olur.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/scaling-distributed-training-with-aws-trainium-and-amazon-eks/
- 1
- 100
- 11
- 2022
- 2023
- 7
- a
- Yapabilmek
- Hakkımızda
- hızlandırıcı
- hızlandırıcılar
- erişim
- erişilen
- elde
- karşısında
- aktif
- Ek
- ilerlemek
- ileri
- avantaj
- hizalı
- Türkiye
- zaten
- Rağmen
- Amazon
- Amazon EC2
- Amazon Adaçayı Yapıcı
- ve
- duyurmak
- açıkladı
- duyuru
- uygulamalı
- uygun
- mimari
- argümanlar
- yönleri
- ilişkili
- iliştirmek
- öznitelikleri
- kullanılabilirliği
- mevcut
- AWS
- AWS CloudFormation
- AWS Çıkarımları
- Bant genişliği
- merkezli
- temel
- Çünkü
- önce
- kıyaslama
- faydaları
- Milyar
- Çiçek açmak
- geniş
- inşa etmek
- Önbellek
- denilen
- Kanada
- cips
- Klinik
- seçilmiş
- bulut
- Küme
- kod
- Toplu
- gelecek
- Yakında
- ortak
- topluluk
- tamamlamak
- tamamlama
- bileşenler
- kapsamlı
- hesaplamak
- yapılandırma
- bağlı
- oluşan
- Konteyner
- Konteynerler
- içeren
- içerik
- kontrol
- Uygun
- çekirdek
- uygun maliyetli
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- Oluşturma
- oluşturma
- CSI
- Şu anda
- Müşteriler
- veri
- DDP
- adanmış
- derin
- derin öğrenme
- Varsayılan
- dağıtmak
- konuşlandırılmış
- tarif edilen
- Dizayn
- ayrıntı
- detaylı
- gelişmeler
- cihaz
- Cihaz
- direkt olarak
- keşif
- dağıtıldı
- dağıtılmış eğitim
- dağıtım
- indir
- sürücü
- sırasında
- her
- Daha erken
- Erken
- kullanım kolaylığı
- kolayca
- ya
- etkinleştirmek
- son uca
- Son nokta
- olmasını sağlar
- kuruluş
- Hatta
- örnek
- uyarılmış
- hariç
- var
- keşfedilmeyi
- çıkarmak
- kumaş
- Aşinalık
- alan
- fileto
- Ad
- Esneklik
- odak
- takip et
- takip etme
- iskelet
- itibaren
- tam
- işlevsellik
- genel
- genomik
- almak
- GitHub
- verilmiş
- grafik
- grafikler
- grup
- Rehberler
- Kolları
- donanım
- Network XNUMX'in Kalbi
- faydalı
- yardımcı olur
- Yüksek
- yüksek performans
- Vurgulanan
- büyük ölçüde
- ev sahibi
- Ne kadar
- Nasıl Yapılır
- Ancak
- HTML
- HTTPS
- Yüzlerce
- ID
- tespit
- görüntü
- görüntüleri
- ima edilen
- önemli
- in
- dahil
- dahil
- içerir
- Artırmak
- giderek
- Altyapı
- kurmak
- yüklü
- örnek
- bütünleşme
- ilgi alanları
- IOT
- IT
- İş
- Mesleki Öğretiler
- anahtar
- Nezaket.
- dil
- büyük
- büyük ölçekli
- büyük
- Geç
- başlatmak
- başlattı
- fırlatma
- tabaka
- ÖĞRENİN
- öğrenme
- Led
- kütüphaneler
- çizgi
- linux
- yük
- uzun
- Bakın
- GÖRÜNÜYOR
- makine
- makine öğrenme
- Ana
- yönetilen
- yönetim
- kitlesel
- Bellek
- Metadata
- Metrikleri
- ML
- modelleri
- değiştirilmiş
- modül
- izlemek
- izlenen
- izleme
- monitörler
- ay
- Daha
- çoğu
- çoklu
- isim
- gerek
- ağ
- ağ
- sinir ağı
- sonraki
- düğüm
- düğümler
- numara
- sunulan
- teklif
- resmi
- ONE
- faaliyet
- Operasyon
- optimize
- optimize
- orkestrasyon
- sipariş
- Diğer
- özetlenen
- ana hatlar
- tüm
- genel bakış
- parametreler
- Bölüm
- geçti
- yol
- armut
- performans
- faz
- yer
- platform
- Platon
- Plato Veri Zekası
- PlatoVeri
- fişe takmak
- eklentileri
- noktaları
- Çivi
- powered
- güçlü
- önkoşullar
- süreç
- Ilerleme
- sağlamak
- sağlanan
- sağlar
- sağlama
- halka açık
- Yayıncılık
- itti
- pytorch
- hızla
- rasgele
- Gerçek dünya
- referanslar
- bölge
- bölgeler
- ilgili
- Kaldır
- Depo
- gerektirir
- gereklidir
- gerektirir
- Kaynaklar
- yorum
- koşmak
- koşu
- sagemaker
- aynı
- ölçeklenebilirlik
- ölçeklenebilir
- terazi
- ölçekleme
- sdk
- sektör
- hizmet
- Hizmetler
- set
- birkaç
- Paylaşılan
- Kabuk
- meli
- gösterilen
- Gösteriler
- önemli
- benzer şekilde
- boyutları
- daha küçük
- So
- Yazılım
- çözüm
- Çözümler
- biraz
- Belirtilen
- yığın
- bağımsız
- standart
- başladı
- başlangıç
- adım
- Basamaklar
- Yine
- hafızası
- mağaza
- böyle
- destek
- destekli
- Destekler
- senkronizasyon
- sistem
- tablo
- alma
- takım
- Teknik
- şablon
- geçici
- Test yapmak
- The
- UK
- ve bazı Asya
- Binlerce
- İçinden
- boyunca
- zaman
- için
- araç
- araçlar
- Eğitim
- gerçek
- öğretici
- Uk
- benzersiz
- Evrensel
- kullanım
- kullanıcı
- çeşitli
- versiyon
- üzerinden
- hacim
- yolları
- Haftalar
- olup olmadığını
- hangi
- süre
- irade
- içinde
- işçi
- işçiler
- olur
- tatlım
- Sen
- zefirnet
- bölgeleri