AWS a mis au point un nouveau système rémunérateur : permettant aux clients désespérés de ressources GPU de payer pour les réserver à des dates et heures planifiées, payées d'avance et sans aucune modification de commande autorisée.
Le nouveau modèle de consommation est connu sous le nom d'Amazon Elastic Compute Cloud (EC2) Blocs de capacité pour le ML. Il permet aux clients d'accéder au calcul GPU très recherché afin d'exécuter de courtes charges de travail d'apprentissage automatique.
La croissance de la demande de capacité GPU pour former et inférer des modèles d’apprentissage automatique a dépassé l’offre à l’échelle du secteur, faisant des GPU une ressource rare.
Ce qu'AWS n'admet pas, bien sûr, c'est que cela est dû au fait que les hyperscalers sont en tête de file pour les GPU, accaparant l'offre, y compris AWS lui-même. Nvidia apparemment a déclaré que 22 % de son chiffre d'affaires civil au deuxième trimestre provenait d'un seul fournisseur de services cloud.
Les blocs de capacité EC2 sont initialement disponibles pour Amazon EC2 Instances de machines virtuelles P5, dont il n'existe actuellement qu'un seul type, le p5.48xlarge. Il comprend 192 processeurs virtuels, 2 To de mémoire système et huit GPU H100 de Nvidia, ce qui en fait une instance assez lourde.
Selon AWS, les réservations de blocs de capacité EC2 fonctionnent comme les réservations de chambres d'hôtel. Vous précisez la date, la durée et la taille de votre salle. De la même manière, AWS vous permet de sélectionner la date et la durée dont vous aurez besoin des instances GPU ainsi que le nombre d'instances requis.
Les clients peuvent réserver un bloc de capacité EC2 comprenant une seule instance, ou jusqu'à 64, et ceux-ci peuvent être réservés pour un à 14 jours selon les besoins. AWS permettra de les réserver jusqu'à huit semaines à l'avance, affirmant que les clients pourront alors planifier leurs déploiements d'apprentissage automatique avec certitude, sachant qu'ils disposeront de la capacité GPU lorsqu'ils en auront besoin.
AWS affirme que les prix des blocs de capacité EC2 sont dynamiques et dépendent des niveaux totaux d'offre et de demande disponibles au moment où le client achète. AWS affirme qu'il affichera l'offre la moins chère disponible qui correspond à la fourchette spécifiée par le client. UN capture d'écran sur le blog de l'entreprise montre un exemple d'une seule instance pour une seule journée coûtant 2,344 XNUMX $.
Mais voici le plus intéressant : le coût total d'un bloc de capacité EC2 est facturé à l'avance, facturé sur votre compte dans les 12 heures, et AWS ne permet pas de les modifier ou de les annuler après l'achat. Vous feriez donc mieux de vous assurer que vous avez réellement besoin de cette capacité GPU à ces dates.
Et une fois votre temps écoulé, votre charge de travail sera interrompue sans ménagement. EC2 émettra un événement via Amazon EventBridge pour alerter que la réservation se termine afin que l'utilisateur puisse vérifier la charge de travail. Les instances en cours d'exécution passeront à l'état d'arrêt 30 minutes avant la fin de la réservation, mais une fois le délai écoulé, toutes les instances encore en cours d'exécution seront arrêtées.
Les blocs de capacité EC2 sont disponibles dès maintenant, mais initialement uniquement dans la région AWS USA Est (Ohio). La disponibilité est prévue pour d'autres régions et zones locales à l'avenir, a indiqué AWS.
Le business du cloud revenus déclarés de 23 milliards de dollars pour le troisième trimestre de cette année, contre 3 milliards de dollars un an plus tôt, ce qui reflète la croissance continue du marché du cloud, mais à un rythme plus lent, les clients cherchant des moyens de maîtriser leurs dépenses. Comme les autres grands cloud, AWS considère la demande de services d’IA comme un moyen de lutter contre cette tendance. ®
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
- PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
- PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
- PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
- La source: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :possède
- :est
- :ne pas
- $UP
- 12
- 14
- 22
- 30
- a
- accès
- Compte
- Supplémentaire
- admettre
- avancer
- Après
- AI
- Services d'IA
- Alerte
- permettre
- permis
- Amazon
- Amazon EC2
- an
- ainsi que le
- tous
- SONT
- AS
- At
- disponibilité
- disponibles
- AWS
- BE
- car
- before
- Améliorée
- Big
- Milliards
- biz
- Block
- Blocs
- mais
- Buys
- by
- Calendrier
- CAN
- Compétences
- certitude
- accusé
- réclame
- prétentions
- le cloud
- CO
- lutter contre la
- comment
- Société
- comprenant
- calcul
- consommation
- a continué
- Prix
- Cours
- Lecture
- des clients
- Clients
- Date
- Dates
- journée
- jours
- Demande
- déploiements
- doesn
- entraîné
- durée
- Dynamic
- Plus tôt
- Est
- fin
- se termine
- événement
- exemple
- Fonctionnalités:
- Pour
- De
- avant
- avenir
- Go
- GPU
- GPU
- Croissance
- Vous avez
- ici
- très
- l'hôtel
- HEURES
- HTTPS
- in
- Y compris
- possible
- instance
- développement
- IT
- SES
- lui-même
- jpg
- juste
- connaissance
- connu
- apprentissage
- laisser
- Allons-y
- location
- niveaux
- comme
- locales
- click
- machine learning
- Fabrication
- Marché
- Se rencontre
- Mémoire
- Minutes
- modèle
- numériques jumeaux (digital twin models)
- modifié
- faire de l'argent
- Besoin
- Nouveauté
- aucune
- maintenant
- nombre
- Nvidia
- of
- offrant
- Ohio
- on
- une fois
- ONE
- uniquement
- or
- de commander
- Autre
- Rythme
- payé
- Payer
- pour cent
- plan
- prévu
- Platon
- Intelligence des données Platon
- PlatonDonnées
- assez
- Tarifs
- de voiture.
- achat
- Q2
- Q3
- gamme
- vraiment
- reflétant
- Remboursements
- région
- régions
- conditions
- réservation
- Réserver
- réservé
- ressource
- Resources
- de revenus
- Salle
- Courir
- pour le running
- s
- Saïd
- même
- dit
- Rare
- prévu
- programme
- Chercher
- voit
- service
- Prestataire de services
- Services
- Shorts
- montrer
- Spectacles
- unique
- Taille
- So
- spécifié
- Dépenses
- Région
- Encore
- la quantité
- Offre et la demande
- sûr
- combustion propre
- qui
- Les
- leur
- Les
- puis
- Là.
- Ces
- l'ont
- this
- cette année
- ceux
- Avec
- fiable
- fois
- à
- Total
- Train
- Trend
- type
- us
- Utilisateur
- Salle de conférence virtuelle
- machine virtuelle
- était
- Façon..
- façons
- Semaines
- quand
- qui
- sera
- comprenant
- dans les
- activités principales
- an
- Vous n'avez
- Votre
- zéphyrnet
- zones