A AWS criou um novo esquema para ganhar dinheiro – permitindo que clientes desesperados por recursos de GPU paguem para reservá-los para datas e horários programados, pagos antecipadamente e sem permissão de modificação de pedido.
O novo modelo de consumo é conhecido como Amazon Elastic Compute Cloud (EC2) Blocos de capacidade para ML. Ele permite que os clientes acessem a computação de GPU altamente procurada para executar cargas de trabalho curtas de aprendizado de máquina.
O crescimento na demanda por capacidade de GPU para treinar e inferir modelos de aprendizado de máquina ultrapassou a oferta em todo o setor, tornando as GPUs um recurso escasso.
O que a AWS não admite, é claro, é que isso ocorre porque os hiperescaladores estão na frente da fila de GPUs, absorvendo o fornecimento, incluindo a própria AWS. Nvidia alegadamente disse que 22 por cento de sua receita do segundo trimestre foi gerada por um único provedor de serviços em nuvem.
Os blocos de capacidade EC2 estão inicialmente disponíveis para Amazon EC2 Instâncias de máquinas virtuais P5, do qual existe atualmente apenas um tipo, o p5.48xlarge. Ele possui 192 vCPUs, 2 TB de memória de sistema e oito GPUs H100 da Nvidia, tornando-o uma instância bastante robusta.
De acordo com a AWS, as reservas do EC2 Capacity Block funcionam como reservas de quartos de hotel. Você especifica a data, a duração e o tamanho da sua sala. Da mesma forma, a AWS permite que você selecione a data e a duração em que precisará das instâncias de GPU e o número de instâncias necessárias.
Os clientes podem reservar um bloco de capacidade EC2 compreendendo apenas uma instância, ou até 64, e estes podem ser reservados por um a 14 dias, conforme necessário. A AWS permitirá que eles sejam reservados com até oito semanas de antecedência, alegando que os clientes poderão planejar suas implantações de aprendizado de máquina com certeza, sabendo que terão capacidade de GPU quando precisarem.
A AWS afirma que os preços do bloco de capacidade EC2 são dinâmicos e dependem dos níveis totais disponíveis de oferta e demanda no momento da compra do cliente. A AWS afirma que mostrará a oferta de preço mais baixo disponível que atenda à faixa especificada pelo cliente. A captura de tela no blog da empresa mostra um exemplo de uma única instância para um único dia custando US$ 2,344.
Mas aqui está o problema: o custo total de um bloco de capacidade EC2 é cobrado antecipadamente, cobrado em sua conta dentro de 12 horas, e a AWS não permite que eles sejam modificados ou cancelados após a compra. Portanto, é melhor você ter certeza de que realmente precisa dessa capacidade de GPU nessas datas.
E quando seu tempo acabar, sua carga de trabalho será interrompida sem cerimônia. O EC2 emitirá um evento por meio do Amazon EventBridge para alertar que a reserva está terminando para que o usuário possa verificar a carga de trabalho. As instâncias em execução entrarão em estado de desligamento 30 minutos antes do término da reserva, mas quando o tempo expirar, todas as instâncias ainda em execução serão encerradas.
Os blocos de capacidade EC2 já estão disponíveis, mas inicialmente apenas na região Leste dos EUA (Ohio) da AWS. A disponibilidade está planejada para regiões e zonas locais adicionais no futuro, disse a AWS.
O negócio da nuvem receita relatada de US$ 23 bilhões no terceiro trimestre deste ano, acima dos US$ 3 bilhões do ano anterior, refletindo o crescimento contínuo do mercado de nuvem, mas em um ritmo mais lento, à medida que os clientes buscam maneiras de controlar os gastos. Assim como as outras grandes nuvens, a AWS vê a demanda por serviços de IA como uma forma de combater essa tendência. ®
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://go.theregister.com/feed/www.theregister.com/2023/11/01/aws_reserve_gpu_time/
- :tem
- :é
- :não
- $UP
- 12
- 14
- 22
- 30
- a
- Acesso
- Conta
- Adicional
- Admitem
- avançar
- Depois de
- AI
- Serviços de IA
- Alertar
- permitir
- permitidas
- Amazon
- Amazon EC2
- an
- e
- qualquer
- SOMOS
- AS
- At
- disponibilidade
- disponível
- AWS
- BE
- Porque
- antes
- Melhor
- Grande
- bilhão
- biz
- Bloquear
- Blocos
- mas a
- Compra
- by
- Calendário
- CAN
- Capacidade
- certeza
- carregada
- reivindicando
- reivindicações
- Na nuvem
- CO
- combater
- como
- Empresa
- composta
- Computar
- consumo
- continuou
- Custo
- Para
- Atualmente
- cliente
- Clientes
- Data
- Datas
- dia
- dias
- Demanda
- Implantações
- parece
- não
- dirigido
- duração
- dinâmico
- Mais cedo
- Leste
- fim
- termina
- Evento
- exemplo
- Funcionalidades
- Escolha
- da
- frente
- futuro
- Go
- GPU
- GPUs
- Growth
- Ter
- SUA PARTICIPAÇÃO FAZ A DIFERENÇA
- altamente
- hotel
- HORÁRIO
- HTTPS
- in
- Incluindo
- inicialmente
- instância
- para dentro
- IT
- ESTÁ
- se
- jpg
- apenas por
- Conhecimento
- conhecido
- aprendizagem
- deixar
- Permite
- de locação
- níveis
- como
- local
- máquina
- aprendizado de máquina
- Fazendo
- mercado
- atende
- Memória
- Minutos
- modelo
- modelos
- modificada
- fazer dinheiro
- você merece...
- Novo
- não
- agora
- número
- Nvidia
- of
- oferecendo treinamento para distância
- Ohio
- on
- uma vez
- ONE
- só
- or
- ordem
- Outros
- Paz
- pago
- Pagar
- por cento
- plano
- planejado
- platão
- Inteligência de Dados Platão
- PlatãoData
- bastante
- Valores
- provedor
- compra
- Q2
- Q3
- alcance
- clientes
- refletindo
- Reembolsos
- região
- regiões
- requeridos
- reserva
- Reservar
- reservado
- recurso
- Recursos
- receita
- Quarto
- Execute
- corrida
- s
- Dito
- mesmo
- diz
- Escasso
- programado
- esquema
- Buscar
- vê
- serviço
- Provedor de Serviço
- Serviços
- Baixo
- mostrar
- Shows
- solteiro
- Tamanho
- So
- especificada
- Passar
- Estado
- Ainda
- supply
- Oferta e procura
- certo
- .
- que
- A
- deles
- Eles
- então
- Lá.
- Este
- deles
- isto
- este ano
- aqueles
- Através da
- tempo
- vezes
- para
- Total
- Trem
- Trend
- tipo
- us
- Utilizador
- Virtual
- máquina virtual
- foi
- Caminho..
- maneiras
- semanas
- quando
- qual
- precisarão
- de
- dentro
- Atividades:
- ano
- Vocês
- investimentos
- zefirnet
- zonas