banner

blog

Jul 07, 2023

Os proprietários da IA

Chris Sharp é CTO da Digital Realty

: Por que a modularidade será crítica para os data centers e a economia da IA

O surgimento repentino de IA comercial em grande escala no ano passado, especialmente novos aplicativos de IA generativos, como o ChatGPT, impôs um novo conjunto de requisitos técnicos às instalações do data center onde esses aplicativos residem. A infra-estrutura que os suporta consumirá mais energia, consumirá mais dados e utilizará mais largura de banda do que nunca, tudo dentro de instalações que podem ter sido construídas há 20 anos. Estas instalações precisam agora de se adaptar para suportar o que pode ser, em alguns casos, um aumento de ordem de grandeza no consumo de energia por rack.

Um artigo de sete partes sobre o que os grandes modelos de linguagem e o que a próxima onda de cargas de trabalho significa para computação, rede e design de data center

A única maneira de conseguir isso é com um design modular.

Os data centers podem parecer entidades altamente estáticas. Eles são normalmente enormes edifícios de tijolo e argamassa com fileiras e mais fileiras de geradores e outros equipamentos externos, todos projetados cuidadosamente para manter a instalação operando em tudo, desde condições típicas do dia-a-dia até um apagão total da rede elétrica, sem interrupção. No entanto, o data center moderno é tudo menos estático; muitas instalações são projetadas desde o início para serem altamente modulares, e um determinado piso do data center pode ser adaptado para mudanças na topologia da rede, considerações de fluxo de ar e redundância física várias vezes por ano, se necessário. O que impulsiona essa necessidade e como ela é atendida?

O surgimento generalizado de implantações de IA no data center mostra a rapidez com que os requisitos do cliente podem mudar. Embora apenas no ano passado um operador de centro de dados tenha sido capaz de planear um consumo médio de energia de 10 quilowatts por rack de equipamento do cliente, a necessidade de blocos cada vez maiores de racks de 25, 50 ou mesmo 100 quilowatts em diferentes locais desse a mesma instalação de data center está aqui e continuará a crescer. Com um design estático tradicional, isso pode criar muitos problemas em termos de desempenho, manutenção e redundância.

Em primeiro lugar, esses racks densos geralmente exigem mais largura de banda de rede para operar com o mais alto nível de eficiência. Isso geralmente é esquecido e um cliente ficará muito insatisfeito se implantar um rack tão denso (ou 10 ou 100 deles) e não conseguir obter a largura de banda necessária.

Em segundo lugar, um aumento desigual no consumo de energia em um data center pode muitas vezes sobrecarregar um sistema de resfriamento que não foi projetado para acomodar esses tipos de pontos quentes. Um rack denso em uma extremidade de uma fileira no data center pode facilmente levar ao aumento da temperatura na outra extremidade.

Finalmente, as medidas de resiliência e redundância baseiam-se na localização de cargas elétricas específicas na instalação e na forma como são distribuídas. Se um conjunto muito denso de equipamentos for adicionado a uma área, os projetos estáticos podem não ser capazes de garantir que ela seja coberta por uma capacidade de gerador confiável e suficiente.

Como você pode imaginar, para o cliente de IA, cada uma dessas preocupações é um problema significativo que vai desde a incapacidade de operar seu equipamento de IA em seu potencial máximo de desempenho até a possibilidade de incorrer em tempos de inatividade indesejados no caso de uma queda de energia ou outro estresse no rede elétrica local. Ao usar uma estrutura de design modular altamente adaptável, esses problemas podem ser resolvidos em data centers de qualquer idade.

Por um lado, os espaços podem ser reaproveitados ou projetados desde o início da instalação para serem usados ​​como salas de rede adicionais para permitir a instalação de mais circuitos de rede, switches e roteadores para aumentar a largura de banda da rede para o cliente ao longo do tempo. Além disso, um método modular de projeto e implantação de bandejas de cabos suspensas permite que o operador do data center leve fisicamente essa conectividade ao cliente, o que muitas vezes é esquecido em projetos estáticos e não flexíveis. Algumas tecnologias que permitem IA, como o InfiniBand, podem usar cabos grandes e pesados, que só podem ser instalados de forma viável de forma modular para evitar problemas reais de desempenho e operacionais no futuro.

COMPARTILHAR