Esta publicação apareceu inicialmente no .
Por alguns anos, o termo “nuvem privada” teve uma conotação negativa. Mas, como sabemos, a tecnologia é mais uma roda do que uma flecha, e bem na hora, a nuvem privada está recebendo muita atenção e é tudo positivo. As estatísticas são claras, a Pesquisa de Nuvem de Infraestrutura de 2023 da Forrester teve 79% dos 1.300 tomadores de decisão empresariais que responderam dizendo que estão implementando nuvens privadas. De acordo com um
A principal razão pela qual as empresas repatriam é o custo. Elas economizam até 70% ao repatriar. Isso foi provado publicamente por empresas tão diversas quanto
Esse modelo operacional define uma certa arquitetura e, repetidamente, essa arquitetura torna o data lake moderno possível. Há outras arquiteturas, com certeza, mas usar a nuvem privada para construir seu data lake moderno permite que as organizações paguem apenas pelo que precisam. Quando seus negócios crescem, o dimensionamento é tão simples quanto adicionar mais recursos a um cluster. Um redesenho não é necessário.
Um data lake moderno é metade data warehouse e metade data lake e usa armazenamento de objetos para tudo. A camada de armazenamento de objetos é definida por software, escalável, nativa da nuvem e de alto desempenho. O desempenho é ajustável por meio da seleção do
Usar o armazenamento de objetos com o data lake é padrão, usá-lo com o data warehouse é novo, possibilitado por Open Table Formats (OTFs) como Apache Iceberg, Apache Hudi e Delta Lake. Há detalhes consideráveis sobre essa arquitetura que estão além do escopo deste artigo. Para isso, recomendo a leitura do livro completo de Keith Pijanowski
Alto desempenho: Enquanto a nuvem privada pode ser projetada para capacidade, a nuvem privada moderna busca entregar desempenho em escala. Essa arquitetura prioriza ferramentas que enfatizam velocidade e eficiência. Como diz Jeff Bezos, quem quer pagar mais e esperar mais para obtê-lo? Os mesmos princípios se aplicam aqui: Quem quer mais devagar?
Computação e armazenamento desacoplados: desvincular esses componentes oferece maior flexibilidade e escalabilidade, permitindo que sua infraestrutura, serviços e ferramentas escolhidos se destaquem em suas respectivas áreas de especialização.
Padrões abertos: Padrões abertos não apenas incentivam a interoperabilidade, mas também protegem seus investimentos do futuro. Isso abrange não apenas soluções de código aberto, mas também formatos de tabela abertos, como exploraremos. Não crie uma nuvem privada com um dispositivo de armazenamento por esses motivos (e pelo fato de que eles nunca serão nativos da nuvem).
Compatibilidade com APIs RESTful: Interconectividade é essencial. Suas ferramentas devem compartilhar uma linguagem comum, com o S3 servindo como a língua franca para armazenamento em nuvem. Por esse motivo, não construa sua nuvem privada com uma solução centrada em POSIX, mesmo que ela alegue oferecer suporte ao S3. Vá com o negócio real.
Orientado por software/Infraestrutura como código: automatize e deixe o Kubernetes cuidar da orquestração da sua infraestrutura, permitindo que você abstraia as complexidades do gerenciamento manual e permita uma escalabilidade rápida e eficiente.
Segurança e conformidade aprimoradas: Como as nuvens privadas fornecem uma infraestrutura dedicada, elas oferecem maior controle sobre os dados e medidas de segurança aprimoradas. Isso é particularmente benéfico para setores que lidam com informações confidenciais, como finanças e assistência médica.
Conformidade regulatória: essa arquitetura pode dar suporte à conformidade regulatória fornecendo configurações de segurança personalizáveis e controles de auditoria para atender a padrões específicos do setor.
Colocando sua nuvem privada em jogo
Há uma série de abordagens que vimos para iluminar a nuvem privada. Todas elas podem funcionar; depende realmente da empresa e do caso de uso.
Abordagem híbrida com tempo limitado: a abordagem híbrida com tempo limitado essencialmente transforma a nuvem pública em armazenamento frio e constrói sua pegada de nuvem privada ao longo de algum período de tempo (meses/trimestres, não anos). Isso envolve comprar e configurar sua infraestrutura e pilha de software na nuvem privada. Então você aponta seu pipeline de dados para a nuvem privada, não para a nuvem pública. Pode haver algum período de tempo em que você pode fazer as duas coisas. O objetivo, no entanto, é usar a nuvem pública como armazenamento frio em camadas e a nuvem privada como armazenamento quente. Com o tempo, a nuvem pública passa de fria para congelada, enquanto a nuvem privada se torna o tipo de armazenamento primário e dominante.
Repatriação completa : há momentos em que manter os aplicativos e dados na nuvem pública e privada não é uma opção. Nesses casos, você precisa romper com seu provedor de nuvem. É difícil e, mesmo com a eliminação das taxas de saída, elas tornam isso doloroso (as letras miúdas basicamente dizem que tudo tem que ir para obter qualquer alívio na taxa de saída). É muito factível; só requer um pouco mais de planejamento e um pouco mais de atrito comercial. Nesse caso, provisione sua nuvem privada ou colo e pilha de aplicativos. Em seguida, faça backup do caminhão de dados ou alugue a rede para enviar os dados para sua infraestrutura de dados de nuvem privada. Neste ponto, você está livre, mas conte com pagar o dobro por um ou dois meses se você for do tipo cinto e suspensórios. Uma das principais empresas de streaming adotou essa abordagem quando deixou a nuvem pública. Ela empilhou meio exabyte para a nova nuvem privada, incluindo todos os filmes, programas, documentários, etc. O processo levou cerca de três trimestres. A recompensa foi enorme, no entanto, e a complexidade foi bastante reduzida para a equipe que gerencia o serviço. Eles também aproveitaram o benefício colateral de um belo pop em “
Nuvem privada Greenfield:
Esta é uma proposta bastante direta e geralmente envolve tudo novo. O projeto é novo, os dados no projeto serão novos (ou relativamente novos) ou gerados de alguma fonte que está ficando online (como uma fábrica gigante ou um novo serviço de vídeo sob demanda na nuvem). Aqui você dimensiona a carga de trabalho — você pode até testá-la na nuvem pública — mas a ideia é que ela seja, desde o início, executada na nuvem privada. Estamos vendo isso com bastante frequência com a infraestrutura de dados de IA. Os primeiros experimentos estão ocorrendo na nuvem pública. Os dados não são tão significativos. A disponibilidade da GPU é bastante boa. No entanto, a empresa sabe que a carga de trabalho precisa estar na nuvem privada para produção — tanto para escala, mas também para segurança, privacidade e controle. Uma das principais empresas automotivas do mundo recentemente mudou sua iniciativa de direção autônoma completa de um sistema baseado em regras para um baseado no comportamento de motoristas reais.
Nuvem privada Brownfield:
Seremos honestos aqui: vemos isso, mas não amamos. Isso inclui tentar executar cargas de trabalho de alto desempenho em unidades de disco rígido para colocar MinIO em camadas
Os outros:
Há dois outros cenários que são menos frequentes, mas devem estar na mistura de consideração. Um é a abordagem de burst híbrido e o outro é a abordagem de tabelas externas. Ambos estão relacionados à opção híbrida, mas podem não ter limite de tempo. Na abordagem de burst híbrido, você mantém uma nuvem privada enquanto a projeta para expandir perfeitamente, ou "burst", na nuvem pública para maior flexibilidade. Essa estratégia é frequentemente adotada para alavancar capacidade extra de GPU ou para usar serviços de nuvem específicos. Nesse modelo, certas tarefas são temporariamente transferidas para a nuvem pública para processamento. Uma vez concluída a análise, os resultados são enviados de volta para a nuvem privada, e os recursos da nuvem pública são então desativados. Temos um grande cliente de serviços financeiros fazendo isso com cálculos de risco de crédito e risco de mercado. Ele usa a nuvem pública para algumas operações de computação e a combina com um data lake de nuvem privada que usa MinIO e Dremio. A beleza do modelo operacional de nuvem é que a arquitetura deve dar suporte a operações em ambos os lugares. É, efetivamente, uma via de mão dupla.
Considerações finais e conselhos
Temos participado de muitas dessas repatriações/novas construções de nuvem privada ao longo dos anos. Uma coisa que surpreende as equipes é gerenciar o hardware novamente. Na nuvem, é transparente. Os engenheiros de DevOps e confiabilidade do site interagem apenas com a infraestrutura em um nível de API. Se uma VM estiver apresentando problemas, encerre e inicie uma nova em seu lugar. Infelizmente, na nova nuvem privada, em vez de apenas descartar o hardware e comprar um novo, temos que fazer o hardware existente funcionar.
A colocation fornece um meio termo entre a infraestrutura totalmente local e a nuvem pública, oferecendo os benefícios de ambos os mundos. Com acesso à rede de primeira linha e proximidade com os provedores de nuvem pública, as colocations facilitam conexões de baixa latência e configurações de nuvem híbrida, permitindo transferência e processamento de dados eficientes. Essa flexibilidade e o potencial para implantações de nuvem híbrida bem-sucedidas são cruciais para empresas que buscam otimizar suas operações e manter uma vantagem competitiva. Para saber mais sobre como isso funciona, confira nosso