Cet article a été initialement publié sur .
Pendant quelques années, le terme « cloud privé » avait une connotation négative. Mais comme nous le savons, la technologie est plus une roue qu'une flèche, et c'est exactement ce qui se passe : le cloud privé fait l'objet d'une attention considérable et tout cela est positif. Les statistiques sont claires : l'enquête 2023 de Forrester sur le cloud d'infrastructure a révélé que 79 % des 1 300 décideurs d'entreprise qui ont répondu ont déclaré qu'ils mettaient en œuvre des clouds privés.
La principale raison pour laquelle les entreprises rapatrient est le coût. Elles économisent jusqu'à 70 % en rapatriant. Cela a été prouvé publiquement par des entreprises aussi diverses que
Ce modèle d'exploitation définit une certaine architecture et, à maintes reprises, cette architecture rend possible le data lake moderne. Il existe bien sûr d'autres architectures, mais l'utilisation du cloud privé pour créer votre data lake moderne permet aux organisations de ne payer que pour ce dont elles ont besoin. Lorsque leur activité se développe, la mise à l'échelle est aussi simple que l'ajout de ressources supplémentaires à un cluster. Une refonte n'est pas nécessaire.
Un lac de données moderne est à moitié entrepôt de données et à moitié lac de données et utilise le stockage d'objets pour tout. La couche de stockage d'objets est définie par logiciel, évolutive, native du cloud et performante. Les performances sont réglables via la sélection de
L'utilisation du stockage d'objets avec le lac de données est standard, son utilisation avec l'entrepôt de données est nouvelle, rendue possible par les formats de table ouverts (OTF) comme Apache Iceberg, Apache Hudi et Delta Lake. Il existe de nombreux détails sur cette architecture qui dépassent le cadre de cet article. Pour cela, je vous recommande de lire l'intégralité de Keith Pijanowski
Hautes performances : alors que le cloud privé peut être conçu pour la capacité, le cloud privé moderne cherche à offrir des performances à grande échelle. Cette architecture privilégie les outils qui mettent l'accent sur la vitesse et l'efficacité. Comme le dit Jeff Bezos, qui veut payer plus et attendre plus longtemps pour l'obtenir ? Les mêmes principes s'appliquent ici : qui veut un cloud plus lent ?
Calcul et stockage découplés : la dissociation de ces composants offre une flexibilité et une évolutivité accrues, permettant à votre infrastructure, vos services et vos outils choisis d'exceller dans leurs domaines d'expertise respectifs.
Normes ouvertes : les normes ouvertes encouragent non seulement l'interopérabilité, mais elles assurent également la pérennité de vos investissements. Cela comprend non seulement les solutions open source, mais aussi les formats de table ouverts, comme nous le verrons. Ne créez pas de cloud privé avec un dispositif de stockage pour ces raisons (et parce qu'ils ne seront jamais natifs du cloud).
Compatibilité avec les API RESTful : l'interconnectivité est indispensable. Vos outils doivent partager un langage commun, S3 servant de lingua franca pour le stockage cloud. Pour cette raison, ne construisez pas votre cloud privé avec une solution centrée sur POSIX, même si elle prétend prendre en charge S3. Optez pour la vraie solution.
Piloté par logiciel/Infrastructure en tant que code : automatisez et laissez Kubernetes s'occuper d'orchestrer votre infrastructure, vous permettant ainsi d'abstraire les complexités de la gestion manuelle et d'assurer une évolutivité rapide et efficace.
Sécurité et conformité renforcées : les clouds privés offrent une infrastructure dédiée et un meilleur contrôle des données, ainsi que des mesures de sécurité renforcées. Cela est particulièrement avantageux pour les secteurs qui traitent des informations sensibles, comme la finance et la santé.
Conformité réglementaire : cette architecture peut prendre en charge la conformité réglementaire en fournissant des paramètres de sécurité personnalisables et des contrôles d'audit pour répondre à des normes sectorielles spécifiques.
Mettre votre cloud privé en jeu
Nous avons vu un certain nombre d'approches pour mettre en place un cloud privé. Toutes peuvent fonctionner. Cela dépend vraiment de l'entreprise et du cas d'utilisation.
Approche hybride à durée limitée : l'approche hybride à durée limitée transforme essentiellement le cloud public en stockage à froid et développe votre empreinte de cloud privé sur une certaine période (des mois/trimestres, pas des années). Cela implique l'achat et la configuration de votre infrastructure et de votre pile logicielle sur le cloud privé. Ensuite, vous orientez votre pipeline de données vers le cloud privé, et non vers le cloud public. Il peut y avoir une période pendant laquelle vous pouvez faire les deux. L'objectif, cependant, est d'utiliser le cloud public comme stockage à froid hiérarchisé et le cloud privé comme stockage à chaud. Au fil du temps, le cloud public passe du froid au gel tandis que le cloud privé devient le type de stockage principal et dominant.
Rapatriement complet : il y a des moments où conserver les applications et les données sur le cloud public et privé n’est pas une option. Dans ces cas-là, vous devez rompre avec votre fournisseur de cloud. C’est difficile, et même avec l’élimination des frais de sortie, ils rendent la situation pénible (les petits caractères indiquent essentiellement que tout doit disparaître pour obtenir un allègement des frais de sortie). C’est tout à fait faisable ; cela demande juste un peu plus de planification et un peu plus de frictions commerciales. Dans ce cas, provisionnez votre cloud colo ou privé et votre pile d’applications. Ensuite, sauvegardez le camion de données ou louez le réseau pour acheminer les données vers votre infrastructure de données de cloud privé. À ce stade, vous êtes libre, mais comptez payer le double pendant un mois ou deux si vous êtes du genre ceinture et bretelles. L’une des principales sociétés de streaming a adopté cette approche lorsqu’elle a quitté le cloud public. Elle a transféré un demi-exaoctet dans le nouveau cloud privé, y compris tous les films, émissions, documentaires, etc. Le processus a pris environ les trois quarts. Le gain a cependant été énorme et la complexité a été considérablement réduite pour l’équipe qui gère le service. Ils ont également profité de l'avantage supplémentaire d'un joli pop dans «
Cloud privé Greenfield :
Il s’agit d’une proposition assez simple et elle implique généralement tout ce qui est nouveau. Le projet est nouveau, les données du projet seront nouvelles (ou presque) ou générées à partir d’une source qui arrive en ligne (comme une usine de fabrication géante ou un nouveau service de vidéo à la demande dans le cloud). Ici, vous dimensionnez la charge de travail — vous pouvez même la tester sur le cloud public — mais l’idée est qu’elle s’exécutera, dès le départ, sur le cloud privé. Nous le voyons assez fréquemment avec l’infrastructure de données d’IA. Les premières expériences se déroulent dans le cloud public. Les données ne sont pas si importantes. La disponibilité du GPU est assez bonne. Néanmoins, l’entreprise sait que la charge de travail doit être sur le cloud privé pour la production — à la fois pour l’échelle, mais aussi pour la sécurité, la confidentialité et le contrôle. L’un des principaux constructeurs automobiles au monde a récemment fait pivoter son initiative de conduite entièrement autonome d’un système basé sur des règles vers un système basé sur le comportement des conducteurs réels.
Cloud privé Brownfield :
Soyons honnêtes : nous voyons cela, mais nous n'aimons pas ça. Cela inclut essayer d'exécuter des charges de travail hautes performances sur des disques durs pour superposer MinIO
Les autres :
Il existe deux autres scénarios moins fréquents, mais qui devraient être pris en compte. L’un est l’approche hybride en mode rafale et l’autre l’approche des tables externes. Les deux sont liées à l’option hybride, mais peuvent ne pas être limitées dans le temps. Dans l’approche hybride en mode rafale, vous maintenez un cloud privé tout en le concevant pour qu’il s’étende de manière transparente, ou « éclate », dans le cloud public pour plus de flexibilité. Cette stratégie est souvent adoptée pour tirer parti de la capacité GPU supplémentaire ou pour utiliser des services cloud spécifiques. Dans ce modèle, certaines tâches sont temporairement transférées vers le cloud public pour traitement. Une fois l’analyse terminée, les résultats sont renvoyés vers le cloud privé, et les ressources du cloud public sont ensuite mises hors service. Nous avons un client majeur du secteur des services financiers qui effectue ces calculs de risque de crédit et de risque de marché. Il utilise le cloud public pour certaines opérations de calcul et le combine avec un lac de données de cloud privé qui utilise MinIO et Dremio. La beauté du modèle d’exploitation cloud est que l’architecture doit prendre en charge les opérations dans les deux endroits. Il s’agit en fait d’une voie à double sens.
Réflexions finales et conseils
Nous avons été témoins de nombreux rapatriements/nouvelles versions de cloud privé au fil des ans. Une chose qui surprend les équipes est la nécessité de gérer à nouveau le matériel. Dans le cloud, c'est transparent. Les ingénieurs DevOps et de fiabilité du site n'interagissent avec l'infrastructure qu'au niveau de l'API. Si une machine virtuelle ne fonctionne pas correctement, nous la fermons et en la remplaçons par une nouvelle. Malheureusement, dans le nouveau cloud privé, plutôt que de simplement mettre au rebut le matériel et d'en acheter un nouveau, nous devons faire fonctionner le matériel existant.
La colocation offre un compromis entre une infrastructure entièrement sur site et le cloud public, offrant les avantages des deux mondes. Avec un accès à un réseau de premier ordre et une proximité avec les fournisseurs de cloud public, les colocations facilitent les connexions à faible latence et les configurations de cloud hybride, permettant un transfert et un traitement efficaces des données. Cette flexibilité et ce potentiel de déploiement réussi de cloud hybride sont essentiels pour les entreprises qui souhaitent optimiser leurs opérations et conserver un avantage concurrentiel. Pour en savoir plus sur le fonctionnement de ce système, consultez notre