Bài viết này ban đầu xuất hiện trên .
Trong vài năm, thuật ngữ “private cloud” có hàm ý tiêu cực. Nhưng như chúng ta đã biết, công nghệ giống bánh xe hơn là mũi tên, và đúng như dự đoán, private cloud đang nhận được rất nhiều sự chú ý và tất cả đều tích cực. Số liệu thống kê rất rõ ràng, Khảo sát về cơ sở hạ tầng đám mây năm 2023 của Forrester có 79% trong số 1.300 người ra quyết định doanh nghiệp trả lời rằng họ đang triển khai private cloud. Theo một
Lý do chính khiến các công ty hồi hương là chi phí. Họ tiết kiệm được tới 70% khi hồi hương. Điều này đã được chứng minh công khai bởi các công ty đa dạng như
Mô hình hoạt động đó xác định một kiến trúc nhất định và kiến trúc đó liên tục giúp hồ dữ liệu hiện đại trở nên khả thi. Chắc chắn là có những kiến trúc khác, nhưng sử dụng đám mây riêng để xây dựng hồ dữ liệu hiện đại cho phép các tổ chức chỉ phải trả tiền cho những gì họ cần. Khi doanh nghiệp của họ phát triển, việc mở rộng quy mô chỉ đơn giản là thêm nhiều tài nguyên hơn vào một cụm. Không cần thiết kế lại.
Hồ dữ liệu hiện đại là một nửa là kho dữ liệu và một nửa là hồ dữ liệu và sử dụng lưu trữ đối tượng cho mọi thứ. Lớp lưu trữ đối tượng được xác định bằng phần mềm, có thể mở rộng, gốc đám mây và có hiệu suất cao. Hiệu suất có thể điều chỉnh thông qua việc lựa chọn
Sử dụng lưu trữ đối tượng với data lake là chuẩn, sử dụng nó với data warehouse là mới, được thực hiện nhờ Open Table Formats (OTF) như Apache Iceberg, Apache Hudi và Delta Lake. Có nhiều chi tiết đáng kể về kiến trúc này nằm ngoài phạm vi của bài viết này. Đối với điều đó, tôi khuyên bạn nên đọc toàn bộ Keith Pijanowski
Hiệu suất cao: Trong khi đám mây riêng có thể được thiết kế để tăng dung lượng, đám mây riêng hiện đại hướng đến việc cung cấp hiệu suất ở quy mô lớn. Kiến trúc này ưu tiên các công cụ nhấn mạnh vào tốc độ và hiệu quả. Như Jeff Bezos đã nói, ai muốn trả nhiều tiền hơn và chờ đợi lâu hơn để có được nó? Các nguyên tắc tương tự cũng áp dụng ở đây: Ai muốn nó chậm hơn?
Tính toán và lưu trữ tách biệt: Việc tách rời các thành phần này mang lại tính linh hoạt và khả năng mở rộng cao hơn, cho phép cơ sở hạ tầng, dịch vụ và công cụ bạn chọn phát huy tối đa trong các lĩnh vực chuyên môn tương ứng.
Tiêu chuẩn mở: Tiêu chuẩn mở không chỉ khuyến khích khả năng tương tác mà còn bảo vệ khoản đầu tư của bạn trong tương lai. Điều này bao gồm không chỉ các giải pháp nguồn mở mà còn cả các định dạng bảng mở mà chúng ta sẽ khám phá. Đừng xây dựng một đám mây riêng với thiết bị lưu trữ vì những lý do này (và thực tế là chúng sẽ không bao giờ là đám mây gốc).
Khả năng tương thích với API RESTful: Khả năng kết nối là điều bắt buộc. Các công cụ của bạn nên chia sẻ một ngôn ngữ chung, với S3 đóng vai trò là ngôn ngữ chung cho lưu trữ đám mây. Vì lý do này, đừng xây dựng đám mây riêng của bạn bằng giải pháp tập trung vào POSIX, ngay cả khi nó tuyên bố hỗ trợ S3. Hãy sử dụng giải pháp thực sự.
Phần mềm điều khiển/Cơ sở hạ tầng dưới dạng mã: Tự động hóa và để Kubernetes đảm nhiệm việc sắp xếp cơ sở hạ tầng của bạn, giúp bạn loại bỏ sự phức tạp của việc quản lý thủ công và cho phép mở rộng nhanh chóng và hiệu quả.
Tăng cường bảo mật và tuân thủ: Vì đám mây riêng cung cấp cơ sở hạ tầng chuyên dụng nên chúng cung cấp khả năng kiểm soát dữ liệu tốt hơn và các biện pháp bảo mật nâng cao. Điều này đặc biệt có lợi cho các ngành xử lý thông tin nhạy cảm, chẳng hạn như tài chính và chăm sóc sức khỏe.
Tuân thủ quy định: Kiến trúc này có thể hỗ trợ tuân thủ quy định bằng cách cung cấp các thiết lập bảo mật có thể tùy chỉnh và kiểm soát kiểm toán để đáp ứng các tiêu chuẩn cụ thể của ngành.
Đưa Đám mây riêng của bạn vào hoạt động
Có một số cách tiếp cận mà chúng tôi đã thấy để thắp sáng đám mây riêng. Tất cả chúng đều có thể hoạt động; điều đó thực sự phụ thuộc vào doanh nghiệp và trường hợp sử dụng.
Phương pháp lai giới hạn thời gian: Phương pháp lai giới hạn thời gian về cơ bản biến đám mây công cộng thành kho lưu trữ lạnh và xây dựng dấu chân đám mây riêng của bạn trong một khoảng thời gian nhất định (tháng/quý, không phải năm). Điều này liên quan đến việc mua và cấu hình cơ sở hạ tầng và ngăn xếp phần mềm của bạn trên đám mây riêng. Sau đó, bạn hướng đường ống dữ liệu của mình vào đám mây riêng, không phải đám mây công cộng. Có thể có một khoảng thời gian mà bạn có thể thực hiện cả hai. Tuy nhiên, mục tiêu là sử dụng đám mây công cộng làm kho lưu trữ lạnh theo tầng và đám mây riêng làm kho lưu trữ nóng. Theo thời gian, đám mây công cộng chuyển từ lạnh sang đông lạnh trong khi đám mây riêng trở thành loại lưu trữ chính và chiếm ưu thế.
Hoàn trả hoàn toàn : Có những lúc việc giữ lại các ứng dụng và dữ liệu trên cả đám mây công cộng và riêng tư không phải là một lựa chọn. Trong những trường hợp này, bạn cần phải chia tay với nhà cung cấp đám mây của mình. Thật khó khăn và ngay cả khi loại bỏ phí thoát, họ vẫn khiến bạn đau đớn (về cơ bản, bản in nhỏ nói rằng mọi thứ phải biến mất để được giảm phí thoát). Điều này rất khả thi; chỉ cần lập kế hoạch nhiều hơn một chút và thêm một chút ma sát trong kinh doanh. Trong trường hợp này, hãy cung cấp colo hoặc đám mây riêng tư và ngăn xếp ứng dụng của bạn. Sau đó, sao lưu xe tải dữ liệu hoặc cho thuê mạng để chuyển dữ liệu ra cơ sở hạ tầng dữ liệu đám mây riêng tư của bạn. Tại thời điểm này, bạn đã rảnh, nhưng hãy tính đến việc phải trả gấp đôi trong một hoặc hai tháng nếu bạn là người thích thắt lưng và dây đeo. Một trong những công ty phát trực tuyến hàng đầu đã áp dụng cách tiếp cận này khi rời khỏi đám mây công cộng. Công ty đã chuyển một nửa exabyte vào đám mây riêng tư mới, bao gồm tất cả các bộ phim, chương trình, phim tài liệu, v.v. Quá trình này mất khoảng ba phần tư. Tuy nhiên, lợi nhuận thu được rất lớn và sự phức tạp đã giảm đáng kể đối với nhóm quản lý dịch vụ. Họ cũng thích lợi ích phụ của một pop-in đẹp "
Đám mây riêng Greenfield:
Đây là một đề xuất khá đơn giản và nó thường liên quan đến mọi thứ mới. Dự án mới, dữ liệu về dự án sẽ mới (hoặc khá mới) hoặc được tạo từ một số nguồn đang trực tuyến (như một nhà máy chế tạo khổng lồ hoặc dịch vụ video theo yêu cầu đám mây mới). Ở đây, bạn định cỡ khối lượng công việc — bạn thậm chí có thể thử nghiệm nó trên đám mây công cộng — nhưng ý tưởng là nó sẽ, ngay từ đầu, chạy trên đám mây riêng. Chúng ta thấy điều này khá thường xuyên với cơ sở hạ tầng dữ liệu AI. Các thử nghiệm ban đầu đang diễn ra trên đám mây công cộng. Dữ liệu không quá quan trọng. Tính khả dụng của GPU khá tốt. Tuy nhiên, doanh nghiệp biết rằng khối lượng công việc cần phải nằm trên đám mây riêng để sản xuất — cả về quy mô, mà còn về bảo mật, quyền riêng tư và khả năng kiểm soát. Một trong những công ty ô tô hàng đầu thế giới gần đây đã chuyển hướng sáng kiến tự lái hoàn toàn của mình từ hệ thống dựa trên quy tắc sang hệ thống dựa trên hành vi của người lái xe thực tế.
Đám mây riêng Brownfield:
Chúng tôi sẽ thành thật ở đây: Chúng tôi thấy điều này, nhưng chúng tôi không thích nó. Điều này bao gồm việc cố gắng chạy khối lượng công việc hiệu suất cao trên ổ đĩa cứng để xếp lớp MinIO trên
Những người khác:
Có hai kịch bản khác ít xảy ra hơn nhưng nên được cân nhắc. Một là phương pháp tiếp cận bùng nổ kết hợp và phương pháp còn lại là phương pháp tiếp cận bảng bên ngoài. Cả hai đều liên quan đến tùy chọn kết hợp, nhưng có thể không bị giới hạn thời gian. Trong phương pháp bùng nổ kết hợp, bạn duy trì một đám mây riêng trong khi thiết kế để mở rộng liền mạch hoặc "bùng nổ" vào đám mây công cộng để tăng thêm tính linh hoạt. Chiến lược này thường được áp dụng để tận dụng thêm dung lượng GPU hoặc sử dụng các dịch vụ đám mây cụ thể. Trong mô hình này, một số tác vụ nhất định được chuyển tạm thời sang đám mây công cộng để xử lý. Sau khi phân tích hoàn tất, kết quả được gửi lại đám mây riêng và sau đó các tài nguyên đám mây công cộng sẽ bị ngừng hoạt động. Chúng tôi có một khách hàng dịch vụ tài chính lớn đang thực hiện điều này với các tính toán rủi ro tín dụng và rủi ro thị trường. Khách hàng này sử dụng đám mây công cộng cho một số hoạt động tính toán và kết hợp với hồ dữ liệu đám mây riêng sử dụng MinIO và Dremio. Điểm hấp dẫn của mô hình vận hành đám mây là kiến trúc phải hỗ trợ các hoạt động ở cả hai nơi. Về cơ bản, đây là một con đường hai chiều.
Suy nghĩ và lời khuyên cuối cùng
Chúng tôi đã tham gia rất nhiều vào quá trình hồi hương/xây dựng mới đám mây riêng trong nhiều năm qua. Một điều khiến các nhóm ngạc nhiên là việc quản lý lại phần cứng. Trong đám mây, điều này là minh bạch. Các kỹ sư DevOps và độ tin cậy của trang web chỉ tương tác với cơ sở hạ tầng ở cấp độ API. Nếu một VM hoạt động không bình thường, hãy chấm dứt và khởi chạy một VM mới thay thế. Thật không may, trong đám mây riêng mới, thay vì chỉ loại bỏ phần cứng và mua mới, chúng ta phải làm cho phần cứng hiện có hoạt động.
Colocation cung cấp một nền tảng trung gian giữa cơ sở hạ tầng tại chỗ hoàn toàn và đám mây công cộng, mang lại lợi ích của cả hai thế giới. Với quyền truy cập vào mạng lưới hàng đầu và vị trí gần với các nhà cung cấp đám mây công cộng, colos tạo điều kiện cho các kết nối có độ trễ thấp và thiết lập đám mây lai, cho phép truyền và xử lý dữ liệu hiệu quả. Tính linh hoạt này và tiềm năng triển khai đám mây lai thành công là rất quan trọng đối với các doanh nghiệp muốn tối ưu hóa hoạt động của mình và duy trì lợi thế cạnh tranh. Để tìm hiểu thêm về cách thức hoạt động của điều này, hãy xem