Backup & DR (Disaster Recovery) là giải pháp toàn diện giúp doanh nghiệp thiết lập cơ chế sao lưu định kỳ, đồng bộ thời gian thực và khôi phục hệ thống khi xảy ra sự cố mất mát dữ liệu, lỗi phần mềm, phần cứng, hoặc thảm họa thiên tai.

Trên VNPT Cloud, giải pháp tích hợp các công nghệ snapshot, block-level replication, file-level backup, replication đa vùng (multi-region), chống ransomware bằng backup bất biến (immutable), và hỗ trợ cả mô hình DR theo ứng dụng hoặc toàn hệ thống. Doanh nghiệp có thể thiết lập RTO/RPO linh hoạt, đáp ứng theo yêu cầu nghiệp vụ cụ thể.

Giải pháp hỗ trợ cả hệ thống vật lý (on-prem), VM, container, database (MySQL, PostgreSQL, SQL Server), file server hoặc ứng dụng SaaS. Ngoài ra, có thể tích hợp các công cụ như Veeam, Velero, rsync, hoặc sử dụng API tự động hóa quy trình backup – restore theo lịch biểu hoặc sự kiện.

Với kiến trúc linh hoạt, người dùng có thể lựa chọn giữa backup nội vùng, liên vùng hoặc hybrid để phù hợp với ngân sách và yêu cầu khắt khe về tuân thủ dữ liệu. Giải pháp cũng cho phép kiểm thử DR định kỳ (DR drill) và cung cấp dashboard giám sát toàn trình.

Tại sao nên sử dụng Giải pháp Backup & DR

Bảo vệ dữ liệu và đảm bảo hệ thống hoạt động liên tục, dù trong điều kiện rủi ro cao nhất

Sao lưu dữ liệu theo thời gian thực hoặc theo lịch

Cho phép cấu hình backup định kỳ theo ngày/giờ hoặc sử dụng snapshot để đồng bộ tức thời, giúp dữ liệu luôn được cập nhật và sẵn sàng khôi phục

Hỗ trợ đa cấp độ: file, VM, database, container

Giải pháp tương thích với nhiều loại workload, từ file server, máy chủ ảo, hệ thống quản trị cơ sở dữ liệu đến container – giúp bảo vệ toàn diện

Khôi phục nhanh với RTO linh hoạt theo ứng dụng

Doanh nghiệp có thể thiết lập RTO ở mức phút cho ứng dụng quan trọng, hoặc mức giờ cho các dịch vụ hỗ trợ, đảm bảo tính liên tục theo mức độ ưu tiên

Bảo vệ chống ransomware với backup bất biến

Tích hợp cơ chế immutable backup, cho phép lưu trữ bản sao không thể ghi đè, ngăn mã độc mã hóa dữ liệu sao lưu hoặc xoá bản sao khôi phục

Replication dữ liệu giữa các vùng cloud hoặc hybrid

Hỗ trợ sao lưu liên vùng (cross-region), đa đám mây (multi-cloud), hoặc từ on-premises lên cloud, đáp ứng yêu cầu về chủ quyền và an toàn dữ liệu

Tự động kiểm thử kịch bản khôi phục (DR Drill)

Cho phép lên lịch kiểm thử DR tự động, ghi log toàn bộ quy trình và xác minh khả năng khôi phục để đáp ứng kiểm toán hoặc tiêu chuẩn ISO, PCI

Tích hợp công cụ backup quen thuộc, API mở rộng

Hỗ trợ tích hợp Veeam, Velero, rsync, CLI và API mở để tùy biến pipeline backup theo hệ thống doanh nghiệp hiện tại mà không thay đổi hạ tầng.

Giảm thiểu chi phí đầu tư hệ thống DR riêng biệt

Doanh nghiệp không cần đầu tư site vật lý thứ hai, vẫn có thể khôi phục dịch vụ từ cloud khi có sự cố, tiết kiệm chi phí đáng kể cho DR truyền thống

05 Tình huống giải pháp Security

Khôi phục hệ thống sau tấn công ransomware bằng backup bất biến

Bối cảnh kỹ thuật
Một công ty logistics sử dụng máy chủ VM nội bộ để lưu trữ đơn hàng và lịch trình vận chuyển. Sau sự cố bị tấn công bởi ransomware LockBit, toàn bộ ổ đĩa máy chủ bị mã hóa, gây ngừng hoạt động gần 2 ngày. Trước đó, hệ thống chưa có giải pháp DR thực sự và backup cũ đã bị hacker xóa sạch.

Giải pháp kỹ thuật đề xuất
Triển khai giải pháp immutable backup trên VNPT Cloud với chính sách lưu trữ dữ liệu không thể chỉnh sửa hoặc xóa trong thời gian chỉ định. Sử dụng snapshot cấp block-level định kỳ mỗi 4 giờ cho toàn bộ VM quan trọng, lưu trữ tại một VPC riêng biệt, không public, chỉ có quyền ghi một chiều từ hệ thống gốc.

Để tăng khả năng phục hồi, bản sao snapshot được replicate sang một vùng khác (cross-region) với thiết lập thời gian giữ backup tối thiểu 30 ngày. Hệ thống phát hiện tấn công ransomware bằng agent hành vi trên máy chủ, cảnh báo khi tiến trình bất thường sử dụng CPU cao bất thường kèm thao tác truy cập hàng loạt file.

Sau sự cố, khôi phục hệ thống từ bản snapshot chỉ mất khoảng 1,5 giờ, toàn bộ dữ liệu được phục hồi đến trạng thái trước tấn công 3 giờ mà không mất bản ghi nào.

Kết quả đạt được
Tổn thất dữ liệu giảm xuống gần bằng 0, hoạt động được khôi phục trong ngày. Hệ thống được đánh giá “an toàn cao” bởi đơn vị kiểm toán bên thứ ba. Doanh nghiệp áp dụng immutable backup như tiêu chuẩn mặc định cho tất cả máy chủ trọng yếu.

Khôi phục hệ thống sau tấn công ransomware bằng backup bất biến

Bối cảnh kỹ thuật
Một công ty logistics sử dụng máy chủ VM nội bộ để lưu trữ đơn hàng và lịch trình vận chuyển. Sau sự cố bị tấn công bởi ransomware LockBit, toàn bộ ổ đĩa máy chủ bị mã hóa, gây ngừng hoạt động gần 2 ngày. Trước đó, hệ thống chưa có giải pháp DR thực sự và backup cũ đã bị hacker xóa sạch.

Giải pháp kỹ thuật đề xuất
Triển khai giải pháp immutable backup trên VNPT Cloud với chính sách lưu trữ dữ liệu không thể chỉnh sửa hoặc xóa trong thời gian chỉ định. Sử dụng snapshot cấp block-level định kỳ mỗi 4 giờ cho toàn bộ VM quan trọng, lưu trữ tại một VPC riêng biệt, không public, chỉ có quyền ghi một chiều từ hệ thống gốc.

Để tăng khả năng phục hồi, bản sao snapshot được replicate sang một vùng khác (cross-region) với thiết lập thời gian giữ backup tối thiểu 30 ngày. Hệ thống phát hiện tấn công ransomware bằng agent hành vi trên máy chủ, cảnh báo khi tiến trình bất thường sử dụng CPU cao bất thường kèm thao tác truy cập hàng loạt file.

Sau sự cố, khôi phục hệ thống từ bản snapshot chỉ mất khoảng 1,5 giờ, toàn bộ dữ liệu được phục hồi đến trạng thái trước tấn công 3 giờ mà không mất bản ghi nào.

Kết quả đạt được
Tổn thất dữ liệu giảm xuống gần bằng 0, hoạt động được khôi phục trong ngày. Hệ thống được đánh giá “an toàn cao” bởi đơn vị kiểm toán bên thứ ba. Doanh nghiệp áp dụng immutable backup như tiêu chuẩn mặc định cho tất cả máy chủ trọng yếu.

Đảm bảo khôi phục hệ thống core ngân hàng theo chuẩn PCI-DSS

Bối cảnh kỹ thuật
Một ngân hàng thương mại triển khai hệ thống core banking trên cloud để phục vụ giao dịch, quản lý tài khoản và tích hợp dịch vụ thẻ. Theo yêu cầu PCI-DSS, hệ thống phải đảm bảo khả năng khôi phục (RTO/RPO) rõ ràng, khả năng kiểm thử định kỳ và lưu trữ bản sao tại vùng riêng biệt.

Giải pháp kỹ thuật đề xuất
VNPT Cloud triển khai giải pháp DR cho hệ thống tài chính theo kiến trúc Active-Passive. Toàn bộ cơ sở dữ liệu PostgreSQL và file hệ thống của ứng dụng banking được snapshot mỗi 15 phút, replicate real-time sang vùng dự phòng.

Backup được lưu ở storage mã hóa AES-256, quản lý khóa qua VNPT KMS. Hệ thống DR được kiểm thử tự động hàng tháng (DR Drill), dùng các bản sao để khởi động tạm thời tại vùng khác, kiểm tra khả năng truy cập ứng dụng, tính toàn vẹn dữ liệu và khả năng xử lý giao dịch mẫu.

Công cụ log SIEM ghi lại toàn bộ tiến trình kiểm thử để xuất trình trong kiểm toán PCI. Quy trình khôi phục được chuẩn hóa bằng playbook tự động (Ansible) để giảm thao tác thủ công.

Kết quả đạt được
RTO dưới 30 phút, RPO dưới 10 phút. Hệ thống vượt qua bài đánh giá của tổ chức cấp chứng chỉ PCI-DSS mà không yêu cầu điều chỉnh hạ tầng. Ngân hàng duy trì khả năng sẵn sàng 24/7 ngay cả khi vùng chính mất kết nối.

Sao lưu dữ liệu giữa hai vùng để duy trì tính sẵn sàng cao

Bối cảnh kỹ thuật
Một công ty thương mại điện tử vận hành hệ thống tại trung tâm dữ liệu VNPT Cloud ở TP.HCM. Để phòng khi mất điện hoặc thiên tai, họ cần giải pháp replicate dữ liệu sang vùng Hà Nội, đảm bảo có thể chuyển đổi nhanh trong tình huống xấu nhất.

Giải pháp kỹ thuật đề xuất
Áp dụng mô hình cross-region backup + warm DR site. Hệ thống vận hành chính tại vùng A (TP.HCM), toàn bộ dữ liệu từ VM, database và object storage được sao lưu định kỳ mỗi 2 giờ sang vùng B (Hà Nội).

Dữ liệu được lưu trong subnet riêng không truy cập từ internet, chỉ được mount khi thực hiện khôi phục. File backup sử dụng định dạng deduplicated để tiết kiệm dung lượng (ZFS-based). Đối với ứng dụng yêu cầu cao, sử dụng synchronous replication tại tầng database PostgreSQL với standby instance tại vùng dự phòng.

Quy trình cut-over được viết sẵn, chỉ cần 2 thao tác thủ công: đổi DNS và khởi động bản sao ứng dụng từ image đã được đóng gói sẵn.

Kết quả đạt được
Hệ thống có khả năng chịu lỗi vùng trong vòng 1 giờ. Dữ liệu đồng bộ hoàn toàn theo đúng RPO đặt ra. Doanh nghiệp thực hiện DR Drill mỗi quý để đảm bảo tính khả thi. Tăng độ tin cậy SLA với khách hàng và đối tác phân phối.

Bối cảnh kỹ thuật
Một startup SaaS triển khai ứng dụng đa tenant bằng microservices trên Kubernetes (K8s), sử dụng PostgreSQL và Redis cho backend. Yêu cầu đảm bảo backup toàn bộ tài nguyên container, persistent volume và database mà không ảnh hưởng vận hành.

Giải pháp kỹ thuật đề xuất
Sử dụng Velero + Restic tích hợp vào VNPT Cloud Kubernetes để backup tài nguyên K8s và volume dữ liệu. Cấu hình backup theo namespace, label và tự động hóa backup mỗi đêm vào Object Storage theo định dạng S3-compatible.

Với PostgreSQL, tích hợp công cụ pgBackRest thực hiện incremental backup, lưu metadata và bản ghi log thay đổi. Cơ chế restore cho phép khôi phục chọn lọc theo namespace, bản ghi thời gian, hoặc khôi phục toàn bộ cluster sang môi trường mới (test, staging).

Lịch backup được giám sát qua Prometheus + Alertmanager để cảnh báo khi có job thất bại hoặc backup không hoàn thành đúng thời gian quy định.

Kết quả đạt được
Hệ thống có khả năng khôi phục từng tenant hoặc toàn bộ hệ thống. Backup hoàn thành trong vòng 15 phút mỗi ngày. Đội DevOps rút ngắn thời gian khôi phục từ vài giờ còn dưới 30 phút, tăng tính tự động và an toàn cho mô hình SaaS.

Kiểm thử kịch bản khôi phục (DR Drill) theo quy trình tự động hóa

Bối cảnh kỹ thuật
Một công ty cung cấp dịch vụ dữ liệu cho đối tác tài chính thường xuyên bị audit bởi các ngân hàng lớn. Một trong các tiêu chí đánh giá là khả năng khôi phục dịch vụ và mức độ thành thạo trong kiểm thử định kỳ.

Giải pháp kỹ thuật đề xuất
Triển khai DR Drill tự động hóa kết hợp snapshot, auto-deploy và kiểm thử theo workflow định sẵn. Mỗi tháng, hệ thống tự động tạo bản sao từ backup mới nhất (VM, DB, app config), khởi động tại môi trường sandbox độc lập để test tính khả dụng và toàn vẹn dữ liệu.

Quy trình kiểm thử gồm: chạy service health check, kiểm tra login người dùng mẫu, test upload/download và query database. Toàn bộ tiến trình log được gửi về hệ thống audit nội bộ và lưu bản ghi kết quả kiểm thử trong 2 năm.

Sau khi kiểm thử hoàn tất, môi trường tự động bị xóa để tiết kiệm chi phí. Quy trình được lập trình bằng Terraform + Ansible để có thể kiểm soát phiên bản và tái sử dụng.

Kết quả đạt được
Tăng độ tin cậy với đối tác tài chính, duy trì compliance kiểm định liên tục. Hệ thống khôi phục thành công 100% trong 3 tháng liên tiếp. DR Drill giúp phát hiện sớm 2 lỗi cấu hình không tương thích trong lần kiểm thử thứ hai.

Đưa các ý tưởng đi vào thực tế nhanh chóng cùng VNPT Cloud

01

Đánh giá

Phân tích mức độ ưu tiên hệ thống, RTO/RPO mong muốn và dữ liệu cần bảo vệ

02

Thiết kế

Lựa chọn phương pháp backup, replication, vùng lưu trữ và kịch bản khôi phục

03

Triển khai

Thiết lập lịch backup, tích hợp tự động hóa, kiểm thử DR (DR Drill) và giám sát toàn trình

Câu hỏi thường gặp

Hãy để VNPT Cloud giải đáp những thắc mắc của bạn. Liên hệ với chúng tôi ⟶

RTO là thời gian khôi phục sau sự cố, RPO là lượng dữ liệu chấp nhận mất. Tùy hệ thống, có thể thiết kế RTO vài phút và RPO dưới 10 phút

Được. VNPT Cloud hỗ trợ backup cross-region, đảm bảo hệ thống vận hành ở một vùng, backup tại vùng khác để tăng độ sẵn sàng.

Dữ liệu được ghi một chiều, không thể chỉnh sửa hay xóa. Điều này ngăn mã độc và hành vi nội bộ xóa dữ liệu backup quan trọng.

Có. Giải pháp hỗ trợ DR Drill theo lịch trình. Kiểm thử môi trường giả lập từ backup mới nhất mà không ảnh hưởng môi trường thật.

Có. Hệ thống tích hợp backup cấp ứng dụng, đảm bảo tính toàn vẹn của dữ liệu và log. Có thể lựa chọn full hoặc incremental backup.

Có. Hỗ trợ Velero + Restic để backup toàn bộ tài nguyên Kubernetes (Pod, PVC, CRD...) và khôi phục theo namespace hoặc cluster.

Có. Cung cấp API để tích hợp lịch backup, khôi phục và giám sát vào quy trình CI/CD hoặc hệ thống giám sát của khách hàng.

Có. Backup log, audit, DR Drill và mã hóa dữ liệu giúp đáp ứng các yêu cầu về tuân thủ ISO 27001, PCI-DSS, hoặc các yêu cầu ngành đặc thù.