Cloud Data & AI là giải pháp tổng thể giúp doanh nghiệp xây dựng nền tảng dữ liệu và trí tuệ nhân tạo trên hạ tầng VNPT Cloud. Giải pháp bao gồm thu thập, xử lý, lưu trữ, phân tích dữ liệu lớn, và triển khai mô hình học máy – từ training đến inference – theo mô hình cloud-native hoặc hybrid.
Các dịch vụ như Object Storage, Managed Kubernetes, GPU-as-a-Service, cùng khả năng tích hợp các công cụ mã nguồn mở như Apache Spark, Kafka, TensorFlow, MLflow được hỗ trợ đầy đủ. Giải pháp đáp ứng các yêu cầu đa dạng từ BI truyền thống đến các pipeline AI real-time, phù hợp cho tổ chức muốn khai thác dữ liệu theo hướng phân tán, an toàn và linh hoạt.
Doanh nghiệp có thể tự triển khai hoặc sử dụng dịch vụ Data & AI-as-a-Service của VNPT Cloud với đầy đủ các tính năng giám sát, bảo mật, phân quyền theo tiêu chuẩn doanh nghiệp.
Khai thác sức mạnh dữ liệu và AI trên cloud để tối ưu vận hành và tạo lợi thế cạnh tranh vượt trội
Tập hợp dữ liệu từ nhiều nguồn (CRM, IoT, web) lên nền tảng lưu trữ tập trung như Data Lake giúp chuẩn hóa dữ liệu và loại bỏ silo.
Triển khai mô hình Machine Learning để tự động phát hiện xu hướng, phân loại khách hàng và dự đoán nhu cầu trong thời gian thực.
Sử dụng GPU Cloud của VNPT giúp rút ngắn thời gian training mô hình từ hàng giờ xuống chỉ còn vài phút, tối ưu chi phí vận hành.
Kết hợp Spark (batch) và Kafka (stream) giúp doanh nghiệp xử lý các loại dữ liệu theo thời gian thực và theo lô trong cùng một kiến trúc.
Cung cấp sẵn API, SDK và kết nối đến các công cụ phổ biến như Jupyter, Airflow, Tableau giúp dễ dàng tích hợp vào quy trình phân tích hiện có.
Sử dụng nền tảng quản lý tài nguyên, giám sát và scale tự động giúp đội ngũ không cần lo về vận hành máy chủ hoặc bảo trì hạ tầng vật lý.
Hệ thống hỗ trợ RBAC, IAM, mã hóa dữ liệu AES-256 và phân vùng bảo mật riêng biệt để đảm bảo an toàn cho dữ liệu nhạy cảm.
Hỗ trợ chia tách workspace dữ liệu, cho phép nhiều đội nhóm (Data Engineer, Data Scientist, BI) làm việc song song trên cùng hệ thống mà không xung đột.
Bối cảnh
Một tập đoàn bán lẻ vận hành hàng trăm cửa hàng trên toàn quốc, dữ liệu phân tán ở nhiều hệ thống: POS, CRM, DMS, và Excel nội bộ từng chi nhánh. Việc tổng hợp và phân tích dữ liệu mất 3–5 ngày, không có hệ thống BI tập trung.
Giải pháp kỹ thuật
Thiết lập một kiến trúc Data Lake trên VNPT Object Storage, tích hợp ETL pipeline sử dụng Apache NiFi kết nối tới các nguồn dữ liệu nội bộ qua VPN và dịch vụ API Gateway. Dữ liệu được chuẩn hóa, phân loại theo schema Hive và lưu trữ dạng Parquet.
Quy trình xử lý batch diễn ra mỗi đêm, chuyển dữ liệu lên hệ thống phân tích sử dụng Apache Presto hoặc kết nối Tableau qua JDBC. Phân quyền dữ liệu theo phòng ban được thiết lập bằng hệ thống IAM, theo tenant riêng cho từng đơn vị.
Kết quả đạt được
Giảm 90% thời gian tổng hợp báo cáo. Ban lãnh đạo có thể truy cập dữ liệu cập nhật hàng ngày qua dashboard. Mỗi bộ phận có workspace riêng và dashboard riêng theo mục tiêu kinh doanh. Toàn bộ hạ tầng BI được triển khai trên nền tảng đám mây, không cần đầu tư máy chủ vật lý.