Thứ Tư, 20/05/2026, 08:00 (GMT+0)

[Bách Khoa Big Data] Cẩm nang toàn diện về Big Data và Điện toán đám mây

Quay lại Trang chủ Blog
Trên trang này

Bài viết điện toán đám mây dành cho Big data và điện toán đám mây này sẽ giúp bạn trong việc học Big data với công nghệ Đám mây.

Bạn sẽ tìm hiểu lưu trữ đám mây là gì, Big data trên đám mây, các đặc điểm của điện toán đám mây, các dịch vụ điện toán đám mây và lưu trữ đám mây (cloud hosting), lưu trữ dữ liệu đám mây và các mô hình triển khai, các công ty điện toán đám mây và các nhà cung cấp dịch vụ đám mây, cơ sở hạ tầng đám mây, ưu điểm của điện toán đám mây và các vấn đề với điện toán đám mây.

Big Data và điện toán đám mây

Giới thiệu về Big data và Điện toán đám mây

Điện toán đám mây là việc sử dụng các tài nguyên tính toán (phần cứng và phần mềm) được phân phối như một dịch vụ thông qua mạng lưới (thông thường là Internet). Đó là một khung làm việc ảo hóa.

Nó giống như một nguồn tài nguyên theo yêu cầu, cho dù đó là lưu trữ, tính toán, v.v. Đám mây tuân theo mô hình trả phí theo mức độ sử dụng (pay per usage). Bạn cần thanh toán cho lượng tài nguyên mà bạn sử dụng.

Dịch vụ tính toán này bởi đám mây chỉ tính phí bạn dựa trên lượng tài nguyên tính toán mà chúng ta sử dụng. Vì vậy, ví dụ, nếu bạn muốn trình diễn cho một khách hàng trên một cụm (cluster) gồm hơn 100 máy và bạn hiện không có sẵn ngần ấy máy, thì trong trường hợp như vậy điện toán đám mây đóng một vai trò rất quan trọng.

Đám mây đóng một vai trò quan trọng trong thế giới Big Data bằng cách cung cấp cơ sở hạ tầng có thể mở rộng hàng ngang và được tối ưu hóa nhằm hỗ trợ việc triển khai thực tế của Big Data.

Điện toán đám mây và Big Data

Trong điện toán đám mây, tất cả dữ liệu được thu thập tại các trung tâm dữ liệu và sau đó được phân phối tới người dùng cuối. Hơn nữa, việc sao lưu và khôi phục dữ liệu tự động cũng được đảm bảo để duy trì tính liên tục của doanh nghiệp; tất cả các tài nguyên như vậy đều có sẵn trên đám mây.

Chúng ta không biết vị trí vật lý chính xác của các tài nguyên này được cung cấp cho mình. Bạn chỉ cần các thiết bị đầu cuối giả (dummy terminals) như máy tính để bàn, laptop, điện thoại, v.v. và một kết nối mạng.

Có nhiều cách để truy cập đám mây:

  1. Các ứng dụng hoặc Phần mềm như một dịch vụ (SAAS) ví dụ: Salesforce.com, dropbox, google drive, v.v.
  2. Nền tảng như một dịch vụ (PAAS)
  3. Cơ sở hạ tầng như một dịch vụ (IAAS)

Các tính năng của Điện toán đám mây

Hãy cùng xem một vài tính năng của điện toán đám mây:

a. Khả năng mở rộng 

Khả năng mở rộng được cung cấp bằng cách sử dụng tính toán phân tán.

b. Tính đàn hồi

Khách hàng được phép sử dụng và chỉ trả tiền cho lượng tài nguyên mà họ đang dùng. Trong điện toán đám mây, tính đàn hồi được định nghĩa là mức độ mà một hệ thống có khả năng thích ứng với các thay đổi về khối lượng công việc một cách tự động, sao cho tại bất kỳ thời điểm nào, các tài nguyên sẵn có đều khớp với nhu cầu hiện tại một cách sát sao nhất có thể.

c. Gom góp tài nguyên

Các tài nguyên giống nhau được phép sử dụng bởi nhiều tổ chức. Các tài nguyên tính toán được gom lại để phục vụ nhiều người tiêu dùng thông qua mô hình đa người thuê (multi-tenant), với các tài nguyên khác nhau được chỉ định và chỉ định lại một cách linh động theo nhu cầu của người tiêu dùng.

d. Tự phục vụ 

Khách hàng được cung cấp giao diện dễ sử dụng, qua đó họ có thể chọn các dịch vụ họ muốn. Một người tiêu dùng có thể đơn phương thiết lập các năng lực tính toán, chẳng hạn như thời gian máy chủ và lưu trữ mạng, khi cần thiết mà không yêu cầu sự tương tác của con người.

e. Chi phí thấ

Nó chỉ tính phí bạn dựa trên lượng tài nguyên tính toán chúng ta sử dụng và bạn không cần phải mua cơ sở hạ tầng đắt đỏ. Giá cả dựa trên cơ sở tính toán tiện ích (utility computing) là dựa trên mức độ sử dụng và yêu cầu ít kỹ năng CNTT hơn để triển khai.

f. Khả năng chịu lỗi

Cho phép phục hồi trong trường hợp một phần trong hệ thống đám mây không phản hồi.

Các mô hình triển khai đám mây

Chủ yếu có 2 loại mô hình triển khai đám mây:

  • Public cloud (Đám mây công cộng) – Một đám mây được gọi là “public cloud” khi các dịch vụ được mở công khai qua mạng để sử dụng chung.
  • Private Cloud (Đám mây riêng) – Đám mây riêng được vận hành duy nhất cho một tổ chức đơn lẻ, cho dù được quản lý nội bộ hay bởi bên thứ ba, và được lưu trữ tại nội bộ hoặc bên ngoài.

Các mô hình cung cấp đám mây (Cloud Delivery Models)

Các dịch vụ đám mây được phân loại như sau:

  1. Infrastructure as a service (IAAS): Nghĩa là toàn bộ cơ sở hạ tầng sẽ được cung cấp cho bạn. Các nhiệm vụ liên quan đến bảo trì sẽ được thực hiện bởi nhà cung cấp đám mây và bạn có thể sử dụng nó theo yêu cầu. Nó có thể được sử dụng cả ở dạng công cộng và riêng tư. Các ví dụ về IaaS là máy ảo, bộ cân bằng tải và lưu trữ gắn mạng (NAS).
  2. Platform as a service (PAAS): Tại đây chúng ta có lưu trữ đối tượng, hàng đợi, cơ sở dữ liệu, môi trường thực thi (runtime), v.v. Tất cả những thứ này chúng ta có thể nhận trực tiếp từ nhà cung cấp đám mây. Trách nhiệm của chúng ta là cấu hình và sử dụng chúng. Nhà cung cấp sẽ đưa tài nguyên nhưng việc kết nối tới cơ sở dữ liệu và các hoạt động tương tự là trách nhiệm của chúng ta. Các ví dụ về PaaS là Windows Azure và Google App Engine (GAE).
  3. Applications or software as a service (SAAS): Ví dụ: Salesforce.com, dropbox, google drive, v.v. Tại đây chúng ta không có bất kỳ trách nhiệm nào. Chúng ta đang sử dụng ứng dụng đang chạy trên đám mây. Toàn bộ việc thiết lập cơ sở hạ tầng là trách nhiệm của nhà cung cấp dịch vụ. Để SaaS hoạt động, cơ sở hạ tầng (IaaS) và nền tảng (PaaS) phải được thiết lập sẵn.

Đám mây cho Big Data

Dưới đây là một số ví dụ về cách các ứng dụng đám mây được sử dụng cho Big Data:

  • IAAS trong đám mây công cộng: Sử dụng hạ tầng của nhà cung cấp đám mây cho các dịch vụ Big Data mang lại quyền truy cập vào khả năng lưu trữ và sức mạnh tính toán gần như không giới hạn. IaaS có thể được tận dụng bởi khách hàng doanh nghiệp để tạo ra các giải pháp IT hiệu quả về chi phí và dễ dàng mở rộng, nơi các nhà cung cấp đám mây chịu đựng sự phức tạp và chi phí quản lý phần cứng bên dưới. Nếu quy mô hoạt động kinh doanh của khách hàng biến động hoặc họ muốn mở rộng, họ có thể khai thác tài nguyên đám mây khi cần thay vì tự mua, lắp đặt và tích hợp phần cứng.
  • PAAS trong đám mây riêng: Các nhà cung cấp PaaS đang bắt đầu kết hợp các công nghệ Big Data như Hadoop và MapReduce vào các sản phẩm PaaS của họ, giúp loại bỏ việc đối phó với những phức tạp khi quản lý từng yếu tố phần mềm và phần cứng riêng lẻ. Ví dụ, các nhà phát triển web có thể sử dụng các môi trường PaaS riêng biệt ở mọi giai đoạn phát triển, thử nghiệm và cuối cùng là lưu trữ website. Tuy nhiên, các doanh nghiệp đang tự phát triển phần mềm nội bộ cũng có thể sử dụng PaaS, đặc biệt để tạo ra các môi trường phát triển và thử nghiệm được tách biệt rõ ràng.
  • SAAS trong đám mây lai (hybrid cloud): Nhiều tổ chức cảm thấy cần phân tích tiếng nói khách hàng, đặc biệt là trên mạng xã hội. Các nhà cung cấp SaaS cung cấp nền tảng cho việc phân tích cũng như dữ liệu mạng xã hội. Phần mềm văn phòng là ví dụ tốt nhất về việc doanh nghiệp sử dụng SaaS. Các nhiệm vụ liên quan đến kế toán, bán hàng, lập hóa đơn và lập kế hoạch đều có thể thực hiện qua SAAS. Doanh nghiệp có thể muốn sử dụng một phần mềm thực hiện tất cả nhiệm vụ này hoặc vài phần mềm mà mỗi cái thực hiện một nhiệm vụ khác nhau. Phần mềm có thể được đăng ký qua internet và sau đó truy cập trực tuyến qua bất kỳ máy tính nào trong văn phòng bằng tên đăng nhập và mật khẩu. Nếu cần, họ có thể chuyển sang phần mềm đáp ứng yêu cầu của mình tốt hơn. Mọi người cần truy cập vào một phần mềm cụ thể đều có thể được thiết lập như một người dùng, cho dù đó là một hai người hay mọi nhân viên trong một tập đoàn thuê hàng trăm người.

Các nhà cung cấp trong thị trường Đám mây Big Data

Các công ty điện toán đám mây có đủ hình dáng và quy mô. Tất cả các nhà cung cấp phần mềm lớn hoặc đã bắt đầu cung cấp các gói trong không gian đám mây, hoặc đang trong quá trình ra mắt.

Ngoài ra còn có nhiều công ty khởi nghiệp có các sản phẩm thú vị trong không gian đám mây. Ở đây chúng ta có danh sách các nhà cung cấp chính về điện toán đám mây. Một vài nhà cung cấp đám mây là google, citrix, netmagic, redhat, rackspace, v.v. Amazon (aws) là nhà cung cấp đám mây hàng đầu trong số tất cả. Microsoft cũng đang cung cấp dịch vụ đám mây và nó được gọi là azure.

Các công ty IaaS:

  • Sản phẩm của Amazon bao gồm S3 (Lưu trữ dữ liệu/hệ thống tệp), SimpleDB (cơ sở dữ liệu phi quan hệ) và EC2 (máy chủ tính toán).
  • Sản phẩm của Rackspace bao gồm Cloud Drive, Cloud Sites (lưu trữ web trên đám mây) và Cloud Servers.
  • Sản phẩm của IBM bao gồm Smart Business Storage Cloud và Computing on Demand (CoD).
  • AT&T cung cấp Synaptic Storage và Synaptic Compute dưới dạng dịch vụ.

Các công ty PaaS:

  • Googles AppEngine là một nền tảng phát triển được xây dựng trên Python và Java.
  • Salesforce.com cung cấp nền tảng phát triển dựa trên Apex.
  • Microsoft Azure cung cấp nền tảng phát triển dựa trên .Net.

Các công ty SaaS:

  • Trong SaaS, Google cung cấp không gian bao gồm Google Docs, Gmail, Google Calendar và Picasa.
  • IBM cung cấp LotusLive iNotes, một dịch vụ email dựa trên web cho khả năng nhắn tin và lên lịch cho người dùng doanh nghiệp.
  • Zoho cung cấp các sản phẩm trực tuyến tương tự như bộ ứng dụng Microsoft Office.

Các vấn đề khi sử dụng dịch vụ đám mây

Một số vấn đề quan trọng của dịch vụ đám mây được liệt kê như sau:

a. Bảo mật dữ liệu

Các tổ chức phải đảm bảo rằng thỏa thuận của họ với nhà cung cấp dịch vụ đám mây đảm bảo bảo mật dữ liệu. Việc giao dữ liệu riêng tư cho người khác khiến một số người lo lắng. Các giám đốc điều hành doanh nghiệp có thể ngần ngại tận dụng hệ thống điện toán đám mây vì họ không thể giữ thông tin của công ty mình dưới sự kiểm soát trực tiếp (khóa kỹ).

b. Hiệu suất

Các thông số về hiệu suất đám mây phải được quy định rõ trong thỏa thuận và được định lượng bất cứ nơi nào có thể. Các ngoại lệ phải được lưu ý rõ ràng. Thỏa thuận mức độ dịch vụ (SLA) nên nêu rõ tất cả các điều khoản và điều kiện giữa người dùng dịch vụ và nhà cung cấp dịch vụ để đảm bảo hiệu suất phù hợp.

c. Tính tuân thủ

Các dịch vụ đám mây phải tương thích với nhu cầu tuân thủ của doanh nghiệp. Một số công ty cũng lo ngại về các vấn đề pháp lý. Các nhà quan sát thị trường nói rằng khoảng 50% mọi người lo lắng rằng họ sẽ bị ràng buộc vào một nhà cung cấp lưu trữ đám mây duy nhất.

d. Vấn đề pháp lý

Tổ chức phải đảm bảo rằng vị trí của các tài nguyên vật lý của đám mây không mang lại bất kỳ vấn đề pháp lý nào. Đám mây đưa ra một số thách thức pháp lý đối với các vấn đề quyền riêng tư liên quan đến dữ liệu được lưu trữ tại nhiều địa điểm trong đám mây, đồng thời làm tăng rủi ro vi phạm tính bảo mật và quyền riêng tư.

e. Chi phí

Các tổ chức nên nhận thức được tất cả các chi phí liên quan đến việc sử dụng đám mây, và sử dụng các dịch vụ một cách có kiểm soát vì đám mây cung cấp phương thức trả tiền theo mức độ sử dụng cho các chi phí phát sinh của công ty.

#Bách Khoa Toàn Diện
#Big Data
#Cloud Native
#Cloud Computing
#Bách Khoa Toàn Diện
#Big Data
#Cloud Native
#Cloud Computing
Sovereign Cloud không chỉ là đặt máy chủ trong nước. Với bối cảnh pháp lý dữ liệu mới tại Việt Nam, đây đang trở thành bài toán hạ tầng quan trọng cho doanh nghiệp Việt và doanh nghiệp nước ngoài hoạt động tại Việt Nam
Sovereign Cloud - Đám mây chủ quyền là gì? Và vì sao doanh nghiệp hoạt động tại Việt Nam nên quan tâm từ bây giờ?
Tiếp tục đọc