

Bài viết điện toán đám mây dành cho Big data và điện toán đám mây này sẽ giúp bạn trong việc học Big data với công nghệ Đám mây.
Bạn sẽ tìm hiểu lưu trữ đám mây là gì, Big data trên đám mây, các đặc điểm của điện toán đám mây, các dịch vụ điện toán đám mây và lưu trữ đám mây (cloud hosting), lưu trữ dữ liệu đám mây và các mô hình triển khai, các công ty điện toán đám mây và các nhà cung cấp dịch vụ đám mây, cơ sở hạ tầng đám mây, ưu điểm của điện toán đám mây và các vấn đề với điện toán đám mây.
Điện toán đám mây là việc sử dụng các tài nguyên tính toán (phần cứng và phần mềm) được phân phối như một dịch vụ thông qua mạng lưới (thông thường là Internet). Đó là một khung làm việc ảo hóa.
Nó giống như một nguồn tài nguyên theo yêu cầu, cho dù đó là lưu trữ, tính toán, v.v. Đám mây tuân theo mô hình trả phí theo mức độ sử dụng (pay per usage). Bạn cần thanh toán cho lượng tài nguyên mà bạn sử dụng.
Dịch vụ tính toán này bởi đám mây chỉ tính phí bạn dựa trên lượng tài nguyên tính toán mà chúng ta sử dụng. Vì vậy, ví dụ, nếu bạn muốn trình diễn cho một khách hàng trên một cụm (cluster) gồm hơn 100 máy và bạn hiện không có sẵn ngần ấy máy, thì trong trường hợp như vậy điện toán đám mây đóng một vai trò rất quan trọng.
Đám mây đóng một vai trò quan trọng trong thế giới Big Data bằng cách cung cấp cơ sở hạ tầng có thể mở rộng hàng ngang và được tối ưu hóa nhằm hỗ trợ việc triển khai thực tế của Big Data.
Trong điện toán đám mây, tất cả dữ liệu được thu thập tại các trung tâm dữ liệu và sau đó được phân phối tới người dùng cuối. Hơn nữa, việc sao lưu và khôi phục dữ liệu tự động cũng được đảm bảo để duy trì tính liên tục của doanh nghiệp; tất cả các tài nguyên như vậy đều có sẵn trên đám mây.
Chúng ta không biết vị trí vật lý chính xác của các tài nguyên này được cung cấp cho mình. Bạn chỉ cần các thiết bị đầu cuối giả (dummy terminals) như máy tính để bàn, laptop, điện thoại, v.v. và một kết nối mạng.
Có nhiều cách để truy cập đám mây:
Hãy cùng xem một vài tính năng của điện toán đám mây:
a. Khả năng mở rộng
Khả năng mở rộng được cung cấp bằng cách sử dụng tính toán phân tán.
b. Tính đàn hồi
Khách hàng được phép sử dụng và chỉ trả tiền cho lượng tài nguyên mà họ đang dùng. Trong điện toán đám mây, tính đàn hồi được định nghĩa là mức độ mà một hệ thống có khả năng thích ứng với các thay đổi về khối lượng công việc một cách tự động, sao cho tại bất kỳ thời điểm nào, các tài nguyên sẵn có đều khớp với nhu cầu hiện tại một cách sát sao nhất có thể.
c. Gom góp tài nguyên
Các tài nguyên giống nhau được phép sử dụng bởi nhiều tổ chức. Các tài nguyên tính toán được gom lại để phục vụ nhiều người tiêu dùng thông qua mô hình đa người thuê (multi-tenant), với các tài nguyên khác nhau được chỉ định và chỉ định lại một cách linh động theo nhu cầu của người tiêu dùng.
d. Tự phục vụ
Khách hàng được cung cấp giao diện dễ sử dụng, qua đó họ có thể chọn các dịch vụ họ muốn. Một người tiêu dùng có thể đơn phương thiết lập các năng lực tính toán, chẳng hạn như thời gian máy chủ và lưu trữ mạng, khi cần thiết mà không yêu cầu sự tương tác của con người.
e. Chi phí thấ
Nó chỉ tính phí bạn dựa trên lượng tài nguyên tính toán chúng ta sử dụng và bạn không cần phải mua cơ sở hạ tầng đắt đỏ. Giá cả dựa trên cơ sở tính toán tiện ích (utility computing) là dựa trên mức độ sử dụng và yêu cầu ít kỹ năng CNTT hơn để triển khai.
f. Khả năng chịu lỗi
Cho phép phục hồi trong trường hợp một phần trong hệ thống đám mây không phản hồi.
Chủ yếu có 2 loại mô hình triển khai đám mây:
Các dịch vụ đám mây được phân loại như sau:
Dưới đây là một số ví dụ về cách các ứng dụng đám mây được sử dụng cho Big Data:
Các công ty điện toán đám mây có đủ hình dáng và quy mô. Tất cả các nhà cung cấp phần mềm lớn hoặc đã bắt đầu cung cấp các gói trong không gian đám mây, hoặc đang trong quá trình ra mắt.
Ngoài ra còn có nhiều công ty khởi nghiệp có các sản phẩm thú vị trong không gian đám mây. Ở đây chúng ta có danh sách các nhà cung cấp chính về điện toán đám mây. Một vài nhà cung cấp đám mây là google, citrix, netmagic, redhat, rackspace, v.v. Amazon (aws) là nhà cung cấp đám mây hàng đầu trong số tất cả. Microsoft cũng đang cung cấp dịch vụ đám mây và nó được gọi là azure.
Các công ty IaaS:
Các công ty PaaS:
Các công ty SaaS:
Một số vấn đề quan trọng của dịch vụ đám mây được liệt kê như sau:
a. Bảo mật dữ liệu
Các tổ chức phải đảm bảo rằng thỏa thuận của họ với nhà cung cấp dịch vụ đám mây đảm bảo bảo mật dữ liệu. Việc giao dữ liệu riêng tư cho người khác khiến một số người lo lắng. Các giám đốc điều hành doanh nghiệp có thể ngần ngại tận dụng hệ thống điện toán đám mây vì họ không thể giữ thông tin của công ty mình dưới sự kiểm soát trực tiếp (khóa kỹ).
b. Hiệu suất
Các thông số về hiệu suất đám mây phải được quy định rõ trong thỏa thuận và được định lượng bất cứ nơi nào có thể. Các ngoại lệ phải được lưu ý rõ ràng. Thỏa thuận mức độ dịch vụ (SLA) nên nêu rõ tất cả các điều khoản và điều kiện giữa người dùng dịch vụ và nhà cung cấp dịch vụ để đảm bảo hiệu suất phù hợp.
c. Tính tuân thủ
Các dịch vụ đám mây phải tương thích với nhu cầu tuân thủ của doanh nghiệp. Một số công ty cũng lo ngại về các vấn đề pháp lý. Các nhà quan sát thị trường nói rằng khoảng 50% mọi người lo lắng rằng họ sẽ bị ràng buộc vào một nhà cung cấp lưu trữ đám mây duy nhất.
d. Vấn đề pháp lý
Tổ chức phải đảm bảo rằng vị trí của các tài nguyên vật lý của đám mây không mang lại bất kỳ vấn đề pháp lý nào. Đám mây đưa ra một số thách thức pháp lý đối với các vấn đề quyền riêng tư liên quan đến dữ liệu được lưu trữ tại nhiều địa điểm trong đám mây, đồng thời làm tăng rủi ro vi phạm tính bảo mật và quyền riêng tư.
e. Chi phí
Các tổ chức nên nhận thức được tất cả các chi phí liên quan đến việc sử dụng đám mây, và sử dụng các dịch vụ một cách có kiểm soát vì đám mây cung cấp phương thức trả tiền theo mức độ sử dụng cho các chi phí phát sinh của công ty.
