Cloud Object Storage (lưu trữ đối tượng trên đám mây) là một định dạng sử dụng để lưu trữ dữ liệu phi cấu trúc trong đám mây. Object storage được đánh giá là một định dạng phù hợp cho nền tảng đám mây vì nó có tính đàn hồi, linh hoạt cũng như có thể dễ dàng mở rộng thành nhiều petabyte để hỗ trợ tăng trưởng dữ liệu không giới hạn.
Thiết kế phần mềm object storage thường bao gồm một định danh duy nhất gán cho từng đối tượng, đi kèm mỗi đối tượng là một metadata đầy đủ dữ liệu và có thể tùy chỉnh được. Các metadata sẽ được phân tách riêng biệt để kích hoạt các tính năng khác như: dữ liệu sử dụng riêng cho ứng dụng và người dùng để lập chỉ mục, các giao diện có thể được lập trình trực tiếp bởi ứng dụng, global namespace và chính sách quản lý dữ liệu linh hoạt hơn.
Định danh của đối tượng là một địa chỉ gắn liền với đối tượng, tạo điều kiện cho việc tìm thấy đối tượng trên một hệ thống phân tán. Các đối tượng có thể được trải rộng trên nhiều trung tâm dữ liệu nằm ở các khu vực khác nhau trên thế giới. Dữ liệu dựa trên lưu trữ đối tượng có thể được tìm thấy kể cả khi người dùng không biết vị trí vật lý cụ thể của dữ liệu.
Lưu trữ đối tượng, cùng với siêu dữ liệu, có thể được truy cập trực tiếp thông qua API, HTTP và HTTPS. Điều đó khác với block storage, chỉ có thể truy cập được khi chúng được gắn trên một hệ điều hành.
File storage và block storage truyền thống không phải lúc nào cũng là các tùy chọn tốt nhất để lưu trữ các tập dữ liệu phi cấu trúc lớn cho các ứng dụng chẳng hạn như ứng dụng chứa hình ảnh y tế. Cả file storage và block storage đều khá khó khăn và tốn kém khi thực hiện bên ngoài giới hạn trung tâm dữ liệu và phải xử lý trên một lượng dữ liệu khổng lồ, chúng có thể gây ra những ảnh hưởng dẫn đến giảm lợi nhuận kinh doanh.
File storage, thường được triển khai dưới dạng NAS (Network Attached Storage - thiết bị lưu trữ được kết nối mạng), sử dụng hệ thống tệp để định vị và chia sẻ dữ liệu. Nó được xây dựng để hoạt động trên một mạng cục bộ (LAN), nhưng hiệu năng bị ảnh hưởng khi được sử dụng trên một mạng diện rộng (WAN). Hầu hết các hệ thống không được thiết kế để xử lý hàng tỷ tệp.
Block storage, thường được triển khai như SAN (Storage Area Network - mạng lưu trữ), có vấn đề về hiệu năng trong khoảng cách xa, khiến nó không phù hợp với đám mây. Block storage cũng có các khối dữ liệu với địa chỉ riêng của chúng, nhưng không có metadata để thao tác với mỗi khối.
Ưu điểm chính của hệ thống lưu trữ đối tượng là nó làm cho dữ liệu trở nên linh hoạt hơn trước thảm họa hoặc lỗi phần cứng nhờ khả năng phân phối cao - vì vậy nó vẫn khả dụng ngay cả khi một số node bị hỏng. Nó cũng rẻ hơn rất nhiều so với lưu trữ truyền thống vì lưu trữ đối tượng được lưu trữ trên phần cứng hoặc máy ảo (VM) có khả năng mở rộng vô hạn. Các đối tượng được lưu trữ trong một không gian địa chỉ phẳng, giúp loại bỏ các thách thức trong cấu trúc phức tạp và vấn đề mở rộng. Bảo vệ dữ liệu được tích hợp trong kiến trúc, có thể ở dạng công nghệ sao chép hoặc mã hóa dạng xóa.
Lưu trữ đối tượng phù hợp nhất cho dữ liệu tĩnh và lưu trữ đám mây. Các trường hợp sử dụng object storage điển hình là sao lưu và lưu trữ đám mây vì công nghệ này phù hợp với dữ liệu đọc hơn là dữ liệu ghi. Lưu trữ đối tượng đã phát triển đến mức chia được tỷ lệ dữ liệu ở mức exabyte, tương đương với hàng nghìn tỷ đối tượng. Khi ứng dụng công nghệ trong phần cứng vật lý hoặc VM cho phép dễ dàng thêm vào các node trong khi không gian đĩa được sử dụng hiệu quả hơn.
Các hệ thống object storage, thông qua ID đối tượng (OID) hoặc mã định danh, có thể truy cập vào bất kỳ phần dữ liệu nào mà không cần phải bận tâm dữ liệu đó đang nằm trên thiết bị lưu trữ vật lý, hệ thống tệp hay hệ thống thư mục nào. Cách thức này cho phép các thiết bị lưu trữ đối tượng làm việc được với phần cứng lưu trữ được cấu hình trong kiến trúc node phân tán, do đó khả năng xử lý có thể mở rộng được theo dung lượng lưu trữ dữ liệu. Các yêu cầu I/O không cần phải thông qua bộ điều khiển trung tâm, cho khả năng lưu trữ trên phạm vi toàn cầu đối với một lượng dữ liệu khổng lồ, được lưu trữ vật lý ở bất cứ đâu và được truy cập qua mạng WAN hoặc internet.
Nền tảng lưu trữ đối tượng không đủ nhất quán cho các hệ thống thời gian thực như transactional database. Lưu trữ đối tượng không đảm bảo được việc trả về phiên bản dữ liệu mới nhất cho yêu cầu đọc. Ngoài ra, công nghệ không phải lúc nào cũng phù hợp cho các ứng dụng có yêu cầu hiệu năng cao.