Sharding giải quyết giới hạn vật lý của một server đơn lẻ bằng cách chia dữ liệu ra nhiều server (scale ngang).
Dùng khi collection quá lớn không chứa nổi trên một đĩa, hoặc traffic đọc/ghi vượt CPU/RAM của con replica set mạnh nhất.
Lưu ý: chọn shard key rất quan trọng. Chọn sai dễ gây hot-spot (mọi traffic dồn vào một shard) hoặc scatter-gather (một query phải đi hỏi tất cả các shard → rất chậm). Đây là loại quyết định khó sửa về sau, nên cần cân nhắc kỹ từ đầu.