1. Vì sao Rsync và Tar là “nền móng” của backup Linux?
Dù hệ thống dùng công cụ backup phức tạp đến đâu, bên dưới vẫn thường là:
So sánh file
Sao chép dữ liệu
Đóng gói dữ liệu
Và hai công cụ làm tốt nhất việc này là:
Rsync và Tar
📌 Hiểu đúng Rsync và Tar giúp:
Kiểm soát backup
Không phụ thuộc công cụ cao cấp
Xử lý tình huống khẩn cấp
2. Tar – công cụ đóng gói và bảo toàn cấu trúc
2.1. Tar dùng để làm gì?
Đóng gói nhiều file/thư mục
Bảo toàn:
Permission
Ownership
Symlink
Timestamp
📌 Tar không đồng bộ, chỉ đóng gói.
2.2. Khi nào nên dùng Tar?
Backup snapshot
Backup dữ liệu tĩnh
Đóng gói để off-site
Air-gap backup
2.3. Khi nào KHÔNG nên dùng Tar?
Backup dữ liệu thay đổi liên tục
Backup incremental hằng ngày dung lượng lớn
3. Rsync – công cụ đồng bộ thông minh
3.1. Rsync dùng để làm gì?
Đồng bộ file
Copy incremental
Truyền qua mạng
📌 Rsync chỉ copy phần thay đổi.
3.2. Khi nào nên dùng Rsync?
Backup hằng ngày
Đồng bộ code
Backup file upload
Copy off-site
3.3. Khi nào KHÔNG nên dùng Rsync?
Khi cần archive độc lập
Khi cần retention dài hạn
Khi cần backup bất biến (immutable)
4. So sánh Tar và Rsync
| Tiêu chí | Tar | Rsync |
|---|---|---|
| Mục đích | Đóng gói | Đồng bộ |
| Incremental | Không (cơ bản) | Có |
| Phù hợp off-site | Có | Có |
| Lưu dài hạn | Tốt | Kém |
| Restore chọn lọc | Trung | Tốt |
| Phục hồi nhanh | Trung | Nhanh |
5. Kết hợp Tar và Rsync đúng cách
Chiến lược phổ biến:
Rsync: backup hằng ngày (incremental)
Tar: archive định kỳ (weekly / monthly)
📌 Rsync để sống, Tar để giữ.
6. Các nguyên tắc quan trọng khi dùng Rsync
Luôn dùng preserve permission
Cẩn thận với
--deleteKhông rsync trực tiếp DB đang ghi
Test restore
📌 Rsync sai có thể xóa sạch dữ liệu.
7. Các nguyên tắc quan trọng khi dùng Tar
Ghi rõ timestamp
Nén phù hợp
Mã hóa nếu off-site
Kiểm tra archive
📌 Tar không kiểm tra logic dữ liệu.
8. Rsync và Tar trong kiến trúc backup lớn
Trong hệ thống lớn:
Rsync dùng cho:
File server
Web server
Tar dùng cho:
Snapshot archive
Air-gap backup
📌 Đây là khối xây cơ bản cho các công cụ backup cao cấp.
9. Sai lầm phổ biến
Dùng Rsync làm retention dài hạn
Dùng Tar cho backup hằng ngày dung lượng lớn
Không test restore
Không log kết quả
10. Checklist sử dụng Rsync & Tar
Rsync
Preserve permission
Dry-run trước
Không rsync DB live
Tar
Archive rõ ràng
Nén hợp lý
Mã hóa off-site
Rsync giúp dữ liệu luôn sẵn sàng.
Tar giúp dữ liệu tồn tại lâu dài.
Một hệ thống backup vững chắc:
Không bỏ qua hai công cụ này
Mà dùng chúng đúng vai trò và đúng thời điểm
- Đăng nhập để gửi ý kiến