Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "CNTT" các nội dung bạn quan tâm.

Bài 30. Rsync và Tar – nền tảng căn bản

ICT

1. Vì sao Rsync và Tar là “nền móng” của backup Linux?

Dù hệ thống dùng công cụ backup phức tạp đến đâu, bên dưới vẫn thường là:

  • So sánh file

  • Sao chép dữ liệu

  • Đóng gói dữ liệu

Và hai công cụ làm tốt nhất việc này là:

Rsync và Tar

📌 Hiểu đúng Rsync và Tar giúp:

  • Kiểm soát backup

  • Không phụ thuộc công cụ cao cấp

  • Xử lý tình huống khẩn cấp


2. Tar – công cụ đóng gói và bảo toàn cấu trúc

2.1. Tar dùng để làm gì?

  • Đóng gói nhiều file/thư mục

  • Bảo toàn:

    • Permission

    • Ownership

    • Symlink

    • Timestamp

📌 Tar không đồng bộ, chỉ đóng gói.


2.2. Khi nào nên dùng Tar?

  • Backup snapshot

  • Backup dữ liệu tĩnh

  • Đóng gói để off-site

  • Air-gap backup


2.3. Khi nào KHÔNG nên dùng Tar?

  • Backup dữ liệu thay đổi liên tục

  • Backup incremental hằng ngày dung lượng lớn


3. Rsync – công cụ đồng bộ thông minh

3.1. Rsync dùng để làm gì?

  • Đồng bộ file

  • Copy incremental

  • Truyền qua mạng

📌 Rsync chỉ copy phần thay đổi.


3.2. Khi nào nên dùng Rsync?

  • Backup hằng ngày

  • Đồng bộ code

  • Backup file upload

  • Copy off-site


3.3. Khi nào KHÔNG nên dùng Rsync?

  • Khi cần archive độc lập

  • Khi cần retention dài hạn

  • Khi cần backup bất biến (immutable)


4. So sánh Tar và Rsync

Tiêu chíTarRsync
Mục đíchĐóng góiĐồng bộ
IncrementalKhông (cơ bản)
Phù hợp off-site
Lưu dài hạnTốtKém
Restore chọn lọcTrungTốt
Phục hồi nhanhTrungNhanh

5. Kết hợp Tar và Rsync đúng cách

Chiến lược phổ biến:

  • Rsync: backup hằng ngày (incremental)

  • Tar: archive định kỳ (weekly / monthly)

📌 Rsync để sống, Tar để giữ.


6. Các nguyên tắc quan trọng khi dùng Rsync

  • Luôn dùng preserve permission

  • Cẩn thận với --delete

  • Không rsync trực tiếp DB đang ghi

  • Test restore

📌 Rsync sai có thể xóa sạch dữ liệu.


7. Các nguyên tắc quan trọng khi dùng Tar

  • Ghi rõ timestamp

  • Nén phù hợp

  • Mã hóa nếu off-site

  • Kiểm tra archive

📌 Tar không kiểm tra logic dữ liệu.


8. Rsync và Tar trong kiến trúc backup lớn

Trong hệ thống lớn:

  • Rsync dùng cho:

    • File server

    • Web server

  • Tar dùng cho:

    • Snapshot archive

    • Air-gap backup

📌 Đây là khối xây cơ bản cho các công cụ backup cao cấp.


9. Sai lầm phổ biến

  • Dùng Rsync làm retention dài hạn

  • Dùng Tar cho backup hằng ngày dung lượng lớn

  • Không test restore

  • Không log kết quả


10. Checklist sử dụng Rsync & Tar

Rsync

  • Preserve permission

  • Dry-run trước

  • Không rsync DB live

Tar

  • Archive rõ ràng

  • Nén hợp lý

  • Mã hóa off-site


 

Rsync giúp dữ liệu luôn sẵn sàng.
Tar giúp dữ liệu tồn tại lâu dài.

Một hệ thống backup vững chắc:

  • Không bỏ qua hai công cụ này

  • Mà dùng chúng đúng vai trò và đúng thời điểm