1. Vì sao cần phân biệt dữ liệu live và dữ liệu archive?
Trong hệ thống CNTT bệnh viện và các dịch vụ vận hành liên tục, không phải mọi dữ liệu đều “sống” như nhau.
Nếu backup dữ liệu live và dữ liệu archive theo cùng một cách, hệ thống sẽ gặp các vấn đề:
Backup nặng, chạy lâu
Khó đảm bảo tính nhất quán
Restore chậm hoặc sai thời điểm
Lãng phí dung lượng lưu trữ
Nguyên tắc nền tảng:
Dữ liệu khác trạng thái → chiến lược backup phải khác nhau.
2. Định nghĩa dữ liệu live
2.1. Dữ liệu live là gì?
Dữ liệu live là dữ liệu:
Đang được ghi/đọc liên tục
Thay đổi theo thời gian thực
Gắn trực tiếp với hoạt động nghiệp vụ đang diễn ra
Ví dụ trong hệ thống của mình:
Database đang phục vụ người bệnh
Webform đang nhận dữ liệu
Files upload trong ngày
Log nghiệp vụ đang phát sinh
2.2. Đặc điểm của dữ liệu live
Thay đổi liên tục
Có nguy cơ:
Backup không nhất quán
Mất dữ liệu giữa chừng
Yêu cầu:
RPO thấp
Khôi phục nhanh
3. Định nghĩa dữ liệu archive
3.1. Dữ liệu archive là gì?
Dữ liệu archive là dữ liệu:
Không còn thay đổi
Đã “đóng” về mặt nghiệp vụ
Chỉ dùng để tra cứu, đối soát, kiểm toán
Ví dụ trong hệ thống của mình:
Website năm cũ (kshl2025)
Database đã khóa ghi
Hồ sơ đã hoàn tất
Báo cáo tổng hợp năm
3.2. Đặc điểm của dữ liệu archive
Không thay đổi
Ít truy cập
Dung lượng lớn
Giá trị pháp lý cao
4. So sánh trực tiếp: Live vs Archive
| Tiêu chí | Dữ liệu live | Dữ liệu archive |
|---|---|---|
| Trạng thái | Đang thay đổi | Không thay đổi |
| Tần suất backup | Cao | Thấp |
| Yêu cầu nhất quán | Rất cao | Dễ đảm bảo |
| RPO | Thấp | Cao |
| RTO | Ngắn | Dài hơn |
| Dung lượng | Tăng nhanh | Ổn định |
| Nguy cơ ransomware | Cao | Thấp (nếu tách đúng) |
5. Chiến lược backup cho dữ liệu live
5.1. Nguyên tắc
Backup thường xuyên
Backup từng phần
Không giữ quá lâu trên server live
Luôn có bản off-site
5.2. Áp dụng trong hệ thống thực tế
Database live:
Dump theo lịch (hourly/daily)
Lưu tạm tại CMC1C/BV1
Đẩy Desktop
Files live:
HA (BV1 → BV2)
Snapshot ngắn hạn
Code/config:
Backup khi thay đổi
5.3. Rủi ro cần kiểm soát
Backup trùng thời điểm ghi
Backup gây tải hệ thống
Backup bị mã hóa cùng lúc với dữ liệu live
6. Chiến lược backup cho dữ liệu archive
6.1. Nguyên tắc
Backup ít lần nhưng chắc chắn
Đảm bảo tính toàn vẹn
Ưu tiên lưu trữ dài hạn
Hạn chế truy cập
6.2. Áp dụng trong hệ thống thực tế
Website/archive năm cũ:
1 bản full (code + DB + files)
Lưu off-site (Desktop, cloud)
Database archive:
Dump 1–2 bản
Có checksum
Files archive:
Nén
Lưu cold storage
6.3. Bảo vệ archive khỏi rủi ro
Tách khỏi hệ thống live
Read-only
Không cho script live ghi đè
7. Những sai lầm thường gặp
Sai lầm 1: Backup archive như live
Chạy backup hàng ngày
Tốn dung lượng
Không tăng an toàn
Sai lầm 2: Xem archive là “ít quan trọng”
Không test restore
Không có bản off-site
Khi cần thì file hỏng
Sai lầm 3: Trộn live và archive
Ransomware lan sang archive
Restore nhầm phiên bản
8. Liên hệ với mô hình backup tổng thể
Trong mô hình của mình:
Live data:
CMC
BV1
PRX
Archive data:
Website năm cũ
DB đã khóa
Desktop backup đóng vai trò:
Giữ live snapshot
Giữ archive dài hạn
Tách biệt rõ ràng
9. Gợi ý triển khai thực tế
Mỗi năm:
Đóng dữ liệu cũ → archive
Chuyển sang không gian lưu trữ riêng
Archive:
Không tham gia replication
Không nằm trong rsync HA
10. Kết luận
Phân biệt đúng dữ liệu live và archive giúp:
Backup nhẹ hơn
Restore nhanh hơn
Hạn chế rủi ro lan truyền
Vận hành ổn định lâu dài
Backup tốt không phải là backup nhiều, mà là backup đúng trạng thái dữ liệu.
- Đăng nhập để gửi ý kiến