Website được thiết kế tối ưu cho thành viên chính thức. Hãy Đăng nhập hoặc Đăng ký để truy cập đầy đủ nội dung và chức năng. Nội dung bạn cần không thấy trên website, có thể do bạn chưa đăng nhập. Nếu là thành viên của website, bạn cũng có thể yêu cầu trong nhóm Zalo "CNTT" các nội dung bạn quan tâm.

Bài 1.2. Sự khác nhau khi backup dữ liệu archive và dữ liệu live

ICT

1. Vì sao cần phân biệt dữ liệu live và dữ liệu archive?

Trong hệ thống CNTT bệnh viện và các dịch vụ vận hành liên tục, không phải mọi dữ liệu đều “sống” như nhau.

Nếu backup dữ liệu live và dữ liệu archive theo cùng một cách, hệ thống sẽ gặp các vấn đề:

  • Backup nặng, chạy lâu

  • Khó đảm bảo tính nhất quán

  • Restore chậm hoặc sai thời điểm

  • Lãng phí dung lượng lưu trữ

Nguyên tắc nền tảng:

Dữ liệu khác trạng thái → chiến lược backup phải khác nhau.


2. Định nghĩa dữ liệu live

2.1. Dữ liệu live là gì?

Dữ liệu live là dữ liệu:

  • Đang được ghi/đọc liên tục

  • Thay đổi theo thời gian thực

  • Gắn trực tiếp với hoạt động nghiệp vụ đang diễn ra

Ví dụ trong hệ thống của mình:

  • Database đang phục vụ người bệnh

  • Webform đang nhận dữ liệu

  • Files upload trong ngày

  • Log nghiệp vụ đang phát sinh


2.2. Đặc điểm của dữ liệu live

  • Thay đổi liên tục

  • Có nguy cơ:

    • Backup không nhất quán

    • Mất dữ liệu giữa chừng

  • Yêu cầu:

    • RPO thấp

    • Khôi phục nhanh


3. Định nghĩa dữ liệu archive

3.1. Dữ liệu archive là gì?

Dữ liệu archive là dữ liệu:

  • Không còn thay đổi

  • Đã “đóng” về mặt nghiệp vụ

  • Chỉ dùng để tra cứu, đối soát, kiểm toán

Ví dụ trong hệ thống của mình:

  • Website năm cũ (kshl2025)

  • Database đã khóa ghi

  • Hồ sơ đã hoàn tất

  • Báo cáo tổng hợp năm


3.2. Đặc điểm của dữ liệu archive

  • Không thay đổi

  • Ít truy cập

  • Dung lượng lớn

  • Giá trị pháp lý cao


4. So sánh trực tiếp: Live vs Archive

Tiêu chíDữ liệu liveDữ liệu archive
Trạng tháiĐang thay đổiKhông thay đổi
Tần suất backupCaoThấp
Yêu cầu nhất quánRất caoDễ đảm bảo
RPOThấpCao
RTONgắnDài hơn
Dung lượngTăng nhanhỔn định
Nguy cơ ransomwareCaoThấp (nếu tách đúng)

5. Chiến lược backup cho dữ liệu live

5.1. Nguyên tắc

  • Backup thường xuyên

  • Backup từng phần

  • Không giữ quá lâu trên server live

  • Luôn có bản off-site


5.2. Áp dụng trong hệ thống thực tế

  • Database live:

    • Dump theo lịch (hourly/daily)

    • Lưu tạm tại CMC1C/BV1

    • Đẩy Desktop

  • Files live:

    • HA (BV1 → BV2)

    • Snapshot ngắn hạn

  • Code/config:

    • Backup khi thay đổi


5.3. Rủi ro cần kiểm soát

  • Backup trùng thời điểm ghi

  • Backup gây tải hệ thống

  • Backup bị mã hóa cùng lúc với dữ liệu live


6. Chiến lược backup cho dữ liệu archive

6.1. Nguyên tắc

  • Backup ít lần nhưng chắc chắn

  • Đảm bảo tính toàn vẹn

  • Ưu tiên lưu trữ dài hạn

  • Hạn chế truy cập


6.2. Áp dụng trong hệ thống thực tế

  • Website/archive năm cũ:

    • 1 bản full (code + DB + files)

    • Lưu off-site (Desktop, cloud)

  • Database archive:

    • Dump 1–2 bản

    • Có checksum

  • Files archive:

    • Nén

    • Lưu cold storage


6.3. Bảo vệ archive khỏi rủi ro

  • Tách khỏi hệ thống live

  • Read-only

  • Không cho script live ghi đè


7. Những sai lầm thường gặp

Sai lầm 1: Backup archive như live

  • Chạy backup hàng ngày

  • Tốn dung lượng

  • Không tăng an toàn


Sai lầm 2: Xem archive là “ít quan trọng”

  • Không test restore

  • Không có bản off-site

  • Khi cần thì file hỏng


Sai lầm 3: Trộn live và archive

  • Ransomware lan sang archive

  • Restore nhầm phiên bản


8. Liên hệ với mô hình backup tổng thể

Trong mô hình của mình:

  • Live data:

    • CMC

    • BV1

    • PRX

  • Archive data:

    • Website năm cũ

    • DB đã khóa

Desktop backup đóng vai trò:

  • Giữ live snapshot

  • Giữ archive dài hạn

  • Tách biệt rõ ràng


9. Gợi ý triển khai thực tế

  • Mỗi năm:

    • Đóng dữ liệu cũ → archive

    • Chuyển sang không gian lưu trữ riêng

  • Archive:

    • Không tham gia replication

    • Không nằm trong rsync HA


10. Kết luận

Phân biệt đúng dữ liệu live và archive giúp:

  • Backup nhẹ hơn

  • Restore nhanh hơn

  • Hạn chế rủi ro lan truyền

  • Vận hành ổn định lâu dài

Backup tốt không phải là backup nhiều, mà là backup đúng trạng thái dữ liệu.